📝 Zusammenfassung
openai-gpt-4o-mini
## HAUPTTHEMA
Das Video behandelt eine entdeckte Sicherheitslücke im KI-Tool Paperless AI, das mit Paperless NGX verbunden ist, und erklärt, wie diese behoben werden kann.
## KERNPUNKTE
• **Paperless AI**: Ein kostenloses, Open-Source-Tool zur KI-gestützten Dokumentenverarbeitung, das mit Paperless NGX verwendet werden kann.
• **Demonstration**: Die Funktionsweise von Paperless AI wird vorgestellt, indem ein Dokument in Echtzeit klassifiziert und bearbeitet wird.
• **Sicherheitslücke**: Die Anwendung versuchte, API-Token über ungesichertes HTTP zu übermitteln, was zu einem Datenleck führen könnte.
• **Risiko**: Jeder Server zwischen Paperless AI und der Paperless NGX-Instanz kann den Autorisierungstoken im Klartext abfangen.
• **Schnelle Lösung**: Der Entwickler wurde informiert, und eine neue Version zur Behebung der Sicherheitslücke wurde zeitnah veröffentlicht.
• **Update-Anleitung**: Eine einfache Schritt-für-Schritt-Anleitung zum Aktualisieren von Paperless AI wird gegeben, einschließlich der Regenerierung des API-Tokens in Paperless NGX.
## FAZIT/POSITION
Das Video hebt die Bedeutung von Sicherheitsmaßnahmen bei der Verwendung von KI-Tools hervor und lobt die schnelle Reaktion des Entwicklers auf die entdeckte Sicherheitslücke. Es wird empfohlen, stets sicherheitsbewusst zu handeln und Software regelmäßig zu aktualisieren.
Die meisten von euch werden mittlerweile Papayless NGX schon sehr gut kennen und einige von euch werden vielleicht sogar ein externes Tool nutzen, um Paperless NGX um ein paar KI Funktionen reicher zu machen. Dieses KI Tool nennt sich Paperless AI und es ist genau wie Paperless NGX auch open sourced und dementsprechend kostenlos und frei für jeden verfügbar. Ich habe in Paper das AI allerdings eine Sicherheitslücke entdeckt, die ich euch an diesem Video einmal vorstellen möchte und natürlich bekommt ihr am Ende des Videos auch eine kurze Anleitung, wie ihr diese Sicherheitslücke wieder beheben könnt. Los geht's. Und bevor wir uns die Sicherheitslücke anschauen, zeige ich euch erstmal ganz kurz dieses Tool. Ich wollte das Tool eigentlich sowieso vorstellen, das hat sich jetzt mit dieser Sicherheitslücke relativ gut überschnitten. Also, ich zeige euch erstmal dieses Tool. Das ist im Grunde wieder eine ja Web App in der ihr Paperless NGX anschließen könnt. Also ihr könnt euch mit eurer Paperless NGX Instanz verbinden und könnt dann eure Dokumente mit einer lokalen KI, ihr könnt auch Chat GBT nutzen, aber ihr könnt eben auch eine lokale KI nutzen, um eure Dokumente zu klassifizieren, zu taggen, um Dokumententitel zu vergeben und so weiter. Das Ganze könnt ihr in den Einstellungen eben einstellen, um zu sagen, okay, ich möchte bitte nur vorhandene Tags nutzen, ich möchte bitte nur die Titel angepasst haben und sonst nichts und natürlich auch noch mit einem Prompt das ganze feingular einstellbar machen. Wenn ihr euch für dieses Tool interessiert, schreibt das gerne mal in die Kommentare, dann kann ich dazu auch mal ein sehr ausführliches Video machen. Ich zeige euch das mal ganz kurz. Wir können z.B. hier ein Dokument, dass ich in Paperlist drin habe. Das ist jetzt hier vom Obi in Landsberg, wo ich für die Firma ein paar Sachen gekauft habe. Und wenn ich jetzt das Ganze von der KI eben zusammenfassen lassen möchte bzw. besseren Titel als das, was mir der Scanner hier ausgespuckt hat, dann muss ich hier in diesem Fall einfach nur ein KI Tag vergeben. Das habe ich so eingestellt, dass eben nur Dokumente mit diesem KI Tag verarbeitet werden von Paperless AI. Drück hier auf speichern, dann gehen wir zurück in Paperless AI. Normalerweise würde das jetzt regelmäßig passieren, aber ich möchte diesem Video keine halbe Stunde warten. Deswegen drücke ich hier auf Scan. Und ihr seht schon, es wird jetzt dieses Dokument verarbeitet. Das Ganze war jetzt wirklich in Echtzeit, wie lange das Ganze gedauert hat. Und wir können jetzt hier wieder auf unser Dokument gehen, können das einmal neu laden, wird er hier sagen, ja, es wurde bearbeitet, passt, möchte ich auch sehen. Ja, und jetzt hat er mir das hier zusammengefasst unter Kassenbaum. Natürlich war das jetzt nicht optimal. Das war jetzt auch bloß zum Testen. Wir könnten dem Prompt auch mitgeben, dass er das Dokument zusammenfassen soll und einen besseren Titel erstellen soll. Das ist jetzt alles nur noch Feinarbeit. Du soll es auch nur einen kurzen Einblick geben, was dieses Tool alles kann. Wir könnten uns jetzt hier auch noch Korrespondenten, Dokumententypen und so weiter alles vorschlagen lassen und von diesem Tool automatisiert ohne unser Zutun ja bearbeiten lassen. Außerdem auch sowas wie benutzerdfinierte Felder, dass er also automatisch erkennt, wie hoch der Rechnungsbetrag war und das Ganze hier in so ein Feld einträgt. Also wie gesagt, wenn euch das interessiert, schreibt das gerne mal in die Kommentare, dann kann ich dazu auch mal ein Video einplanen. Was ist jetzt aber das Problem an der Sache und warum sage ich, es gibt eine extreme Sicherheitslücke, die viele von euch betreffen könnte? Schauen wir uns mal an, wie das Ganze unter der Haube funktioniert und wie mir der Fehler überhaupt aufgefallen ist. Wir bieten für Firmenkunden ja auch ein Managed Hosting von Payerless NGX inklusive Telefonsupport an. Und genauso ein Kunde, der hatte bei uns in unserer paperless Cloud.com eben eine Paperless Instanz und in dieser Paperless Instanz, die wollte er eben mit seiner eigenen Paperless AI Instanz verknüpfen. Also, der hatte bei sich in der Praxis einen Mac Mini mit einem LM und Olama installiert. Das heißt, da lief sein lokales LM. Er hatte außerdem Paperless AI installiert. Paperless AI greift jetzt auf sein Mac Mini auf die Olama Instanz zu, um das KI Modell zu betreiben. Und über eine andere Verbindung greift er über HTTPS auf die Paperless Instanz bei uns in der Paperless Cloud zu. Soweit so gut. Und wir haben in der Paperless Cloud einige Sicherheitsfeatures eingeführt. Z.B. erlauben wir ausschließlich https Traffic zu unseren Instanzen und kein HTTP. Außer für den Fall, dass Zertifikate aktualisiert werden müssen, dann muss natürlich HTTP auch zugelassen werden. Und natürlich könnten wir jetzt sagen, wir leiten HTTP automatisch auf https um. Das ist eine Möglichkeit, das machen viele. Haben wir bewusst nicht gemacht, weil wir wollten, dass in dem Fall eben ein Fehler auftritt, wenn das passiert. Und genauso war es, obwohl wir hier in der Paper das AI Instanz bei unserem Kunden die https, also die TLS verschlüsselte Verbindung zu PapX konfiguriert hatten. Also wir hatten wirklich https und dann die Adresse von seiner Instanz eingegeben. Trotzdem hat Paperless AI versucht in manchen Fällen die API über HTTP aufzurufen. Und um euch zu zeigen, dass das Ganze wirklich ein Problem ist, habe ich das Ganze nachgestellt mit einer Testinstanz, genau wie bei unserem Kunden auch und habe mit Wireshark übrigens auch kostenlos in Open Source einen Mitschnitt von diesem Netzwerkverkehr erstellt, um euch zu zeigen, wo das Problem ist. Also, ich habe euch hier schon mal einiges rausgefiltert, damit es einfacher wird nachzuvollziehen. Was wir hier am Anfang sehen, das ist völlig harmlos. Das sind einfach ähm die Verbindungsanfänge von unserer TCP Verbindung von Paperless AI zu unserem Paperless Server. Und was wir jetzt hier sehen, das ist ein Problem. Da sehen wir jetzt, dass Paperless AI versucht alle möglichen Tags von Paperless NGX auszulesen. Ja, ganz klar, diese Tags braucht auch, um zu funktionieren. Und wenn wir jetzt hier schon mal reinschauen, dann sehen wir, aha, das Ganze funktioniert über HTTP und nicht über https. Also, wir können hier direkt mitlesen. Schauen wir doch mal rein, was da interessantes drin steht. Die Header hier oben sind gar nicht so interessant. Das Interessante kommt hier unten. Da sieht man nämlich hier im HTCP einmal unseren Getre. Das ist nicht schlimm, das gehört sich so. Aber das Problem ist, es wird hier der Authorization Token mitgeschickt über HTTP, also der Token so eine Art Passwort, um auf die API zugreifen zu können. Es wird hier also im Klartext ohne jegliche Verschlüsselung euer API Passwort ich jetzt mal ins Internet geschickt und damit auf eure Paper NGX Instanz zugegriffen. Und wo ist das Problem an der Sache? Das Problem ist, dass jeder Server im Internet, der zwischen euch und eure Payless Instanz liegt, also ich zeige euch das noch mal hier kurz, jeder Server, der zwischen eurer Paperless AI und eurer Paperless NGX Instanz liegt und dieses Paket z.B. weiterleitet, der bekommt dieses Paket auch in Klartext zu sehen. Das heißt, jeder Server, der irgendwo dieses Paket weiterleitet, kann euren Authorization Token lesen und mit diesem Token mit eurer Pay NGX Instanz alles machen, was euer Benutzer eben auch kann. Das ist eine wirklich kritische Situation. Deswegen habe ich den Entwickler auch angeschrieben, habe das Ganze erklärt. Er hat innerhalb von nur einem einzigen Tag dieses Problem gelöst und eine aktualisierte Version auf GitHub zur Verfügung gestellt. Ja, und wie kriegt ihr das Problem jetzt gelöst? Das ist tatsächlich relativ einfach. Ihr müsst einfach nur auf die derzeit verfügbare aktuellste Version von Paperless AI updaten. Wenn ihr das Ganze über Docker Compose gemacht habt, dann ist es tatsächlich sehr sehr einfach. Ihr wechselt einfach im Terminal auf den Ordner, in dem eure Papless AI dockercompose. liegt. Das seht ihr z.B. hier. Bei mir ist das hier die Dockercompos. Dann müsst ihr einfach nur sudo Docker Compose Pull ausführen. Je nachdem was für Docker Compost Version ihr habt, muss da zwischen Docker und Compost auch ein Minus. Manfall ist das schon die neueste, da ist das nicht mehr nötig. Und jetzt seht ihr hier, das wurde ja heruntergeladen. In dem Fall hatte ich das Ganze schon. Und jetzt müsst ihr einfach nur die neueste Version von Paperless AI auch starten und das funktioniert mit sudocker Bose ab - D und dann minus minus Force- Recreate. Das war's ausführen. Und jetzt zieht sich automatisch euer Docker Stack die neueste Version von Paper das AI und dieses Problem ist gelöst. Was tatsächlich super wichtig ist, ist, dass ihr auch in Paper des NGX euren API Token regeneriert. Dazu geht ihr einfach in Paperless NGX auf euer Profil und ihr regeneriert dann hier über diesen Button einen neuen API Token und fügt den dann in Paperless AI ein. An dieser Stelle also danke an Entwickler für den schnellen Fix und auf der anderen Seite bin ich auch froh es gefunden zu haben, denn das ist natürlich eine Sicherheitslücke, wenn euer API Token von Paper NGX geliegt wird. Das ist schon ein großes Problem. Wenn du noch weitere Fragen zu dem Thema hast, dann schreib es gerne einmal unten in die Kommentare rein. Und außerdem, wenn ihr für eure Firma jemanden sucht, der für euch Payerless NGX hostet und betreut und auch Telefon Support bietet, dann schreibt mir gerne unter hello@pay-cloud.com, dann können wir euch sehr gerne weiterhelfen. Alle Tarife dazu findet ihr natürlich wie immer unter paperb-cloud.com. Ich sage an dieser Stelle herzlichen Dank fürs Zuschauen. Bis zum nächsten Mal. Ciao.