Archiv des Autors: Ulf Tschech

KI – Datenmodell und Ergebnis

Ich habe einen Prompt verwendet:

„Generiere ein Gemälde im Stil von Franz Marc, das den Tod zeigt, der im Sessel sitzt und eine Irokesenfrisur trägt, während er Geige spielt. Betone die lebendigen Farben und die expressive Darstellung des Todes, um eine ungewöhnliche und faszinierende Szene zu erschaffen, die Marc’s einzigartigen Stil widerspiegelt.“

bzw. in Englisch:

„Generate a painting in the style of Franz Marc depicting Death seated in a chair, sporting a Mohawk hairstyle, while playing the violin. Emphasize the vibrant colors and expressive portrayal of Death to create an unusual and captivating scene that reflects Marc’s unique style.“

Mit diesem Prompt habe ich ich nun verschiedene Datenmodelle generativer Bild-KI gefüttert. Die Resultate sind erstaunlich verschieden.

Stable Diffusion XL
Dyna Vision XL
Realistic Vision 5.1
Copax Timeless XL v. 5
Think Diffusion XL

Der Tod als Motiv mit der besonderen Frisur ist jedesmal ziemlich gut getroffen. Das Geigenspiel dagegen scheint ein ziemlich großes Problem darzustellen. Malstil und Farben nach Franz Marc passen sehr gut.

Sehr cool – Beelitz-Heilstätten

Mit dem Auto über Land (und nicht über die Autobahn) kommt man nach etwa zwei Stunden in Beelitz-Heilstätten an. Mit 3 Euro Tagespreis sind die Parkgebühren moderat. Was sich dann eröffnet ist ein beeindruckendes Zeugnis deutscher Sozialgesetzgebung zu Beginn des 20. Jahrhunderts.

Ehemalige Chirurgie

Die Landesversicherungsanstalt Berlin ließ vor den Toren der Reichshauptstadt inmitten von Wäldern eine großzügige Anlage mit modernster Technik und Baukunst errichten. Vom Baumwipfelpfad aus erahnt man die Ausmaße des Geländes.

Anschließend hatten wir noch die Keller- und Techniktour gebucht. Bereits seit 1903 versorgte das redundant ausgelegte Kraftwerk den Komplex auf der Basis einer Kraft-Wärme-Kopplung mit Elektroenergie und Wärme. Die Versorgungstrassen verlaufen unter der Erde entlang der Hauptwege.

Es gibt auf dem besuchbaren Teil des Geländes unheimlich viel zu entdecken. Plant also entsprechend viel Zeit ein.

Datenschutztag

Seit 1981 begehen wir den Europäischen Datenschutztag am 28. Januar. Warum? Am 28. Januar 1981 beschloss der Europarat das Übereinkommen Nr. 108 „zum Schutz des Menschen bei der automatischen Verarbeitung personenbezogener Daten“. Ziel war und ist es immer noch, die Grundrechte Betroffener bei automatisierter Verarbeitung personenbezogener Daten zu sichern und zu stärken.

Aktuell sehe ich drei große Probleme, vor denen der Datenschutz steht.

Problem 1: Informationelle Selbstbestimmung

Das Abwägen zwischen Bequemlichkeit und den Schutz eigener Daten, der eigenen digitalen Identität führt leider zu oft zu Entscheidungen in Richtung Bequemlichkeit. Cookies ablehnen ist leider immer noch zu häufig aufwendiger, als sie einfach nur schnell zu akzeptieren. Der Einsatz nicht datenschutzgerechter Werkzeuge ist allgemein anerkannt, auch wenn es sehr wohl datenschutzgerechte Lösungen gäbe. Die Hemmschwelle, auf Social-Media-Plattformen auch jedes noch so intime Detail zu posten, ist ungebremst niedrig. Und Bildung tut immer noch zu wenig, um Kompetenzen zur informationellen Selbstbestimmung bei Jugendlichen (und auch schon bei Kindern) zu stärken.

Problem 2: Unsere Daten sind unsicher

Immer noch gelingt es zu oft Kriminellen, an personenbezogene Daten zu gelangen. Der IT-Governance-Blog geht von über 8 Mrd. geleakten Datensätzen alleine 2023 aus. Hier werden zu sehr die Betroffen in die Pflicht genommen. Doch wo bleiben die Pflichten der Verantwortlichen, personenbezogene Daten vor Angriffen zu schützen?

Problem 3: KI

Bei aller Begeisterung für generative KI muss die Frage nach dem Schutz von Privatsphäre gestellt werden. Welche Daten werden als Trainingsdaten verwendet? Wie trainiert mein eigenes Nutzerverhalten eine KI und wie stehen die so gewonnenen Daten der Allgemeinheit zur Verfügung?

Erste HoloBox im Test

Jetzt wird es ganz verrückt. Die britische Universität Loughborough testet als erste in europäische Universität HoloBoxen der US-amerikanischen Firma Proto.

Was tut eine Holobox? Die großen Modelle haben etwa die Größe einer Telefonzelle (Das war früher eine Box mit einer Grundfläche von etwa 1 x 1 m und einem Telefonapparat zum Telefonieren.)

Über Displays wird in der Box eine Person in 3D dargestellt, kann sich in der Box bewegen, diese aber nicht verlassen. Der 3D-Effekt wird aus einem 2D-Videostream berechnet und Schatten werden eingefügt. Dabei könnten auch Beautyfilter u. a. Konzepte zum Einsatz kommen. Es handelt sich also nicht um ein echtes Hologramm als dreidimensionale Pixelwolke. Der 3D-Effekt wird nur vorgegaukelt. Die Kosten der Holoboxen sollen bei 40.000 bis 50.000 US-Dollar liegen. Vorgestellt wurden sie z. B. auf der CES in Las Vegas.

Wo liegen die Vorteile? Eine Person in 3D zu sehen, ist eine neue Qualität gegenüber einem 2D-Bild aus einem Videomeeting. Reisekosten können so reduziert werden. Dozenten können so leichter überzeugt werden, Lehrveranstaltungen durchzuführen. Fachleute, die sonst den Aufwand scheuen würden, an einen bestimmten Ort zu reisen, werden mit all ihrer Mimik, Gestik und mit ihren Bewegungen sehr realitätsnah an ferne Orte übertragen.

WhatsApp und kein Ende

Datenschutzrechtlich hängt das Thema „WhatsApp“ immer noch in der Luft. Nun hat der Bundesbeauftragte für den Datenschutz und die Informationsfreiheit Prof. Ulrich Kelber die irische Datenschutzbehörde aufgefordert, endlich alle im Verfahren noch offnen Fragen einer Klärung zuzuführen.

Hauptkritikpunkt ist die „erzwungene“ Einwilligung in die geänderten Nutzungsbedingungen.

Ich bin froh, dass ich mich rechtzeitig von WhatsApp verabschiedet habe.

Wie nutzen wir KI global betrachtet?

Antwort auf diese Frage kann beispielsweise die KI-Industrieanalyse geben. Hier die wichtigsten Erkenntnisse zusammengefasst.

ChatGPT ist das mit Abstand am häufigsten genutzte KI-Tool, gefolgt von Character.AI und Bard.

Quelle: https://writerbuddy-wp.s3.amazonaws.com/writer-buddy/20231113110759/50-most-visited-AI-tools-2023-by-writerbuddy.ai-1.png

Nach Mai 2023 sind die Zugriffe leicht gesunken. Ich glaube nicht an eine Übersättigung. Gründe können eher nationalstaatliche Regulierungen sein.

Bildgeneratoren gehören dabei zu denjenigen Tools mit den größten Nutzerverlusten.

Deutschland ist auf Platz 8 bei den Nutzerzugriffen. Die Liste wird von den USA, Indien und Indonesien angeführt.

Quelle: https://writerbuddy-wp.s3.amazonaws.com/writer-buddy/20231130064445/Top-20-Countries-With-the-Most-AI-Users-1024×985-1.png

Fast zwei Drittel aller KI-Nutzer weltweit greifen mit mobilen Endgeräten auf KI-Tools zu.

Etwas mehr als zwei Drittel aller Nutzer sind männlich.

Mein Fazit: Wir stehen immer noch am Beginn einer spannenden und revolutionären Entwicklung. Die Frage steht im Raum, wie man diese Entwicklung regulatorisch begleiten sollte. Chatbots und Bildgeneratoren werden bald zu den „alten“ Eisen gehören und neue Anwendungen treten in den Fokus.

KI wird immer leistungsfähiger

An generative KI haben wir uns inzwischen gewöhnt. Wir lassen uns Texte und Bilder erstellen, Videos erzeugen und Musik generieren. Doch jetzt geht KI noch einen Schritt weiter.

Forschende an der Eidgenössischen Technischen Hochschule stellen eine KI vor, die plant, vorausschaut und feinmotorisch sehr gut drauf ist.

Eine Kombination aus KI und Roboter lernt, mit einem Geschicklichkeitsspiel umzugehen. Und das tut sie besser, als jeder Mensch. Dabei muss eine Kugel durch ein Labyrinth von einem Startpunkt zum Ziel bewegt werden, ohne in die Löcher auf dem Weg zu fallen.

Wie Menschen lernt die KI durch Erfahrung, wird mit jeder Runde besser und erkennt zunehmend Abkürzungen.

Der EU-AI-Act

Seit 2021 ringt der europäische Gesetzgeber um einen Entwurf für ein KI regulierendes Gesetz. Nun liegt ein finaler Vorschlag auf dem Tisch (Vorschlag, Anlagen).

Mit getimg.ai erzeugt

Am 8. Dezember diesen Jahres hat man sich nun auf einen sehr umfassenden, vielleicht den umfassendsten Text überhaupt zu diesem Thema, geeinigt.

Die vorgesehenen Auflagen und Einschränkungen orientieren sich an Risikoklassen. Als hochriskant werden beispielsweise KI eingestuft, die Entscheidungen mit Auswirkungen für Menschen treffen (Bewerberanalysen, Antragsprüfungen…). Hier muss der Nachweis erbracht werden, dass die verwendeten Trainingsdaten nicht zu Nachteilen führen. Gesichtserkennung in öffentlichen Bereichen wird zwar verboten. Allerdings wurden gerade in diesem sensiblen Bereich viele Ausnahmen aufgenommen (Strafverfolgung bzw. Strafvereitelung bei Mord, Entführung, Terrorismus).

Der endgültige Text liegt noch nicht vor. Welche Fassung genau verabschiedet wird, bleibt abzuwarten. Der Vorstoß der EU in Richtung einer Regulierung ist trotzdem richtungsweisend.

Prompts sind einfach? – In dieser Woche (KW 49)

Generative KI werden über Prompts angesprochen. Das klingt zunächst einfach. Ist es auch, solange man in der Welt der Sprache bleibt. ChatGPT kann super mit Alltagssprache angesprochen werden. Für einfache Themen ist das allemal ausreichend. Komplexere Aufgaben erfordern dann schon etwas mehr Aufwand und Sprachverständnis.

Anders verhält es sich jedoch mit generativer Bild-KI. Hier habe ich bemerkt, dass die Qualität der Ergebnisse sehr deutlich von den verwendeten Prompts abhängt. Hinzu kommt, dass, so mein Eindruck, die Verwendung der englischen Sprache die Ergebnisse noch einmal verbessert.

Ich möchte meine Erfahrungen an einem einfachen Beispiel zeigen. Für eine Weihnachtskarte benötige ich ein Bild. Das soll mir eine generative Bild-KI erzeugen. Meine Beispielbilder sind jeweils die besten von mir ausgesuchten Ergebnisse.

Version 1: Ein einfacher Prompt in deutscher Sprache.

Ein prächtig geschmückter Weihnachtsbaum in einem Winterwald bei Mondschein.

Prompt in Umgangssprache Deutsch
Version 1

Version 2: ChatGPT erzeugt mit einen Prompt.

Erstelle mir einen Prompt für eine generative Bild-KI. Mit dem Prompt soll ein prächtig geschmückter Weihnachtsbaum in einem Winterwald bei Mondschein erzeugt werden.

Prompt zum Erstellen eines Prompts in ChatGPT

Generiere ein beeindruckendes Bild eines prächtig geschmückten Weihnachtsbaums, der in einem zauberhaften Winterwald steht, erleuchtet von sanftem Mondschein. Lass die winterliche Atmosphäre und die festliche Stimmung im Bild lebendig werden.

Prompt-Vorschlag von ChatGPT
Version 2

Version 3: Übersetzung des von ChatGPT erzeugten Prompts in Englisch

Generate an impressive image of a magnificently decorated Christmas tree standing in a magical winter forest, illuminated by soft moonlight. Bring the wintry atmosphere and festive mood to life in the picture.

Übersetzung mit DeepL

Mein Fazit

In meiner Konstellation von Tools komme ich zu den besten Ergebnissen, wenn ich ChatGPT den Bild-Prompt erstellen lasse und den dann ins Englische übersetzen lasse (ich hatte in der Schule Französisch…).