Was ist Generative AI? – Generative KI Erklärt inkl. Bedeutung, Modelle und Beispiele

Verstehe die generativen KI-Modelle und was sie sind, ihre Grenzen, aber auch Einsatzmöglichkeiten

By Benjamin Talin Last updated 12. Juli 2023

Erkunde die Welt der generativen KI: ihre Bedeutung, Modelle, Anwendungen, Ethik, Grenzen und ihr zukünftiges Potenzial in diesem umfassenden Leitfaden.

Index

Einführung in die Künstliche Intelligenz (KI)

Künstliche Intelligenz (kurz KI bzw. Englisch für Artificial Intelligence – AI) ist derzeit in aller Munde – ob in den Nachrichten, auf LinkedIn oder sogar in der Kneipe, jeder hat eine Meinung oder eine Vorhersage. Viele sagen voraus (oder hoffen zumindest darauf), dass sie die Art und Weise, wie wir leben, arbeiten und miteinander umgehen, revolutionieren wird. Aber was ist das genau und warum gibt es derzeit so einen Hype?

Im Grunde ist KI ein weit gefasster Begriff, der sich auf Maschinen oder Software bezieht. Das Ziel ist es, die menschliche Intelligenz zu imitieren und zu lernen, zu denken, wahrzunehmen, zu argumentieren, zu kommunizieren und Entscheidungen zu treffen wie ein Mensch. Diese sich entwickelnde Technologie kann in drei Kategorien unterteilt werden: Enge KI (Narrow AI), die für eine bestimmte Aufgabe wie Spracherkennung entwickelt wurde; Allgemeine KI (General AI), die jede intellektuelle Aufgabe ausführen kann, die auch ein Mensch erledigen kann; und Superintelligente KI (Superintelligent AI), die die menschlichen Fähigkeiten bei den meisten wirtschaftlich wertvollen Arbeiten übertrifft.

Innerhalb dieses breiten Rahmens, den die Definition von KI umfasst, gibt es derzeit in den Medien eine spezielle Untergruppe. Die so genannte generative KI, die täuschend ähnliche Texte, Bilder und andere Inhalte erzeugen kann. In diesem Artikel geht es darum, was generative KI ist, was sie bedeutet und welche bemerkenswerten Beispiele ihr Potenzial zeigen.

Was ist Generative AI?

Wie bereits erwähnt, fällt Generative AI (zu Deutsch: Generative Künstliche Intelligenz) unter den Oberbegriff der künstlichen Intelligenz, hat sich aber eine eigene Nische geschaffen. Es handelt sich um eine Reihe von trainierten KI-Modellen und -Techniken, die statistische Methoden nutzen, um Inhalte auf der Grundlage von Wahrscheinlichkeiten zu produzieren. Diese Arten von KI-Systemen lernen, die Daten, auf die sie trainiert wurden, zu imitieren (wichtig – imitieren, nicht verstehen und anwenden) und produzieren dann ähnliche Inhalte (also keine Fakten). Im Gegensatz zur diskriminierenden KI, die Eingaben in vordefinierte Kategorien einteilt (z. B. Spamfilter), erzeugt die generative KI neue, synthetische Daten, die die Trainingsdaten widerspiegeln.

Die Grundlage von Generative AI sind Techniken des maschinellen Lernens und insbesondere des Deep Learning. Beim maschinellen Lernen kommen Algorithmen zum Einsatz, die aus Daten lernen und diese nutzen, um Entscheidungen oder Vorhersagen zu treffen. Deep Learning, ein Teilbereich des maschinellen Lernens, verwendet sogenannte neuronale Netze mit mehreren Schichten. Jede Schicht stellt so etwas wie eine Synapse in einem Gehirn dar – die mit einer bestimmten Wahrscheinlichkeit ausgelöst wird. Wenn also ein Wort wie „Great“ auftaucht, gibt es verschiedene Synapsen (Knoten), die dann mit einer bestimmten Wahrscheinlichkeit sagen, dass „Britain“ oder „Wall“ nach „Great“ kommen könnte. Je mehr Kontext gegeben ist, desto mehr werden diese Knoten trainiert. Wenn London, die Königin und der Union Jack irgendwo auftauchen, dann ist es sehr wahrscheinlich, dass es „Great Britain“ und nicht „Great Wall“ heißt.

Generative Modelle verwenden verschiedene Klassen von statistischen Modellen (oft neuronale Netze). Im derzeit bekanntesten Beispiel ChatGPT wird eine Encoder/Decoder-Architektur verwendet. Die Eingaben werden von einem Encoder-Netzwerk analysiert und klassifiziert, in computerlesbare Zahlen und Variablen umgewandelt, durch das trainierte neuronale Netzwerk geschickt und das Ergebnis der Zahlen und Variablen wird als Text an einen Decoder zurückgegeben.

Eine einfache Erklärung der generativen KI: Der vom Nutzer eingegebene Text wird zerlegt, die Maschine versucht, ihn zu verstehen, das Netzwerk versucht dann, auf der Grundlage der Informationen die bestmögliche Antwort zu generieren und sie wieder für den Menschen lesbar zu machen, die Ergebnisse werden wieder in Sprache umgewandelt und ausgegeben. Daher basiert alles nur auf Wahrscheinlichkeiten und so kommt es auch dazu, dass falsche Aussagen gemacht werden, weil diese in diesem Fall „wahrscheinlicher“ waren als die Fakten.

Der Hype in den Medien und in den sozialen Medien um diese Technologie beruht wahrscheinlich darauf, dass diese Modelle sehr gut darin sind, überzeugende und täuschend echte Inhalte zu erzeugen und uns so an Intelligenz glauben zu lassen. Trotzdem gibt es für generative KI-Modelle auch andere Anwendungen als die Erzeugung von Bildern und Texten. Beispiele dafür sind die Datenerweiterung, die Erkennung von Anomalien und die Imputation fehlender Daten oder die Klassifizierung von Inhalten.

Wie Generative AI funktioniert – 3 Modelle erklärt

Die Fortschritte in der KI waren in letzter Zeit enorm, da die Rechenleistung billig genug geworden ist, um große Datensätze zu „vernünftigen Kosten“ zu verarbeiten, und damit die Grundlage dafür geschaffen wurde, dass verschiedene Modelle in ausreichender Größe trainiert werden können, um vernünftige Ergebnisse zu erzielen.

Dies sind die drei wichtigsten Modelle der generativen KI, jedes mit seinen Stärken, Schwächen und möglichen Anwendungsfällen:

Generative Adversarial Networks (GANs)

GANs bestehen im Wesentlichen aus zwei neuronalen Netzen – dem Generator und dem Diskriminator – die miteinander konkurrieren, während das eine eine neue Ausgabe erzeugen muss und das andere die Ausgabe kontrolliert. Es funktioniert nach einem ähnlichen Prinzip wie ein Fälscher, der versucht, gefälschtes Geld herzustellen, und ein Detektiv, der versucht, die Fälschung von der echten Sache zu unterscheiden.

Das Generator-Netzwerk erzeugt zunächst ein Muster/Ausgangssignal und leitet es an den Diskriminator weiter. Der Diskriminator ist anfangs nicht sehr gut in der Unterscheidung und könnte die Fälschung als echt einstufen. Beide Netzwerke müssen also trainiert werden, um effizient zu sein. Da beide aber auch aus ihren Fehlern lernen, wird ihre Leistung mit der Zeit immer besser (deshalb müssen KI-Modelle trainiert werden).

Das Ziel des Generators ist es, Daten und Ausgaben zu erzeugen, die der Diskriminator nicht von echten Daten unterscheiden kann. Gleichzeitig versucht der Diskriminator, die echten Daten immer besser von den gefälschten Daten unterscheiden zu können. Das geht so lange, bis ein Gleichgewicht erreicht ist, bei dem der Generator realistische Daten produziert und der Diskriminator nicht mehr unterscheiden kann und zu 50 % unsicher ist, ob es sich um gefälschte oder echte Daten handelt.

Variationale Autoencoder (VAEs).

VAEs stützen sich ausschließlich auf die Prinzipien der Wahrscheinlichkeit und Statistik, um synthetische Daten zu erzeugen. Diese Modelle erzeugen Daten auf der Grundlage verschiedener einfacher mathematischer Strukturen wie Mittelwert oder Standardabweichung.

VAEs bestehen aus einem Encoder und einem Decoder (wie oben kurz erklärt). Der Encoder komprimiert die Eingabedaten in eine sogenannte „latente Raumdarstellung“, die die Parameter der Statistik auf der Grundlage der Wahrscheinlichkeitsverteilung (Mittelwert und Varianz) erfasst. Anschließend erzeugt er eine Stichprobe aus der gelernten Verteilung im latenten Raum, die das Decoder-Netzwerk nimmt und die ursprünglichen Eingabedaten rekonstruiert. Das Modell wird so trainiert, dass die Differenz zwischen Eingabe und Ausgabe minimiert wird, so dass die erzeugten Daten den Originaldaten sehr ähnlich sind, da sie in beiden Richtungen die gleichen trainierten Netzwerke und Wahrscheinlichkeiten durchlaufen.

Transformator-basierte Modelle

Im Gegensatz zu GANs und VAEs werden transformatorbasierte Modelle wie GPT-3 und GPT-4 vor allem für Aufgaben eingesetzt, bei denen es um Sequenzdaten geht, d. h. um Daten, die eine bestimmte Semantik oder Korrelationen zueinander aufweisen, wie z. B. bei der Verarbeitung natürlicher Sprache.

Transformer-basierte Modelle verwenden eine Architektur, die auf „Aufmerksamkeitsmechanismen“ basiert, die bestimmten Teilen der Eingabedaten während der Aufgabenausführung eine höhere Bedeutung zuweisen, um die Bedeutung einer Aussage zu extrahieren und zu gewichten.

GPT-Modelle verwenden eine Variante des Transformers, den so genannten Transformator-Decoder, der eine ganze Sequenz von Daten (z. B. einen Satz) auf einmal liest und so komplexe Abhängigkeiten zwischen Wörtern in einem Satz modellieren oder herausfinden kann. Die Modelle werden an sehr großen Textmodellen trainiert und dann für bestimmte Aufgaben wie Übersetzung, Beantwortung von Fragen oder Texterzeugung feinabgestimmt. Die leistungsfähigen Sprachmodelle, die sie erstellen, können erstaunlich kohärente und kontextbezogene Sätze, Absätze oder sogar ganze Artikel produzieren, haben aber immer noch das Problem, dass sie, wie die anderen Modelle, nur auf Wahrscheinlichkeiten basieren und deshalb auch „haluzinieren“ oder Inhalte erfinden, weil sie „wahrscheinlich“, aber falsch sind.

Anwendungsbeispiele für generative KI-Modelle

Jetzt, wo wir die Grundlagen der Systeme verstehen und auch langsam begreifen, wo die Grenzen liegen, aber auch wie sie funktionieren, können wir auch gleich darüber reden, wie wir diese Modelle anwenden können. Generell kann man sagen, dass die aktuelle Welle der Generative AI auf Anwendungen beschränkt ist, bei denen entweder eine gute Vervielfältigung notwendig ist (GAN-Modelle) oder bei denen man Ergebnisse benötigt, die „wahrscheinlich etwas sind“, wie z. B. die Umschreibung von Sprache oder die Generierung von Text. Einige der hier genannten Anwendungsfälle sollen dir einen Überblick über die Möglichkeiten geben:

Kreative Künste und Design

Generative KI hat zahlreiche Anwendungen in Kunst und Design gefunden und verändert die Art und Weise, wie wir Kunst schaffen und erleben. Dall-E, Midjourney und viele andere Bildgeneratoren haben gezeigt, dass es möglich ist, realistische und überzeugende Kunst zu schaffen.

Vor allem GANs haben in diesem Bereich eine wichtige Rolle gespielt. So wurde z. B. ein KI-generiertes Porträt, das vom Kunstkollektiv Obvious mit Hilfe eines GANs erstellt wurde, beim Auktionshaus Christie’s für stolze 432.500 $ verkauft.

Musikkomposition und -erzeugung: Generative KI-Modelle werden auch für die Komposition von Musik eingesetzt. Noch vor wenigen Jahren war es undenkbar, dass etwas so Komplexes und Kreatives wie Musik von einer Maschine erzeugt werden könnte. Netzwerke wie MusicLM von Google oder MuseNet von OpenAI sind Modelle, die auf MIDI-Dateien aus verschiedenen Genres und Quellen trainiert wurden und Kompositionen in vielen verschiedenen Stilen erzeugen können.
Kunst in verschiedene Stile übersetzen: KI kann nicht nur neue Stücke erschaffen, sondern auch bestehende transformieren. KI-Modelle können die Stilelemente eines Bildes lernen und sie auf ein anderes anwenden – eine Technik, die als neuronaler Stiltransfer bekannt ist. Das Ergebnis ist ein hybrides Bild, das den Inhalt eines Bildes mit dem künstlerischen Stil eines anderen kombiniert.

Natürliche Sprachverarbeitung (NLP).

Generative KI spielt eine Schlüsselrolle bei NLP-Aufgaben, z. B. bei der Erstellung von Inhalten, Dialogsystemen, Übersetzungen, aber auch bei der Erstellung virtueller Assistenten.

Text- und Inhaltserstellung: Modelle wie GPT-3 und GPT-4 haben viel zum aktuellen Hype beigetragen. Ihre bemerkenswerten Fähigkeiten, menschenähnliche Texte zu erstellen, haben die Fantasie beflügelt. Diese Modelle können Artikel schreiben, Gedichte verfassen, Code schreiben oder verbessern. Das macht sie zu wertvollen Werkzeugen für die automatisierte Erstellung von Inhalten und nimmt uns Arbeit ab – allerdings mit dem Problem, dass die Inhalte nicht immer genau sind und sich alle ungefähr gleich anhören.
Dialogsysteme und virtuelle Assistenten: Durch das Verstehen von Sprache, aber auch durch die gezielte Generierung von Inhalten, haben generative Modelle auch das Potenzial, einen Dialog zwischen Mensch und Maschine zu ermöglichen. Sie können kontextbezogene Antworten generieren und menschenähnliche Unterhaltungen führen. Diese Fähigkeit erhöht die Effektivität von virtuellen Assistenten, Chatbots und KI im Kundenservice und in vielen anderen Bereichen.
Transkription und Spracherweiterung: Ein weiterer weithin bekannter Anwendungsfall sind Sprachmodelle, die Inhalte aus Sprache erstellen. Die Herausforderung besteht darin, dass diese Modelle den Kontext verstehen müssen, um eine schlechte Mikrofonqualität oder Geräusche im Raum auszugleichen. Auf diese Weise erzeugt generative KI scharfe und klare Ergebnisse und schafft auch viel bessere Transkriptionen von Videos und Audioinhalten.

Computer Vision & Bildsynthese

Generative KI hat einen großen Einfluss auf Computer Vision Aufgaben, da neuronale Netze auch Objekte erkennen oder trügerische Nachbildungen erstellen.

Bildsynthese: GANs werden häufig eingesetzt, um realistische synthetische Bilder zu erzeugen. NVIDIAs StyleGAN zum Beispiel hat unglaublich lebensechte Bilder von menschlichen Gesichtern erzeugt, die es gar nicht gibt. Oder andere KIs, die filmische Inhalte erzeugen, ohne dass dafür professionelle Kameras benötigt werden. Aber auch Deep Fakes, computergenerierte Fake-Versionen von Menschen, können Teil dieser Bildsynthese sein.
Bildverbesserung: Generative Modelle können auch fehlende Teile eines Bildes in einem Prozess namens Inpainting ausfüllen. Sie sagen die fehlenden Teile anhand des Kontexts der umgebenden Pixel voraus. Photoshop AI wurde dadurch zu einem Social Media Hit, weil es Bilder mit Inhalten ergänzte, die nicht existierten. Auch Google machte Schlagzeilen mit dem „Magic Eraser“, der ebenfalls Generative KI nutzt, um Personen oder Objekte mit einer „höchstwahrscheinlichen“ Füllung aus Bildern zu löschen.

Medikamentenentwicklung und Gesundheitswesen

Generative KI hat ein vielversprechendes Potenzial für das Gesundheitswesen und die Medikamentenentwicklung, da sie auch verschiedene Strukturen oder Verbindungen vorhersagen oder „erfinden“ kann.

Entdeckung neuer Medikamente/Moleküle: Generative Modelle können molekulare Strukturen für potenzielle Medikamente vorhersagen und so den Prozess der Medikamentenentwicklung beschleunigen. Verschiedene Unternehmen versuchen seit Jahren, mithilfe von KI-Modellen neue molekulare Verbindungen zu erfinden und daraus Medikamente zur Behandlung von Krankheiten zu entwickeln.
Personalisierte Medizin: Generative Modelle können auch dabei helfen, medizinische Behandlungen zu personalisieren. Durch das Lernen von Mustern aus Patientendaten können diese Modelle dabei helfen, die effektivste Behandlung für einzelne Patienten zu finden.

Beispiele für Generative AI

GPT-4 von OpenAI: Dieses transformatorbasierte Modell ist ein leistungsstarker Sprachgenerator, der E-Mails verfassen, Code schreiben, schriftliche Inhalte erstellen, Nachhilfe geben und übersetzen kann.
DeepArt: Diese App, auch bekannt als Prisma, nutzt generative Modelle, um von Nutzern hochgeladene Fotos in Kunstwerke zu verwandeln, die von berühmten Künstlern inspiriert wurden.
MidJourney: Ist ein Text-zu-Bild Generator welche Bilder und Grafiken anhand von Benutzereingaben erstellt.
DeepDream von Google: Ein Programm, das mithilfe von künstlicher Intelligenz Muster in Bildern findet und verbessert und so traumähnliche, psychedelische Verwandlungen erzeugt.
Jukin Composer: Dieses Tool, das auf dem MuseNet von OpenAI basiert, nutzt KI, um originelle Musik für Videoinhalte zu komponieren.
Insilico Medicine: Ein Biotech-Unternehmen, das generative Modelle nutzt, um Molekularstrukturen für potenzielle Medikamente vorherzusagen und so den Prozess der Medikamentenentwicklung zu beschleunigen.
ChatGPT: Ein von OpenAI entwickelter KI-gestützter Chatbot, der menschenähnliche Textkonversationen führen kann und im Kundenservice und bei persönlichen Assistenten eingesetzt wird.
NVIDIAs StyleGAN: Ein Generatives Adversariales Netzwerk, das hyperrealistische Bilder von menschlichen Gesichtern erzeugt, die es in der Realität nicht gibt.
Artbreeder: Eine Plattform, die GANs verwendet, um vom Benutzer eingegebene Bilder zu komplexen und neuartigen Bildern wie Porträts und Landschaften zusammenzufügen.
Runway ML: Dieses kreative Toolkit nutzt generative Modelle, um Künstlern und Designern zu helfen, einzigartige Animationen und Bilder zu erstellen.
Deepfake-Technologie: Eine Technologie, die GANs nutzt, um überzeugende Gesichtstausche in Videos zu erzeugen und so einen potenziell täuschenden, aber beeindruckend realistischen Videoinhalt zu schaffen.

Ethische Herausforderungen und möglicher Missbrauch von Generative AI

Die Entwicklung generativer KI-Technologien bringt wie jede andere Technologie natürlich auch neue (ethische) Herausforderungen mit sich:

Deepfakes und Fehlinformationen

Die Fähigkeit generativer Modelle, insbesondere GANs, realistische synthetische Medien zu erstellen, hat zum Aufkommen von „Deepfakes“ geführt. Dabei handelt es sich um täuschend echte, künstlich erzeugte Bilder, Audio- oder Videodateien, die realen Personen sehr ähnlich sind. Dabei kann der Kontext völlig verändert werden und es können Dinge gesagt oder getan werden, die nie passiert sind. Dies kann dazu missbraucht werden, Fehlinformationen oder Propaganda zu verbreiten, was schwerwiegende soziale und politische Folgen haben kann.

Datenschutz und Zustimmung

Generative Modelle benötigen in der Regel große Datenmengen für das Training. Gegenwärtig häufen sich vor allem in der EU Klagen und Bedenken über die Art und Weise, wie Daten und geistiges Eigentum für das Training von KI-Systemen verwendet werden. Dies ist besonders kritisch, wenn Modelle auf persönlichen oder sensiblen Daten trainiert werden. Außerdem kann die Generierung realistischer synthetischer Daten (z. B. menschlicher Gesichter) die Grenzen der Zustimmung verwischen, da diese generierten „Menschen“ der Verwendung ihres Abbilds nicht zugestimmt haben und Politiker/innen bekanntermaßen in pornografischen Darstellungen auftauchen.

Unbeabsichtigte Voreingenommenheit / Vorurteile

Alle KI-Modelle, auch generative KI, können unbeabsichtigt Vorurteile in die Daten einbringen. Die Art und Weise, wie KI-Modelle trainiert werden, kann entweder durch Voreingenommenheit in den Daten, durch Voreingenommenheit bei der Auswahl der Daten oder durch das Aufgreifen und Verarbeiten menschlicher Voreingenommenheit, die sich in den Daten widerspiegelt, erfolgen. Wenn zum Beispiel ein Sprachmodell auf Texte aus dem Internet trainiert wird, kann es lernen und Texte produzieren, die gesellschaftliche Vorurteile in diesen Daten widerspiegeln.

Auswirkungen auf die Wirtschaft und die Beschäftigung

Während generative KI nur bestimmte Aufgaben automatisieren und die Effizienz in bestimmten Bereichen verbessern kann, könnte sie in verschiedenen Branchen, in denen diese Modelle eingesetzt werden, auch zur Verdrängung von Arbeitsplätzen führen. Da sie für einige Branchen erhebliche Veränderungen mit sich bringt, könnten die Verwerfungen größer sein und zu sozialen Spannungen führen.

KI-Governance und Regulierung

Die Diskussion über die Steuerung und Regulierung von KI und deren Umsetzung ist natürlich wichtig. Politische Entscheidungsträger/innen, Forscher/innen und Branchenführer/innen müssen zusammenarbeiten, um Strategien und Maßnahmen festzulegen, die einen verantwortungsvollen Umgang mit generativer KI gewährleisten. Gleichzeitig wünschen sich die Unternehmen aber auch eine unregulierte KI, da sie befürchten, dass die Regulierung letztlich Innovationen verhindern wird und Europa z. B. hinter China und den USA zurückbleibt und aufgrund strenger Vorschriften im KI-Wettlauf verliert. Da dies jedoch auch Folgen wie Urheberrechtsverletzungen hat, sind auch andere Länder gefordert.

Die Zukunft und die Grenzen der generativen KI

Generative KI hat in kurzer Zeit in vielen Bereichen bereits große Fortschritte gemacht und verspricht viel für die Zukunft, aber es ist auch wichtig, dass wir verstehen, dass die aktuellen Modelle ihre Grenzen haben und selbst mit diesen Modellen keine echte superintelligente KI erzeugt werden kann. Auch die LLM (Large Language Models) sind in ihrer Funktionsweise begrenzt.

Erhöhter Realismus und Komplexität

Mit besseren Datensätzen und mehr Training werden der Realismus und die potenzielle Komplexität der Ergebnisse generativer Modelle wahrscheinlich zunehmen. Dies wird zu Verbesserungen in allen Bereichen führen, von Animationen, Videos, Musik bis hin zu geschriebenem Text. Allerdings gibt es bei den aktuellen Modellen auch Herausforderungen, vor allem wenn es darum geht, Kohärenz und Kreativität in Einklang zu bringen.

Stärkere Personalisierung

Generative KI hat zwar das Potenzial, Inhalte vollständig auf den Einzelnen und seinen „Stil“ zuzuschneiden,? Dies wirft jedoch neben dem Datenschutz auch andere Fragen auf. Es gibt auch die Herausforderung, personalisierte Erfahrungen zu bieten und gleichzeitig eine verantwortungsvolle Nutzung und Speicherung der Daten der einzelnen Nutzer/innen sicherzustellen. Oder möchtest du, dass deine Stimme von anderen genutzt wird oder dass das Modell auf deine Ideen trainiert wird?

Demokratisierung der kreativen Werkzeuge

Generative KI ermöglicht es jedem, auf einfache Weise fiktionale Inhalte zu erstellen – das öffnet natürlich auch die Tür für Missbrauch. Der Schutz der Rechte am geistigen Eigentum und die Verhinderung der unethischen Nutzung dieser Werkzeuge sind wichtige Herausforderungen, für die es aber noch keine praktischen Lösungen gibt.

Verbesserte Entscheidungsfindung und Vorhersagefähigkeiten

Generative KI könnte die Entscheidungsfindung und die Prognosemodellierung verbessern. Allerdings sind diese Modelle nur so gut wie die Daten, auf denen sie trainiert werden, und auch hier versagen viele Unternehmen bereits. Schließlich kann KI nicht zaubern und die Hoffnung vieler ist, dass sie die „harte Arbeit“ durch KI vermeiden können. Außerdem können bestehende Voreingenommenheiten, Vorurteile oder falsche Muster eingelernt werden und sich in zukünftigen Bewertungen niederschlagen, was deren Zuverlässigkeit und Fairness beeinträchtigt. Es stellt sich auch die Frage, ob solche Modelle den Datenschutz gewährleisten können, wenn die Daten von anderen Unternehmen genutzt werden.

Integration mit anderen neuen Technologien

Die Integration von generativer KI mit anderen aufstrebenden Technologien wie VR, AR und IoT birgt ein immenses Potenzial, stellt uns aber auch vor technische und ethische Herausforderungen, die sorgfältig gemeistert werden müssen. Vor allem wenn es um virtuelle Welten und Spiele geht, kann es spielentscheidend sein, einfach einen Promt einzugeben oder mit einem generativen KI-Modell zu sprechen und ihm zu erklären, wie die virtuelle Welt aussehen soll, während es sie erschafft. Generative AI wird auch ein Schlüssel für die Schaffung von Metaverse-Welten sein und virtuelle Welten für die breite Masse zugänglich machen, indem sie die Erstellung von Inhalten ohne Designer oder Experten erleichtert.

Content at Scale – Recycling at Scale

Eine der Herausforderungen für Anbieter wie Google oder andere Plattformen, die versuchen, Informationen zu kategorisieren, ist, dass es schwer ist, von KI erstellte Inhalte zu unterscheiden. Die Inhalte, wie z. B. Artikel oder Blogs, tragen nicht wirklich zur Diskussion bei, bringen keinen Mehrwert und die Qualität ist „statistischer Durchschnitt“ (laut Definition). Aber es ist so einfach geworden, die Produktion von Inhalten zu skalieren und so werden viele Inhalte auf diese Weise produziert. Wenn wir es ein paar Jahre weiter spinnen, werden in Zukunft große Sprachmodelle auf Inhalte trainiert, die von einer anderen KI erstellt wurden, einschließlich Vorurteilen, Problemen und fehlenden Originalinhalten – mittelmäßige Inhalte erzeugen also mehr mittelmäßige Inhalte.

Das Plateau der aktuellen Modelle und die Notwendigkeit von Innovation

Eine der wichtigsten Einschränkungen der generativen KI ist das Plateau der aktuellen Modelle. Experten stellen bereits fest, dass die Skalierbarkeit bestehender Modelle wie GPT-4 abnimmt. Obwohl es ein leistungsstarkes Sprachmodell ist, hat es die Grenzen dessen erreicht, was ein großes Modell effektiv leisten kann.

Diese Situation unterstreicht die Notwendigkeit von Innovationen auf dem Gebiet der KI. Es müssen neue Methoden und Modelle entwickelt werden, um die Grenzen der aktuellen Technologien zu überwinden. Die nächste Phase der KI-Forschung wird wahrscheinlich die Erforschung verschiedener Architekturen, Trainingsmethoden und möglicherweise ganz neuer Ansätze für maschinelles Lernen beinhalten.

Gehyped und geliebt von Medien und Investoren

Es wäre kein Artikel von mir, wenn ich nicht etwas kritisieren würde. Die perfekte Nachahmung von Intelligenz schürt derzeit einen Hype, der Unternehmen dazu bringt, alles mit generativer KI zu machen. Der Kapitalzufluss und die Nachrichten rund um das Thema sorgen für eine Welle des Interesses, aber sie schränken auch die Diskussion über die Grenzen dieser Modelle stark ein und zeigen, dass die meisten Startups in Wirklichkeit nur die gleiche API von OpenAI oder anderen Modellen verwenden. Wie wir bereits gelernt haben, haben die Modelle ihre Grenzen, sie sind nicht genau, da sie nur statistische Modelle sind, und manchmal generieren sie sogar nur Inhalte auf der Grundlage von GAN-Modellen, die gerade realistisch genug aussehen sollten, um nicht unterscheidbar zu sein. Dies schränkt die Anwendungsmöglichkeiten in vielen Bereichen stark ein und eines der größten Probleme für jede KI-Anwendung ist auch die schlechte Datenqualität für die meisten Anwendungsfälle – daher werden wir noch lange Zeit nur begrenzte Anwendungen für Inhalte wie Bilder, Kunst, Text, Audio oder Illustrationen sehen.

Derzeit gibt es viele Versprechungen, dass sich diese Large Language Models (LLMs) weiterentwickeln könnten, und mit diesen heißen Versprechungen strömen das Silicon Valley und andere mit viel Geld und Medienaufmerksamkeit in diesen Bereich. Der nächste „Goldrausch“ in der Tech-Branche wird nach der Einführung von ChatGPT Ende 2022 durch die Währung angeheizt werden.

Fazit

Generative AI ist definitiv eine faszinierende Technologie, die es ermöglicht, täuschend echte Inhalte in großem Umfang zu erstellen. Die Anwendungsfälle für diese Technologien sind beeindruckend und werden mit Sicherheit viele Dinge automatisieren, die bisher kostspielig waren.

Aber wie jede Technologie bringt auch die KI, die täuschend echte Inhalte erstellen kann, ihre eigenen Herausforderungen und ethischen Überlegungen mit sich. Von Deepfakes über Fehlinformationen bis hin zu Datenschutzbedenken und Voreingenommenheit gibt es viele unbeantwortete Fragen. Unternehmen und Staaten müssen sich auf eine wirksame Kontrolle und Regulierung einigen.

Die aktuellen Modelle und Algorithmen haben ihre Grenzen, die nach Meinung vieler Experten bereits erreicht sind. Wir werden sehen, ob die Versprechen der Branche erfüllt werden, denn schon jetzt sehen wir ein Plateau dessen, was möglich ist, und dass die Modelle nicht linear mit ihrer Größe skalieren. Das bedeutet, dass die Modelle zwar größer werden, aber nur geringfügig besser. Eines ist jedoch sicher: Die generative KI wird sich durchsetzen, mit allen Einschränkungen, aber auch mit allen Vorteilen.

Benjamin Talin

Benjamin Talin, a serial entrepreneur since the age of 13, is the founder and CEO of MoreThanDigital, a global initiative providing access to topics of the future. As an influential keynote speaker, he shares insights on innovation, leadership, and entrepreneurship, and has advised governments, EU commissions, and ministries on education, innovation, economic development, and digitalization. With over 400 publications, 200 international keynotes, and numerous awards, Benjamin is dedicated to changing the status quo through technology and innovation. #bethechange Stay tuned for MoreThanDigital Insights - Coming soon!