NLP erklärt – Was ist Natural Language Processing?

Zweck von Natural Language Processing (NLP) und entsprechende Beispiele für Anwendungen

Natural Language Processing (Kurz: NLP) verknüpft in der Informatik die maschinelle Verarbeitung der natürlichen Sprache. Auf Basis der natürlichen und geschriebenen bzw gesprochenen Sprache kann der Computer die Sprache vom Menschen analysieren, verstehen und verarbeiten.

Ziel von NLP ist es, mit Hilfe von Algorithmen und Regeln natürliche Sprache zu verstehen und auch selbst zu erzeugen. Dafür werden Erkenntnisse aus der Informatik und Linguistik kombiniert. Im Ergebnis ist NLP eine Art der künstlichen Intelligenz, welche zahlreiche Anwendungsgebiete, gerade im Bereich von Unternehmen und unstrukturierten Daten, hat. Anwendungsgebiete sind beispielsweise die Kommunikation zwischen Menschen und Maschine in Form von beispielsweise Enterprise Search Engines oder auch Chatbots.

Der Fokus liegt dabei darauf, die Informationen nicht nur anhand von Schlagwörtern, sondern im gesamten semantischen Kontext, zu verstehen. NLP ist dann in der Lage, kontextabhängige Textzusammenhänge richtig zu deuten und zu interpretieren. Die Herausforderung liegt dabei in der Komplexität der menschlichen Sprache. Abhängig vom Kontext ist beispielsweise das Wort Kumpel entweder im Sinne von Freund oder von Mitarbeiter unter Tage zu verstehen. Andrerseits bedeuten sowohl Ampel als auch Lichtsignalanlage das Gleiche. Ein Verständnis solcher Unterschiede ist im NLP Bereich daher elementar. Da Computer im Gegensatz zu Menschen nicht basierend auf Erfahrungen zum besseren Sprachverständnis zurückgreifen können, wird sich hier verschiedener Algorithmen und Verfahren des Maschine Learning bedient. NLP besteht daraus, diese Informationen in einem für den Computer verstehbarem Zahlenformat zu repräsentieren.

Zu Beginn müssen für eine NLP Anwendung daher große Datenmengen zum Lernen verschiedener Muster und für die Sinnanalyse verwendet werden. Dies müssen jedoch nicht immer unternehmensinterne Daten sein, sondern können in vielen Fällen auch frei, im Internet zugängliche Daten sein. Unternehmen müssen für eine NLP Anwendung also nicht per se Daten oder Serverkapazitäten zur Verfügung stellen.

Verschiedene Fachbereiche des NLPs

Die Erkennung der menschlichen Sprache lässt sich in verschiedene Bereiche unterteilen. Diese stellen verschiedene Schritte dar, die anschließend, zur gesamtheitlichen Erkennung des Textes genutzt werden:

  • Erkennung der Sprache
  • Einordnung einzelner Wörter und Sätze
  • Erfassen grammatikalischer Informationen wie bspw. Grundformen
  • Identifizieren einzelner Wortfunktionen im Satz (Subjekt, Verb, Objekt, Adjektiv, etc.)
  • Interpretation der Bedeutung von (Teil-)Sätzen
  • Erfassen von Satzzusammenhängen und -beziehungen

Enorme Entwicklungen im Bereich NLP haben hier die Anwendungsmöglichkeiten und Skalierbarkeit für bspw. Enterprise Search Engines enorm erhöht. Trotzdem stößt NLP aktuell jedoch noch bei der Interpretation bestimmter Stilmittel (rhetorische Fragen, Ironie oder bei Paradoxeren) an seine Grenzen.

Klassische NLP Anwendungsbereiche

1. Frage-Antwort Modelle

Bei Problemen dieser Art geht es darum, dass Fragen mit einer möglichst genauen Antwort beantwortet werden. Je konkreter die Antwort sein soll, desto komplexer ist Aufgabe für den Computer. Am einfachsten ist dabei beispielsweise die komplette Extraktion einer Textpassage; alternativ könnte man kann aber auch konkrete Wörter extrahieren oder diese in Antwortsätzen verpacken. Das nächste Level wäre anschließend noch die logische Schlussfolgerung aus Textinformationen. Beispielsweise könnte im Text die Information enthalten sein, dass in der PR-Abteilung Mitarbeiter A, B und C sitzen. Die logische Antwort auf die Frage „Wie viele Mitarbeiter hat unsere PR-Abteilung?“ wäre dann drei.

Beispiel 1:

Ein Mittelständler hat verschiedene Datensilos mit verschiedenen Informationen und Dokumenten. Ein intelligenter Enterprise Search Engine kann Fragen wie „Wie löse ich den Fehlercode #err49284?“ beantworten.

Beispiel 2:

Ein Konzern erhält immer die gleichen Kundenanfragen. Hier kann das Unternehmen einen Chatbot nutzen, um den Kunden automatisiert die Fragen zu beantworten.

2. Klassifizierung verschiedener Sequenzen

Ziel dieses Anwendungsbereich ist es, Text in vordefinierte Klassen einzuordnen. Eine vordefinierte Klasse könnten beispielsweise Emotionen wir glücklich, traurig oder wütend sein. Der Computer entscheidet selbstständig, welcher Klasse der ihm vorgelegte Text zugeordnet wird. Genauso gut könnten Texte aber auch Autoren oder Formate von Artikeln (Blog, Meinung, Nachrichten) zugeordnet werden. Die Länge der Texte kann also beliebig gewählt werden.

Beispiel 3:

Ein Vergleichsportal möchte negative Bewertungen dem Inhalt nach ordnen. Vorhandene Kundenbewertungen mit einer negativen Bewertung werden dadurch in beispielsweise die Klassen „Beschwerden über Kundenservice“, „Beschwerden über Nutzerfreundlichkeit“ und „Beschwerden über Preise“ eingeteilt. Jede Negative Bewertung (bspw mit 3 Sternen und schlechter) wird nun einer Klasse zugeordnet.

Beispiel 4:

Ein Maschinenbauer erhält Post, die an verschiedene Abteilungen adressiert ist. Anstatt diese manuell zu selektieren kann mit Hilfe von NLP eine Unterteilung in Lieferscheine, Rechnungen, und anderen Anfragen erfolgen.

3. Generieren von Texten

Auf Basis von gegebenen Texten sollen passende Worte zur Vervollständigung des Textes vorgeschlagen werden. Dieser kann wiederum für weitere Textvorhersagen und Vervollständigungen genutzt werden.

Beispiel 5:

Der Entwickler eines Dokumentenmanagementprogramms möchte ähnlich wie der Enterprise Search Engine Anbieter das Finden von Dokumenten vereinfachen. Dazu sagt er die potenziellen Suchanfragen in der Suchmaske mit passenden Wörtern vorher.

4. Satzgliederkennung

Dieser NLP Bereich beschäftigt sich mit dem Identifizieren verschiedener Satzglieder wie beispielsweise Subjekte, Prädikate oder Objekte. Alternativ können dies aber auch natürliche Personen, Unternehmen, Zeiten oder E-Mailadressen sein.

Beispiel 6:

Ein Unternehmen nutzt einen Enterprise Search Engine, um aus Protokollen die Ansprechpartner und Fristen der jeweiligen Themen zu extrahieren.

5. Zusammenfassungen

Die Aufgabe des Computers besteht daraus, längere Texte in kürzere Texte unter Berücksichtigung grammatikalischer Regeln abzuändern. Dabei darf der Inhalt sich nicht verändern, daher müssen wichtige und unwichtige Informationen erkannt werden.

Beispiel 7:

Ein Verlag möchte längere Artikel für eine Onlinekurzversion automatisiert zusammenfassen. Dafür lässt es eine Kurzzusammenfassung in der Länge und Sprachkomplexität in Abhängigkeit des Nutzerprofils erstellen.

6. Übersetzungen

Unter Einhaltung der geltenden Rechtschreibregeln werden Texte in mehrere Sprachen übersetzt. Dabei muss sich sowohl inhaltlich als auch grammatikalisch nah am Originaltext gehalten werden.

Beispiel 8:

Ein Maschinenbauhersteller möchte von der DACH Region in den Internationalen Raum expandieren und muss daher alle Produktbeschreibungen und technischen Spezifikationen in andere Sprachen übersetzen. Die Herausforderung besteht zusätzlich im technischen und branchenspezifischen Vokabular.

Diese Liste lässt sich zudem um weitere Anwendungsfälle wie bspw. Speech-to-Text-Konvertierungen oder Spracherkennung erweitern.

Wie wird sich NLP in Zukunft entwickeln?

Als eine der zukunftsträchtigsten Formen von künstlicher Intelligenz wird aktuell am stärksten im Bereich NLP geforscht. Schnelle Entwicklungen in den letzten Jahren, die vor allen Dingen eine ressourcenschonendere Entwicklung ermöglichen, versprechen ebenso schnelle Entwicklungen in der Zukunft.

Das Nutzen von NLP ist schon heute nicht mehr nur großen Konzernen vorbehalten, sondern wird durch Übersetzungs- oder Suchtools für jedermann zugänglich. Zukünftige Entwicklung werden weitere Anwendungsfälle und auch noch weiter reduzierte Kosten mit sich bringen.

Man darf der gespannt bleiben, wie sich KI in diesem Bereich noch entwickeln wird.

Bastian Maiworm ist der Gründer des Enterprise-Search-Tech-Startups ambeRoad. Als Jungunternehmer spricht er über die neuesten Entwicklungen im Bereich Startup und Enterprise Search. Bei ambeRoad war er maßgeblich an der Entwicklung der Vertriebsstrategie beteiligt und kennt aufgrund seiner Erfahrung die Probleme, die sich bei Kooperationen zwischen Konzernen und Startups ergeben, sehr genau. Dies nutzt er, um die Digitalisierung und Zusammenarbeit zwischen Startups und Konzernen weiter voranzutreiben und zu optimieren.

Die Kommentarfunktion ist geschlossen.

This website uses cookies to improve your experience. We'll assume you're ok with this, but you can opt-out if you wish. Accept Read More