Was sind Netzwerkdiagramme? – Einführung und Beispiele zu Network Graphs
Darstellung von Entitäten und deren Beziehungen untereinander - Verstehen von Netzwerkgraphen
Netzwerk-(Wissens-)Graphen (engl. Network- and Knowledge-Graphs) stellen eine Sammlung miteinander verbundener Entitäten dar, die über Verknüpfungen und semantische Metadaten in Kontexten organisiert sind. Sie bilden einen Rahmen für die Datenintegration und -analyse. Die Fähigkeit, dies zu tun, kann mehr Kontext zu den von einem Netzwerksystem aufgezeichneten Metriken liefern. Durch die Nutzung dieser Diagramme können Sie Ihr Verständnis der Daten verbessern.
Index
Netzwerke sind überall – Wenn Sie den allgemeinen Begriff der Netzwerke betrachten, werden Sie feststellen, dass sie überall sind, sowohl in der virtuellen als auch in der realen Welt. Das Internet ist nur ein ausgedehntes Netz von Computergeräten. Auch Straßensysteme sind Netzwerke, da sie sich untereinander kreuzen.
In kleinerem Maßstab verfügen alle Unternehmen über Datennetze. Wenn man nur die Standardansätze der Business Intelligence nutzt, sieht man nur die Metriken; Netzwerk- oder Wissensgraphen eröffnen die Möglichkeit einer tieferen Analyse.
3 Hauptkomponenten von Netzwerkdiagrammen
Wissens- oder Netzwerkdiagramme (engl. Knowledge Graphs / Network Graphs), bestehen aus drei Hauptkomponenten – Nodes (Knoten), Edges (Kanten) und Edge Weight (Kantengewicht). Definieren wir sie einmal bevor wir in das Beispiel übergehen, wie solche Netzwerkdiagramme angewendet werden können.
1. Nodes – Greifbare und nicht greifbare Entitäten
Die obige Abbildung zeigt einen Node. Im Netzwerk oder Wissensgraphen können Nodes jede greifbare Einheit (tangible entity) wie Menschen, Orte und Geräte sowie jede nicht greifbare Einheit (intangible entity) wie Ideen, Konzepte oder Themen darstellen.
2. Edges – Beziehungen veranschaulichen
Wenn die Nodes (Knoten) in einer Beziehung zueinander stehen, wird dies als Edge (Kante) angezeigt. Die Kanten desselben Knotens oben sind nun hervorgehoben, um zu zeigen, mit welchen Verbindungen dieser Knoten Beziehungen teilt. Die Kante kann die spezifische Beziehung und den Grund für die gemeinsamen Verbindungen dieser beiden Knoten definieren. Sowohl der Knoten als auch die Kante enthalten Attribute, die dazu beitragen, die Beziehung des Netzwerks zu beschreiben.
3. Edge Weights – Zeichen für die Stärke der Beziehung
Einem Edge (Kante) wird ein Gewicht gegeben, um die Stärke der Beziehung zwischen zwei beliebigen Knoten zu definieren. Es gibt vier Arten von Gewichten, die bei der Definition von Beziehungen möglich sind:
- Ungerichtet und ungewichtet: Bedeutet, dass es eine Verbindung gibt, aber sie hat keine Richtung oder Gewichtung
- Ungerichtet und gewichtet: Zeigt eine Verbindung an, und die Gewichtung ist die „Anzahl“ der Verbindungen
- Gerichtet und ungewichtet: Zeigt an, dass es keine Gewichtung der Verbindung gibt; sie ist nur verbunden oder nicht
- Gerichtet und gewichtet: Zeigt an, dass es eine starke Verbindung gibt, und sie hat ein definierbares Gewicht
Wie wird ein Knowledge Graph aufgebaut?
Diese Diagramme enthalten in der Regel Datensätze aus vielen Quellen. Diese können natürlich in ihrer Struktur variieren. Um die Konsistenz der Form zu gewährleisten, bietet die Verwendung von Schemata einen Rahmen. Identitäten klassifizieren dann die Knotenpunkte. Der dritte Teil ist der Kontext, der das Umfeld bestimmt, in dem diese Informationen existieren, was nützlich ist, wenn Datenpunkte mehrere Bedeutungen haben (z. B. Apple versus Apfel).
Die meisten Wissens- oder Netzwerkgraphen nutzen maschinelles Lernen (ML) und natürliche Sprachverarbeitung (NLP), um Nodes (Knoten), Edges (Kanten) und Edge Weight (Kantengewichte) durch semantische Anreicherung umfassend zu betrachten. Dabei handelt es sich um einen Prozess, der es den Graphen ermöglicht, bei der Aufnahme von Daten einzelne Objekte und deren Beziehung zueinander zu identifizieren. Anschließend erfolgt in der Regel ein Vergleich und eine Integration mit anderen relevanten oder ähnlichen Datensätzen.
Warum Netzwerkdiagramme verwenden?
Theoretisch können Netze sehr einfach sein und aus Knoten und Kanten bestehen. Je mehr Knoten dem Netz jedoch hinzugefügt werden, desto komplizierter wird der Graph. Folglich kann die Skalierung großer Netze eine Herausforderung für die Interpretation oder Analyse darstellen.
Einige Anwendungsfälle für Netzgraphen sind:
- Einzelhandel: Wissensgraphen können Informationen über Upselling- und Cross-Selling-Strategien, Produktempfehlungen auf der Grundlage des bisherigen Käuferverhaltens und demografiespezifische Kauftrends liefern.
Lesen Sie weiter: Verstehen von Kundenverhaltensmustern durch 3D-Datenvisualisierung - Finanzen: Banken nutzen diese häufig für Initiativen zur Bekämpfung der Geldwäsche. Sie können als Präventivmaßnahme gegen Verbrechen dienen und Ermittlungen einleiten. Sie können die Geldströme zwischen den Kunden überwachen, um Verstöße zu erkennen.
- Gesundheitswesen: Medizinische Forscher verwenden Wissens- oder Netzwerkgraphen, um Beziehungen zu organisieren und zu kategorisieren. Sie können die Validierung von Diagnosen unterstützen und die besten Behandlungspläne auf individueller Basis bestimmen.
In solchen Situationen kann es schwierig sein, einen Einblick zu erhalten, und hier kommen Netzwerkvisualisierung und Software ins Spiel.
Beispiel: Wie visualisiert man Flughafenverkehrsdaten?
Ausgehend von den obigen Rohdaten können wir sicher davon ausgehen, dass die Struktur dieses Netzes bei einer Darstellung in Tabellenform wenig aussagekräftig ist. Der Ausgangspunkt besteht also darin, diese Daten zu extrahieren und als Netzwerk darzustellen, dessen Knoten einen bestimmten Flughafen und dessen Kanten bestimmte Flugrouten repräsentieren.
Wir können dieses Netz besser verstehen, wenn wir es auf der Erdoberfläche überlagern, so dass wir anfangen können, Fragen zu den Daten zu stellen, z. B. was der kürzeste Weg zwischen zwei Knoten ist.
In diesem Fall wählen wir Tampa International (Florida) und Circle City (Alaska), deren kürzester Weg sich aus 5 verschiedenen Flugstrecken zusammensetzt.
Man kann sich vorstellen, dass das obige Beispiel eventuell auch mit Proteindaten verwendet werden kann, um zu verstehen, wie effektiv bestimmte Medikamentenmoleküle auf verschiedene Krankheitswege abzielen, oder um zu verstehen, was die Kunden bei einem Kauf wahrscheinlich sonst noch kaufen würden.
Solche Netze gibt es überall, und durch Visualisierungen wie diese wird ihr Verhalten auf eine Art und Weise lebendig, die neue Fragen, Hypothesen und Entscheidungen zu ihrer Optimierung ermöglicht.
Autor: Alessandro Lativ
Die Kommentarfunktion ist geschlossen.