Was sind Netzwerkdiagramme? – Einführung und Beispiele zu Network Graphs

Darstellung von Entitäten und deren Beziehungen untereinander - Verstehen von Netzwerkgraphen

By Virtualitics - smarter decision through multi-dimension data visualizations and easy to use AI On 2. November 2021

Netzwerk-(Wissens-)Graphen (engl. Network- and Knowledge-Graphs) stellen eine Sammlung miteinander verbundener Entitäten dar, die über Verknüpfungen und semantische Metadaten in Kontexten organisiert sind. Sie bilden einen Rahmen für die Datenintegration und -analyse. Die Fähigkeit, dies zu tun, kann mehr Kontext zu den von einem Netzwerksystem aufgezeichneten Metriken liefern. Durch die Nutzung dieser Diagramme können Sie Ihr Verständnis der Daten verbessern.

Netzwerke sind überall – Wenn Sie den allgemeinen Begriff der Netzwerke betrachten, werden Sie feststellen, dass sie überall sind, sowohl in der virtuellen als auch in der realen Welt. Das Internet ist nur ein ausgedehntes Netz von Computergeräten. Auch Straßensysteme sind Netzwerke, da sie sich untereinander kreuzen.

In kleinerem Maßstab verfügen alle Unternehmen über Datennetze. Wenn man nur die Standardansätze der Business Intelligence nutzt, sieht man nur die Metriken; Netzwerk- oder Wissensgraphen eröffnen die Möglichkeit einer tieferen Analyse.

Index

3 Hauptkomponenten von Netzwerkdiagrammen

Wissens- oder Netzwerkdiagramme (engl. Knowledge Graphs / Network Graphs), bestehen aus drei Hauptkomponenten – Nodes (Knoten), Edges (Kanten) und Edge Weight (Kantengewicht). Definieren wir sie einmal bevor wir in das Beispiel übergehen, wie solche Netzwerkdiagramme angewendet werden können.

1. Nodes – Greifbare und nicht greifbare Entitäten

Beispiel eines Knotens in einem Netzwerkdiagramm – Quelle: Virtualitics

Die obige Abbildung zeigt einen Node. Im Netzwerk oder Wissensgraphen können Nodes jede greifbare Einheit (tangible entity) wie Menschen, Orte und Geräte sowie jede nicht greifbare Einheit (intangible entity) wie Ideen, Konzepte oder Themen darstellen.

2. Edges – Beziehungen veranschaulichen

Beispiele für Kanten in Netzwerkdiagrammen - Veranschaulichung von Datenbeziehungen — Beispiele für Kanten in Netzwerkdiagrammen – Veranschaulichung von Datenbeziehungen – Quelle: Virtualitics

Wenn die Nodes (Knoten) in einer Beziehung zueinander stehen, wird dies als Edge (Kante) angezeigt. Die Kanten desselben Knotens oben sind nun hervorgehoben, um zu zeigen, mit welchen Verbindungen dieser Knoten Beziehungen teilt. Die Kante kann die spezifische Beziehung und den Grund für die gemeinsamen Verbindungen dieser beiden Knoten definieren. Sowohl der Knoten als auch die Kante enthalten Attribute, die dazu beitragen, die Beziehung des Netzwerks zu beschreiben.

3. Edge Weights – Zeichen für die Stärke der Beziehung

Einem Edge (Kante) wird ein Gewicht gegeben, um die Stärke der Beziehung zwischen zwei beliebigen Knoten zu definieren. Es gibt vier Arten von Gewichten, die bei der Definition von Beziehungen möglich sind:

Ungerichtet und ungewichtet: Bedeutet, dass es eine Verbindung gibt, aber sie hat keine Richtung oder Gewichtung
Ungerichtet und gewichtet: Zeigt eine Verbindung an, und die Gewichtung ist die „Anzahl“ der Verbindungen
Gerichtet und ungewichtet: Zeigt an, dass es keine Gewichtung der Verbindung gibt; sie ist nur verbunden oder nicht
Gerichtet und gewichtet: Zeigt an, dass es eine starke Verbindung gibt, und sie hat ein definierbares Gewicht

Wie wird ein Knowledge Graph aufgebaut?

Diese Diagramme enthalten in der Regel Datensätze aus vielen Quellen. Diese können natürlich in ihrer Struktur variieren. Um die Konsistenz der Form zu gewährleisten, bietet die Verwendung von Schemata einen Rahmen. Identitäten klassifizieren dann die Knotenpunkte. Der dritte Teil ist der Kontext, der das Umfeld bestimmt, in dem diese Informationen existieren, was nützlich ist, wenn Datenpunkte mehrere Bedeutungen haben (z. B. Apple versus Apfel).

Die meisten Wissens- oder Netzwerkgraphen nutzen maschinelles Lernen (ML) und natürliche Sprachverarbeitung (NLP), um Nodes (Knoten), Edges (Kanten) und Edge Weight (Kantengewichte) durch semantische Anreicherung umfassend zu betrachten. Dabei handelt es sich um einen Prozess, der es den Graphen ermöglicht, bei der Aufnahme von Daten einzelne Objekte und deren Beziehung zueinander zu identifizieren. Anschließend erfolgt in der Regel ein Vergleich und eine Integration mit anderen relevanten oder ähnlichen Datensätzen.

Warum Netzwerkdiagramme verwenden?

Theoretisch können Netze sehr einfach sein und aus Knoten und Kanten bestehen. Je mehr Knoten dem Netz jedoch hinzugefügt werden, desto komplizierter wird der Graph. Folglich kann die Skalierung großer Netze eine Herausforderung für die Interpretation oder Analyse darstellen.

Einige Anwendungsfälle für Netzgraphen sind:

Einzelhandel: Wissensgraphen können Informationen über Upselling- und Cross-Selling-Strategien, Produktempfehlungen auf der Grundlage des bisherigen Käuferverhaltens und demografiespezifische Kauftrends liefern.
Lesen Sie weiter: Verstehen von Kundenverhaltensmustern durch 3D-Datenvisualisierung
Finanzen: Banken nutzen diese häufig für Initiativen zur Bekämpfung der Geldwäsche. Sie können als Präventivmaßnahme gegen Verbrechen dienen und Ermittlungen einleiten. Sie können die Geldströme zwischen den Kunden überwachen, um Verstöße zu erkennen.
Gesundheitswesen: Medizinische Forscher verwenden Wissens- oder Netzwerkgraphen, um Beziehungen zu organisieren und zu kategorisieren. Sie können die Validierung von Diagnosen unterstützen und die besten Behandlungspläne auf individueller Basis bestimmen.

In solchen Situationen kann es schwierig sein, einen Einblick zu erhalten, und hier kommen Netzwerkvisualisierung und Software ins Spiel.

Beispiel: Wie visualisiert man Flughafenverkehrsdaten?

Beispiel - Flughafenverkehrsdaten — Example: Raw Data about Airport Traffic – Source: Virtualitics

Ausgehend von den obigen Rohdaten können wir sicher davon ausgehen, dass die Struktur dieses Netzes bei einer Darstellung in Tabellenform wenig aussagekräftig ist. Der Ausgangspunkt besteht also darin, diese Daten zu extrahieren und als Netzwerk darzustellen, dessen Knoten einen bestimmten Flughafen und dessen Kanten bestimmte Flugrouten repräsentieren.

Beispiel - Visualisierung von Flughafen-Verkehrsdaten auf Basis von Netzwerkgraphen mit Knoten und Kanten — Beispiel – Visualisierung von Flughafen-Verkehrsdaten auf Basis von Netzwerkgraphen mit Knoten und Kanten – Quelle: Virtualitics

Wir können dieses Netz besser verstehen, wenn wir es auf der Erdoberfläche überlagern, so dass wir anfangen können, Fragen zu den Daten zu stellen, z. B. was der kürzeste Weg zwischen zwei Knoten ist.

Beispiel - Visualisierung von Flughafen-Verkehrsdaten als Overlay auf der Oberfläche der Erde — Beispiel: Visualisierung von Flughafen-Verkehrsdaten als Overlay auf der Erdoberfläche – Quelle: Virtualitics

In diesem Fall wählen wir Tampa International (Florida) und Circle City (Alaska), deren kürzester Weg sich aus 5 verschiedenen Flugstrecken zusammensetzt.

Beispiel - Visualisierung von Netzwerkgraphen für kürzestes Routing — Beispiel: Visualisierung von Netzwerkgraphen für kürzeste Flug Routen – Quelle: Virtualitics

Man kann sich vorstellen, dass das obige Beispiel eventuell auch mit Proteindaten verwendet werden kann, um zu verstehen, wie effektiv bestimmte Medikamentenmoleküle auf verschiedene Krankheitswege abzielen, oder um zu verstehen, was die Kunden bei einem Kauf wahrscheinlich sonst noch kaufen würden.

Solche Netze gibt es überall, und durch Visualisierungen wie diese wird ihr Verhalten auf eine Art und Weise lebendig, die neue Fragen, Hypothesen und Entscheidungen zu ihrer Optimierung ermöglicht.

Autor: Alessandro Lativ

Virtualitics - smarter decision through multi-dimension data visualizations and easy to use AI

Virtualitics stems from over a decade of research at CalTech and Nasa's Jet Propulsion Laboratory and has been very successful equipping the US Air Force with timely mission critical insight. Virtualitics Immersive Platform (VIP) provides collaborative data exploration powered by easy-to-use AI routines and multidimensional visualizations. Virtualitics Predict is a containerized application to deploy custom prediction models that fit seamlessly into existing workflows and technology stacks. Ensuring organizations remain focused on the insights to drive smarter decision making.