Microsoft SQL Server Graph Database

Focused businessman looking at a scheme of clouds and light bulb in cloudy landscape

Um komplexe Strukturen in einer Datenbank abzubilden, sind eine Vielzahl an Verbindungen notwendig welche mit traditionellen Datenbanksystemen mithilfe von Fremdschlüsseln und Mapping Tabellen oft nur mit großem Aufwand abgebildet werden können. Durch die steigende Komplexität werden dadurch Abfragen sehr umständlich bzw. leidet meist auch die Performance darunter.

Wenn Daten sehr viele Beziehungen untereinander besitzen ist eine Graph Datenbank sehr gut geeignet. Microsoft SQL Server 2017 bietet die Möglichkeit in der gewohnten Datenbankumgebung Daten als Graph abzubilden.

Mithilfe eines Beispiels, welches Beziehungen zwischen Personen, Firmen und Produkten darstellt (siehe Abbildung Graph Beispiel) wird gezeigt wie Daten als Graph gespeichert werden können.

Ein Graph besteht aus Knoten (Objekte) und Kanten (Verbindungen). Um einen Knoten anzulegen, wird eine Tabelle erstellt und mit „AS NODE“ deklariert. Daten können dann wie gehabt mittels INSERT Statement eingefügt werden.

Der einzige Unterschied zu einer normalen Tabelle ist die zusätzliche Spalte mit welcher ein Tabelleneintrag in der ganzen Datenbank eindeutig referenziert werden kann.

Auch eine Kante wird als Tabelle definiert. Dadurch können einer Verbindung noch zusätzliche Attribute zugewiesen werden. Um einen Wert in die Kantentabelle einzufügen, müssen der Ausgangsknoten, der Zielknoten und weitere Attribute (je nach Tabellendefinition) in einem Insert Statement angegeben werden. Hierbei ist der Typ der Knoten nicht beschränkt und es können z.B. Kaufrelationen von Firma/Produkt sowie Person/Produkt definiert werden.

Damit der SQL Server die Graph Tabellen von herkömmlichen Tabellen unterscheiden kann, werden bei Definition von Knoten und Kanten automatisch Metadaten in der System Tabelle abgespeichert.

Im SQL Server Management Studio werden Graph Tabellen in einem eigenen Ordner angezeigt.

Nachdem alle Knoten und Kanten erzeugt und mit Daten befüllt wurden, können nun Abfragen gestartet werden. Hierbei wird das MATCH Statement verwendet. Dieses wird mit Argumenten in der Form node-(edge)->node definiert. (https://docs.microsoft.com/en-us/sql/t-sql/queries/match-sql-graph?view=sql-server-2017). Als Beispiel können wir mittels der folgenden SQL Abfrage (Abbildung Zulieferer) alle zugelieferten Produkte mit den zugehörigen Firmen ausgeben.

Im MATCH Statement können mehrere Beziehungen mittels AND angegeben werden. Im abschließenden Beispiel werden alle Produktkäufe durch Empfehlung eines Freundes abgefragt. Wir nehmen eine Produktempfehlung bei einem Produktkauf einer Person an, bei der ein Freund dasselbe Produkt innerhalb der letzten drei Monate gekauft hat.

Anwendung BI

Die Graph Struktur lässt sich auch im BI Umfeld auf das Star Schema anwenden, um eine intuitive Sicht und Abfragemöglichkeiten auf die Daten bereitzustellen. Hier können die Fakten und Dimensionen als Nodes abgebildet werden.

Zusammenfassung

Eine Graph Datenbank bietet für gewisse Anwendungsfälle eine sehr vielversprechende Alternative zu traditionellen Datenbanksystemen. Die Integration in die bestehende SQL Umgebung ermöglicht auch ein relativ einfaches Migrieren von einer relationalen Datenbank zur Graph Datenbank. Natürlich gibt es aufgrund der Neuheit des Features noch einige Limitierungen (https://docs.microsoft.com/en-us/sql/t-sql/queries/match-sql-graph?view=sql-server-2017) welche jedoch hauptsächlich Optimierungen betreffen.

Tags : Graph Database SQL Server

The author Herbert Pataky

Herbert Pataky schloss sein Studium im Bereich Software Engineering für Business und Finanz an der FH Hagenberg 2005 mit Auszeichnung ab. Bereits während des Studiums entwickelte Herr Pataky für mittelständische Kunden Individualsoftware zur Optimierung von Geschäftsprozessen und beschäftigte sich eingehend mit verteilten Software Architekturen. Sein berufsbegleitendes Studium Information Engineering und Management an der FH Hagenberg schloss Herr Pataky im Jahr 2008 ebenfalls mit Auszeichnung ab. Herr Pataky ist Spezialist in den Bereichen Business Analytics, Software Solutions und IT Consulting wo er seit mehr als 15 Jahren gemeinsam mit seinem Team sehr erfolgreich Mittelstands- und Großkunden aus dem Automotive-Bereich und Anlagenbau betreut. Er weist profundes Prozessverständnis in der Automobil-Industrie auf und ist Experte in den Bereichen Data Warehouse und Big Data Analytics im Microsoft Umfeld. Herbert ist Gründer & Eigentümer des Unternehmens PASO Solutions.

Cookie	Dauer	Beschreibung
_GRECAPTCHA	6 Monate	Dieses Cookie wird von Google gesetzt. Zusätzlich zu bestimmten Standard-Google-Cookies setzt reCAPTCHA bei der Ausführung ein erforderliches Cookie (_GRECAPTCHA), um die Risikoanalyse durchzuführen.
cli_user_preference	1 Jahr	Diese Cookies werden vom GDPR Cookie Consent WordPress Plugin gesetzt. Das Cookie wird verwendet, um die Benutzereinwilligung für die Cookies zu speichern.
cookielawinfo-checkbox-advertisement	1 year	Dieses Cookie wird vom GDPR Cookie Consent Plugin gesetzt und wird verwendet, um die Zustimmung des Benutzers für die Cookies in der Kategorie "Werbung" aufzuzeichnen.
cookielawinfo-checkbox-analytics	1 Jahr	Diese Cookies werden vom GDPR Cookie Consent WordPress Plugin gesetzt. Das Cookie wird verwendet, um die Benutzereinwilligung für die Cookies unter der Kategorie "Analytics" zu speichern.
cookielawinfo-checkbox-necessary	1 Jahr	Dieses Cookie wird vom GDPR Cookie Consent Plugin gesetzt. Die Cookies werden verwendet, um die Einwilligung des Benutzers für die Cookies in der Kategorie "Notwendig" zu speichern.
cookielawinfo-checkbox-others	1 Jahr	Diese Cookies werden vom GDPR Cookie Consent WordPress Plugin gesetzt. Das Cookie wird verwendet, um die Benutzereinwilligung für die Cookies unter der Kategorie "Andere" zu speichern.
CookieLawInfoConsent	1 Jahr	Diese Cookies werden vom GDPR Cookie Consent WordPress Plugin gesetzt. Das Cookie wird verwendet, um die Benutzereinwilligung für die Cookies zu speichern.
JSESSIONID	past	Das JSESSIONID-Cookie wird von New Relic verwendet, um eine Sitzungskennung zu speichern, damit New Relic die Anzahl der Sitzungen für eine Anwendung überwachen kann.
viewed_cookie_policy	1 Jahr	Das Cookie wird vom GDPR Cookie Consent Plugin gesetzt und wird verwendet, um zu speichern, ob der Benutzer der Verwendung von Cookies zugestimmt hat oder nicht. Es werden keine personenbezogenen Daten gespeichert.

Cookie	Dauer	Beschreibung
_ga	2 Jahr	Dieses Cookie wird von Google Analytics installiert. Das Cookie wird verwendet, um Besucher-, Sitzungs- und Kampagnendaten zu berechnen und die Nutzung der Website für den Analysebericht der Website zu verfolgen. Die Cookies speichern Informationen anonym und weisen eine zufällig generierte Nummer zu, um eindeutige Besucher zu identifizieren.
_ga_G4YM34008H	2 years	Identifikationscode der Website zur Verfolgung von Besuchen.
_gat_gtag_UA_86474208_1	1 minute	Identifikationscode der Website zur Verfolgung von Besuchen.
_gid	1 Tag	Dieses Cookie wird von Google Analytics installiert. Das Cookie wird verwendet, um Informationen darüber zu speichern, wie Besucher eine Website nutzen, und hilft bei der Erstellung eines Analyseberichts über die Funktionsweise der Website. Die gesammelten Daten, einschließlich der Anzahl der Besucher, der Quelle, aus der sie stammen, und der Seiten, die in anonymer Form angezeigt werden.

Cookie	Dauer	Beschreibung
CONSENT	16 years 7 months 22 days 5 hours 28 minutes	No description
YSC	session	Diese Cookies werden von Youtube gesetzt und dienen zum Verfolgen der Ansichten eingebetteter Videos.

Cookie	Dauer	Beschreibung
IDE	1 year 24 days	Wird von Google DoubleClick verwendet und speichert Informationen darüber, wie der Nutzer die Website und andere Werbung verwendet, bevor er die Website besucht. Dies wird verwendet, um Nutzern Anzeigen zu präsentieren, die für sie entsprechend dem Nutzerprofil relevant sind.
test_cookie	15 minutes	Dieses Cookie wird von doubleclick.net gesetzt. Mit dem Cookie soll festgestellt werden, ob der Browser des Benutzers Cookies unterstützt.
VISITOR_INFO1_LIVE	5 months 27 days	Dieser Cookie wird von Youtube gesetzt. Wird verwendet, um die Informationen der eingebetteten YouTube-Videos auf einer Website zu verfolgen.

Entdecke den neuen Microsoft Planner: Ein umfassendes Aufgabenmanagement-Tool

Microsoft Planner: Meine Eindrücke von der Funktion „Hinzufügen eines Plans zum Outlook-Kalender“

M365 Stream – neu und verbessert?

Microsoft Viva Goals: Erledigen Sie ihre Ziele

Effektiveres Arbeiten mit Microsoft Planner

Microsoft FindTime

Backup for Office 365

Modern Script Editor Webpart

SharePoint: Lösung um „Kalender-Einträge“ in Farbe darzustellen

Bevorzugte Sprache in Benutzerprofilen richtig setzen

Jetzt Patchen – Sicherheitslücke CVE-2019-0604 – SharePoint On Premise

Connected WebParts in SharePoint Online

Interview: Miriam Mayer von der Österreichischen Post über den digitalen Arbeitsplatz „OSKAR“ mit SharePoint, Teams, Yammer und Office 365

Das Interview zum Global Azure Bootcamp 2020

MS Teams und Gruppen – eine wünschenswerte Kombination

Metadaten in mehreren Sprachen anzeigen und nach Bildern filtern mit dem HATAHET Intelligent Picture Resizer

Microsoft Teams vollautomatisch erstellen

SPFx Extension für den HATAHET Intelligent Picture Resizer

Interview: Miriam Mayer von der Österreichischen Post über den digitalen Arbeitsplatz „OSKAR“ mit SharePoint, Teams, Yammer und Office 365

Backup for Office 365

Connected WebParts in SharePoint Online

Was kostet eine Azure Function?

OneDrive for Business Dokumente öffnen sich am Client nur mehr read-only!

Formatieren von Ansichten in modernen SharePoint-Listen und -Bibliotheken

SSAS Data Mining – Association Rules

Microsoft Azure Advanced Analytics und Data Science Tools (Teil 1.)

SSAS Data Mining – Clustering

Power BI for mixed reality