Wie Wissensgraphen die Kommunikation in der Wissenschaft verändern können

Im Interview: Drei Fragen an Dr. Markus Stocker zum Open Research Knowledge Graph (ORKG)

Dr. Markus Stocker leitet an der TIB Leibniz-Informationszentrum Technik und Naturwissenschaften die Nachwuchsforschungsgruppe „Knowledge Infrastructures“, wo er sich mit dem Open Research Knowledge Graph beschäftigt.

Was ist eigentlich ein Open Research Knowledge Graph, auch Wissensgraph genannt, – kurz und verständlich erklärt?

Der Open Research Knowledge Graph ist ein Wissensgraph, der im Besonderen wissenschaftliche Information, die in der wissenschaftlichen Literatur veröffentlicht und kommuniziert wird, enthält – und zwar so, dass die Information maschinenlesbar ist. Maschinenlesbarkeit ist der zentrale Aspekt, denn in der Form wie heute wissenschaftliche Information kommuniziert wird – mittels natürlicher Sprache, Daten in Tabellen und Bildern als digitale PDF-Dokumente –, unterstützen uns Maschinen in der Informationssuche und -exploration nur sehr bedingt.

Versuchen Sie mal in Google Scholar nach wissenschaftlichen Artikeln zu suchen in denen hochsignifikante statistische Hypothesentests mit bestimmten Variablen und Stichprobengrößen veröffentlicht wurden. Google Scholar und andere Suchmaschinen können solche Fragen nicht gut genug beantworten, weil die dafür benötigte Informationsbasis den Maschinen nur bedingt zugänglich ist.

Der ORKG setzt sich zum Ziel, mehr wissenschaftliche Information Maschinen besser zugänglich zu machen, und setzt somit neue Möglichkeiten und Maßstäbe für die Wissenschaftskommunikation im 21. Jahrhundert.

Eine Revolution in der Wissenschaft – das ist etwas, das im Zusammenhang mit Wissensgraphen immer wieder zu hören ist. Wie genau könnten Wissensgraphen den Zugang zu Wissen verändern?

Indem Wissensgraphen wissenschaftliche Information strukturiert und maschinenlesbar darstellen und diese nicht nur Menschen, sondern auch Maschinen verbessert zugänglich und interpretierbar machen, kann man sicherlich von einer „Revolution in der Wissenschaft“ sprechen, zumindest in der Wissenschaftskommunikation. Schließlich hat sich in der Form, wie Wissenschaft kommuniziert wird über die Jahrhunderte grundsätzlich wenig getan. Natürlich sind die Dokumente heute digital und Informationssysteme ermöglichen die Volltextsuche.

Trotzdem: Die ausschließliche Präsentation wissenschaftlicher Information als Dokument mittels Text, grafisch dargestellter Tabellen und Bildern ist im Zeitalter moderner Informationsinfrastrukturen unbefriedigend. Damit behaupte ich nicht, dass der Artikel in konventioneller Form verschwinden wird oder soll. Letztlich ist es für uns Menschen oft ein Genuss, gute Artikel bei einem feinen Glas Rotwein zu lesen. Das soll auch weiterhin so möglich sein. Gemeint ist damit, dass mehr Inhalte verbessert Maschinen zugänglich gemacht werden sollen, damit wir die guten Artikel einfacher finden und die darin enthaltene Information vereinfacht verarbeiten können. Wissensgraphen unterstützen nicht nur präzisere Suche und die Formulierung und Ausführung komplexerer Anfragen. Es werden auch neue Explorationsformen ermöglicht, zum Beispiel visuelle Navigation wissenschaftlicher Literatur entsprechend semantisch ähnlichen oder anderswie verknüpften Inhalten.

Zugang zu Wissen ist in einem Wissensgraphen nicht auf der Ebene des Artikels, sondern auf der Granularität der darin enthaltenen Inhalte, möglicherweise sogar einzelne Sätze die das Problem, die Methoden und Materialien oder wichtige Resultate schildern. Wissensgraphen ermöglichen, Inhalte flexibel mittels für Mensch und Maschine sinnvoller Relationen zu anderen Inhalten oder Kontextinformation (wie bibliographische Metadaten) zu verknüpfen. Interessant ist weiterhin auch, inwiefern solche Informationssysteme es ermöglichen, den Stand der Wissenschaft vereinfacht zu erforschen, möglicherweise sogar wie sich der Stand einer Fragestellung oder eines Problems in einer Disziplin über Jahrzehnte entwickelt hat. Möglichkeiten gibt es viele. Im Wesentlichen geht es darum, die Wissenschaftskommunikation ins 21. Jahrhundert zu befördern indem auch hier modernste Informationstechnologien zur Anwendung kommen.

Die TIB beschäftigt sich intensiv mit dem Thema Wissensgraph. Wie ist der aktuelle Forschungsstand und woran arbeiten Sie momentan genau?

Das Thema Wissensgraph muss man in der Geschichte und Entwicklung des „semantischen Web“ sehen und verstehen, zumindest aus Sicht der Forschung und Entwicklung an der TIB. Das Thema und somit auch der aktuelle Forschungsstand wird mehr oder weniger von der gleichen Community getrieben, vielleicht mit der Ausnahme, dass mit Google und anderen größeren Playern über Wissensgraphen nun auch hier Prinzipien und zum Teil Technologien zur Anwendung kommen, die ursprünglich im semantischen Web verankert sind.

Einige Mitarbeiter der Forschung und Entwicklung an der TIB, insbesondere auch in Führungsrollen, haben ihre wissenschaftliche Karriere in diesem Forschungsfeld aufgebaut und es ist somit naheliegend, dass die TIB sich mit dem Thema Wissensgraph, in Wissenschaft wie auch Industrie, intensiv beschäftigt. Indem die Nachwuchsforschergruppe „Knowledge Infrastructures“ die Anwendung wissensbasierter Systeme in Wissensinfrastrukturen für die Wissenschaft erforscht, leistet die Gruppe unter anderem auch einen wesentlichen Beitrag zur Realisierung der ORKG-Vision. Wissensinfrastrukturen sind Netzwerke bestehend aus Menschen (zum Beispiel Wissenschaftlerinnen, Datenkuratoren), Artefakten (zum Beispiel Daten, Softwaresysteme, Dokumente) und Institutionen (zum Beispiel Forschungsinfrastrukturen), die Wissen gewinnen, verwalten und teilen.

Mit Fokus auf der Wissenschaft arbeitet die Nachwuchsforschergruppe an der nächsten Generation Artefakte (sprich technische Systeme) und deren Fähigkeit, Menschen in der Wissensgewinnung und -verwaltung zu unterstützen. Dabei verankern wir unsere Arbeit im Forschungslebenszyklus und entwickeln Konzepte, Methoden, Architekturen und Implementierungen, die aufzeigen, wie technische Systeme die insbesondere im Forschungsdatenlebenszyklus und in der Wissenschaftskommunikation zur Anwendung kommen, zukünftig vermehrt wissensbasiert sein werden. Dabei spielen semantische Technologien und Wissensgraphen eine Rolle, da diese es ermöglichen, die Bedeutung und Interpretation von Daten maschinenlesbar darzustellen.

Indem die Nachwuchsforschergruppe erforscht, wie solche Technologien in der Datenanalyse, in der Wissenschaftskommunikation, in virtuellen Forschungsumgebungen und letztlich in wissenschaftliche soziotechnische Systeme integriert werden können, ist die Gruppe klar interdisziplinär unterwegs und befasst sich nicht nur mit Informationswissenschaftlichen Fragestellungen, sondern knüpft auch an Forschung im Bereich Wissenschafts- und Technologiestudien (zum Beispiel Epistemologie in Wissensinfrastrukturen) und arbeitet eng mit Forschungsgemeinschaften sowie Wissenschaftlerinnen und Wissenschaftlern zusammen, insbesondere in der Anforderungsanalyse und in der Einbettung von Technologie in realen Anwendungen.

TIB-Positionspapier zu Open Research Knowledge Graph

In dem Positionspapier „Towards an Open Research Knowledge Graph“ geht es um die Entwicklung vom dokumentenzentrierten Wissensaustausch hin zu wissensbasierten Informationsflüssen. Trotz eines deutlich verbesserten digitalen Zugangs zu wissenschaftlichen Publikationen in den vergangenen Jahrzehnten erfolgt der Wissensaustausch  heute immer noch primär dokumentenbasiert: Wissenschaftlerinnen und Wissenschaftler veröffentlichen Artikel, die in Online- oder Printmedien als Textdokumente erscheinen.

Die aktuellen Entwicklungen in den Bereichen der Wissensrepräsentation, der semantischen Suche, der Mensch-Maschine-Interaktion, der natürlichen Sprachverarbeitung und der künstlichen Intelligenz ermöglichen es jedoch, das bislang vorherrschende Paradigma des dokumentenzentrierten Wissensaustauschs zu überdenken und Wissen durch Wissensgraphen zu präsentieren. Die TIB verfolgt mit ihrem Positionspapier das Ziel, Diskussionen über Anforderungen, Design-Entscheidungen und ein realisierbares Produkt für eine Open-Research-Knowledge-Graph-Infrastruktur zu erleichtern und strebt an, gemeinsam mit Partnern eine entsprechende Infrastruktur zu entwickeln.

Auer, Sören; Blümel, Ina; Ewerth, Ralph; Garatzogianni, Alexandra; Heller, Lambert; Hoppe, Anett; Kasprzik, Anna; Koepler, Oliver; Nejdl, Wolfgang; Plank, Margret; Sens, Irina; Stocker, Markus; Tullney, Marco; Vidal, Maria-Esther; van Wezenbeek, Wilma (2018): Towards an Open Research Knowledge Graph. https://doi.org/10.5281/zenodo.1157185

Mehr zum Open Research Knowledge Graph: http://orkg.org