Dem Internet sei Dank. Nie war es so einfach, sich über die Entwicklung von Technologien und Trends weltweit zu informieren. Doch ist das wirklich so? Die Flut an verfügbaren Dokumenten überfordert die Lese- und Analysekapazitäten, die Unternehmen, Institute und Einrichtungen dafür aufwenden können. Eine Forschergruppe will nun Trendvorhersagen auf Knopfdruck liefern: Semantic Web Technologien durchsuchen Webseiten, News-Feeds oder Social-Media-Kanäle und halten Ausschau nach dem, was wichtig sein könnte.

Search for: »Elektrobus«. Mehrere Zehntausend Suchergebnisse. Allein in den Google-News. Nur für ein Stichwort und nur in den Nachrichten-Feeds in deutscher Sprache. Wer über ein Thema weltweit auf dem Laufenden bleiben will – wie zum Beispiel über die Entwicklung der Elektromobilität im öffentlichen Nahverkehr von Städten, Regionen und Ländern – hat ein Informationsproblem. Ein Massenproblem. Und das nicht nur wegen der Vielzahl verfügbarer Informationsquellen und der dort veröffentlichten Dokumente. Um aus all diesem Input solide Trends zur Technologieentwicklung und zu Marktveränderungen ableiten zu können, müsste jede gefundene Nachricht auch über Sprachbarrieren hinweg gesammelt, inhaltlich analysiert, zugeortet und bewertet werden. Eine Aufgabenstellung, die selbst mit hohem Zeit- und Personaleinsatz weder Industrieunternehmen noch Marktforscher und Trendscouts umfassend bewerkstelligen könnten. Trotzdem aber will der Nürnberger Energieversorger »N-ERGIE« frühzeitig und laufend aktuell zu Entwicklung und Einsatz von Elektrobussen weltweit informiert sein und bleiben. Und vermutlich nicht nur er. Das Unternehmen aber ist eines der ersten, die dafür Methoden zur semantischen Medienanalyse nutzen, die von der »Forschungsgruppe Future Engineering« entwickelt wurden. In der 2018 gegründeten Forschungsgruppe arbeiten Wissenschaftlerinnen und Wissenschaftler der Fraunhofer-Arbeitsgruppe für Supply Chain Services SCS am Fraunhofer-Institut für Integrierte Schaltungen IIS und der Technischen Hochschule Nürnberg Simon Ohm zusammen. Ihr gemeinsames Ziel ist es, hochautomatisierte Systeme zur Wissensgenerierung und Trendanalyse zu entwickeln und für Unternehmen und die Marktforschung zur Verfügung zu stellen.

Weltweite Dokumentensammlung auf Knopfdruck

»Jede Woche wächst unsere Wissensdatenbank um bis zu 10.000 Meldungen, in denen es um das Thema Elektromobilität geht«, sagt Prof. Ralph Blum vom Fraunhofer IIS. Die Suche nach den relevanten Stichwörtern und semantischen Zusammenhängen übernehmen mehrere frei verfügbare Semantic Web Tools. Das Forscherteam hat ihren Einsatz so kombiniert und automatisiert, dass sie inzwischen mehr als 1.400 verschiedene Datenquellen kontinuierlich durchforsten. Dazu zählen Google und RSS-Feeds ebenso wie einzelne Unternehmenswebseiten, Social-Media-Kanäle, lokale und regionale Informationsplattformen sowie Datenbanken mit wissenschaftlichen Veröffentlichungen oder Patentanmeldungen. Die Sprache in der die einzelnen Artikel oder Dokumente veröffentlicht sind, spielt dabei keine Rolle. Um die Sprachhürden zu überwinden haben die Forscherinnen und Forscher eine ebenso einfache wie effektive Methode gewählt. Eine vorgeschaltete Übersetzungsroutine überträgt jede neue Meldung auf den erschlossenen Datenquellen automatisch ins Englische. Alle weiteren Bearbeitungsschritte wie Stichwortsuche, Annotation und semantische Textanalysen lassen sich danach einheitlich auf Englisch durchführen. »Die Leistung der Roboterübersetzungen reicht nahezu immer aus, um relevante Sachverhalte erkennen und bewerten zu können«, so Blum. Dies hätten unter anderem Stichprobenvergleiche mit händischen Übersetzungen von Meldungen in Spanisch oder Mandarin gezeigt.

Über Wissensgraphen zur Trendanalyse

Alle Dokumente, die im Zuge der automatisierten Suche gefunden werden, speichert das Forscherteam in einer Datenbank als Wissensbasis für die weiteren Analyseschritte ab. Mehr als 400.000 Datensätze mit relevanten Meldungen allein zum Thema Elektromobilität hat die Forschungsgruppe so bereits gesammelt, verschlagwortet und annotiert. Und natürlich sei dies nur eines der Themenfelder, nach denen ihre Systeme im Auftrag von Firmen und Forschungseinrichtungen Ausschau halten. »Bereits jetzt können wir den Unternehmen und vor allem Experten in der Markt- und Trendforschung einen erheblichen Mehrwert bieten«, sagt Blum. Denn gezielte Abfragen in den von seinem Team aufgebauten Datenbanken erleichtern das Auffinden relevanter Meldungen erheblich. Darüber hinaus sind die Daten so aufbereitet, dass Business Intelligence Tools wie Microsoft Power BI umfangreiche Analysen des gesammelten Themenwissens liefern können. Dies kann zum Beispiel eine Visualisierung der regionalen Verteilung von Meldungen zum Praxiseinsatz von Elektrobussen sein oder eine Timeline wissenschaftlicher Veröffentlichungen zur Technik der Fahrzeuge.

Für das Forscherteam ist mit diesem Angebot allerdings nur ein erstes Etappenziel erreicht. »Was die semantische Durchdringung der Text angeht, sehen wir uns derzeit noch eher am Anfang als am Ziel«, betont Blum. Aktuell entwickelt und erprobt sein Team neue Verfahren, um den Entwicklungsprozess einer Technologie anhand der Meldungen abzubilden und zu bewerten. Das Team nutzt dafür sogenannte Wissensgraphen um ein umfassendes Gesamtbild zum Wissenstand zu gewinnen. Dabei werden die unterschiedlichen Informationen zu sogenannten »RDF-Tripeln« systematisch miteinander verknüpft. Jede semantische Aussage ist dadurch über jeweils zwei weitere Entitäten an Konzepte der realen, gegenständlichen Welt gebunden. Anhand der kontinuierlichen Wissensexploration aus der Abfolge der gesammelten Meldungen lässt sich so beispielsweise die Entwicklung einer neuen Batterietechnologie von der Erfindung bis zum Alltagseinsatz in einem Elektrobus nachvollziehen beziehungsweise das aktuell erreichte Entwicklungsstadium auf dem Weg dorthin eingrenzen. Noch sind solche automatisierten Trend- und Marktanalysen in der Erprobungsphase. »Wir testen die Leistungsfähigkeit unserer Systeme derzeit anhand konkreter Fragestellungen unserer Kunden und in enger Zusammenarbeit mit Experten aus den zugrunde liegenden Fachgebieten«, so Blum. Auf der Agenda seines Teams steht dabei nicht nur eine schrittweise Verbesserung der semantischen Analyseleistung der Systeme. Ergänzend dazu wollen die Forscher zusätzliche Methoden entwickeln, die es ihnen erlauben, die Qualität ihrer automatisiert erzielten Ergebnisse zu messen.

(stw)

Keine Kommentare vorhanden

Das Kommentarfeld darf nicht leer sein
Bitte einen Namen angeben
Bitte valide E-Mail-Adresse angeben
Sicherheits-Check:
Fünf + = 7
Bitte Zahl eintragen!
image description
Weitere Artikel
Alle anzeigen
Gebärden sprechen lassen
Digitaler Durchblick im Schilderwald
Lärm: Ein unerhörtes Politikum?
Veranstaltungen
Alle anzeigen
Stellenangebote
Alle anzeigen