Europa könnte innerhalb von fünf Jahren 629 Millionen Stunden Stau vermeiden, den Energieverbrauch um 16 Prozent senken und ein Marktvolumen von 325 Milliarden Euro zusätzlich generieren. Dies sind Ergebnisse der Studie »Mehrwert durch Open Data«, in der Capgemini Consulting das Potenzial frei nutzbarer Daten öffentlicher Institutionen analysiert hat. Um den Zugang zu öffentlichen Daten zu erleichtern, hat die Europäische Kommission deshalb das European Data Portal ins Leben gerufen. Über den Stand des Projekts berichtet Benjamin Dittwald vom Fraunhofer-Institut für offene Kommunikationssysteme FOKUS.

Hallo Herr Dittwald. Das European Data Portal hat sich zum Ziel gesetzt, die Daten, die Behörden und öffentliche Einrichtungen in ganz Europa für jedermann offen zur Verfügung stellen, besser zugänglich zu machen. Die Daten aber sind veröffentlicht und über die Webdienste der Einrichtungen abrufbar. Wozu also noch ein zusätzliches Datenportal?

Es geht – im Unterschied zu anderen Angeboten – um ein europaweites Datenportal. Nehmen wir an, Sie suchen nach Daten zum öffentlichen Nahverkehr in europäischen Städten. Bisher mussten Sie dafür auf den einzelnen Länderportalen – soweit es solche überhaupt schon gibt – oder sogar bei den einzelnen Behörden und Einrichtungen jeder einzelnen Kommune recherchieren. Nur so konnten Sie herausfinden, ob und welche ÖPNV-Daten Sie dort abrufen und nutzen können. Und weil die Behörden in Europa in 24 verschiedenen Sprachen arbeiten, war die Suche nur mit einem sehr großen Aufwand zu bewerkstelligen. Dieses Problem wird mit der Einrichtung des Europäischen Datenportals behoben. Es stellt für jedermann zugängliche Daten zentral zur Verfügung. Das Portal umfasst die Informationen aus insgesamt 39 Staaten – den 28 Ländern der EU und weiteren angrenzenden Nationen. Das Angebot ist in Form eines Registers aufgebaut, das Titel, Kurzbeschreibung, weitere Metadaten und den Weblink zu den einzelnen Datenquellen enthält. Aufgeteilt sind die Informationen in 13 Themen, die von Statistiken zu Bevölkerung und Gesellschaft über Gesundheit, Bildung und Recht bis zu Veröffentlichungen aus Wissenschaft und Technik reichen.

... aber das Problem der Vielsprachlichkeit wird dadurch nicht gelöst?

Für alle der derzeit gelisteten 765.000 Datensätze und für alle künftigen gilt: Auf den Servern des Datenportals werden Titel und Metadaten in allen 24 Sprachen gespeichert. Auf dem europäischen Datenportal gibt es also keine Sprachbarrieren mehr. Für die europaweite Suche nach Informationen hat dies einen entscheidenden Vorteil: Beispielsweise lassen sich mit dem Begriff »Straßenbahn« alle verfügbaren Datensätze auflisten, die den Begriff in einer der 24 Ländersprachen thematisieren. Zur Bereitstellung der Übersetzungen haben wir in das Datenportal ein automatisiertes Verfahren integriert. Wir nutzen dafür den von der Europäischen Kommission eingerichteten Übersetzungsdienst MT@EC. MT@EC ist vergleichsweise neu und kann von allen öffentlichen Einrichtungen auf EU-Ebene verwendet werden, um Texte in alle 24 offiziellen Landessprachen der EU maschinell zu übertragen. Unser Portal ist damit auch der bislang umfassendste Anwendungsfall für dieses Tool und liefert dem Entwicklerteam wichtige Erkenntnisse zur Verbesserung der Algorithmen.

Die am Fraunhofer FOKUS entwickelte Harvester-Mechanismen prüfen kontinuierlich, ob es auf den angebundenen Datenportalen Neuveröffentlichungen gibt. Bild: Fraunhofer FOKUS

Bevor die Datenangebote aber übersetzt und genutzt werden können, müssen sie erst einmal in die Kataloge des Europäischen Datenportals gelangen ...

... und auch dies funktioniert weitgehend automatisiert. Am Fraunhofer FOKUS haben wir dafür spezielle, leistungsfähige Harvesting-Mechanismen entwickelt, die kontinuierlich prüfen, ob neue Daten veröffentlicht wurden oder ob es bei den bestehenden Einträgen Änderungen gibt. Die Anbieter der offenen Daten müssen dafür lediglich die Schnittstelle ihres Portals mit der europaweiten Plattform verknüpfen. Ab dann sammeln unsere Systeme die Informationen zu den veröffentlichten Datensätzen ein und fügen sie den Katalogen hinzu. Derzeit bestücken unsere Erntesysteme die Plattform mit den Informationen von mehr als 70 Datenportalen der einzelnen Länder sowie verschiedener Behörden und wissenschaftlicher Einrichtungen.

Gibt es rund um das Projekt auch Unterstützung für neue, potentielle Datenlieferanten oder für Nutzer, die sich für eine Weiterverwendung offener Daten interessieren?

Das Open Data Prinzip weiter bekannt zu machen und deren Verwendung zur Generierung von Mehrwert voranzutreiben, ist sogar eines der Kernziele des Projekts. Open Data ist ja kein Selbstzweck, sondern für beinahe jede staatliche Organisation ein nützliches Instrument, um ihre strategischen Ziele zu erreichen. Für Führungskräfte des öffentlichen Sektors bietet Fraunhofer FOKUS dieses Jahr beispielsweise einen Kurs »Strategische Bereitstellung offener Verwaltungsdaten« an.

Die Daten-Harvester von Fraunhofer FOKUS integrieren sowohl die Metadaten aller neu veröffentlichten Datensätze, wie jede Änderung bereits aufgenommener Datensätze in die Kataloge des Europäischen Datenportals. Bild: Fraunhofer FOKUS

Das Europäische Datenportal selbst bietet weit mehr als den Zugang zu den Daten. Hier können sich Interessierte umfassend zur Thematik »Open Data« informieren. Tutorials und E-Learning-Module erklären, in welchen Formaten und wie die Daten bereitgestellt werden können. Für Anbieter gibt es zudem einen Online-Coach, mit dem nach ihren Wünschen und Anforderungen eine passende Lizenz für ihre Daten erstellt werden. Für die Suche nach Daten schließlich steht erstens ein sehr einfach und intuitiv verwendbares Verfahren bereit. Zweitens sind auf dem Portal auch API-Schnittstellen verfügbar und wir stellen jeden Datensatz auch als Linked Data bereit. Dazu überführen wir alle Metadaten in das Europäische Format DCAT-AP. Dieser Standard definiert einen für alle europäischen Staaten einheitliche Regeln und Kataloge zur Bereitstellung von Metadaten öffentlicher Einrichtungen. Datenspezialisten haben so die Möglichkeit auch komplexe Auswertungen des Datenbestandes zu generieren und durchzuführen.

(stw)

Weitere Informationen

Keine Kommentare vorhanden

Das Kommentarfeld darf nicht leer sein
Bitte einen Namen angeben
Bitte valide E-Mail-Adresse angeben
Sicherheits-Check:
Neun + = 9
Bitte Zahl eintragen!
image description