Computerbasierte Verfahren zur akustischen Ereigniserkennung ermöglichen ganz neue Sicherheitsanwendungen im Auto: »Ereigniserkenner« werden darauf trainiert, in Echtzeit akustische Ereignisse von Hintergrundgeräuschen zu trennen und sie zu klassifizieren. So können die Fahrenden auf Geräusche aufmerksam gemacht werden, die auf eine Gefahr hindeuten könnten. Eine verbesserte Sprachsteuerung ermöglicht zudem das Steuern verschiedener Fahrzeugfunktionen auch außerhalb des Autos. Die Detektionsverfahren, die auf Erkennungsalgorithmen basieren, funktionieren ähnlich wie das menschliche Gehör

Das Radio läuft, der Regen prasselt aufs Autodach, Fahrer und Beifahrer unterhalten sich angeregt – da ist es passiert: Der Fahrer bemerkt die Sirenen erst, als der Rettungswagen direkt hinter ihm auftaucht. Die verzögerte Reaktion behindert nicht nur die Arbeit der Rettungskräfte, sondern kann im schlimmsten Fall auch gefährlich für die Verkehrsteilnehmer werden. Doch was wäre, wenn in dieser Situation das Auto die Sirenen vor dem Fahrer gehört und ihn darauf aufmerksam gemacht hätte? Die Forscher der Oldenburger Projektgruppe Hör-, Sprach- und Audiotechnologie am Fraunhofer-Institut für Digitale Medientechnologie IDMT entwickeln Technologien, die eine akustische Ereigniserkennung durch Fahrzeuge möglich machen. Dabei orientieren sie sich am menschlichen Gehör. »Bei bekannten Geräuschen brauchen wir nicht einmal hinsehen, um zu wissen, was passiert oder wie wir reagieren müssen«, sagt Stefan Goetze, Leiter der Arbeitsgruppe »Audiosystemtechnik für assistive Systeme« am Fraunhofer IDMT. »Wir versuchen, Computern diese Art von Hören und die Analyse des Gehörten beizubringen.« Die Wissenschaftler, die mit Automobilherstellern zusammenarbeiten, entwickeln Erkennersysteme, die verschiedene Geräusche im Straßenverkehr wie zum Beispiel Sirenentöne oder Bremsenquietschen automatisch wahrnehmen können. Die Signalaufnahme erfolgt über Luftschallmikrofone und Kontaktmikrofone, die am Fahrzeug angebracht und mit dem Erkennersystem verbunden werden. Sie dienen nicht nur dem akustischem Erfassen der Fahrzeug-Umwelt, sondern ermöglichen es letztlich auch, den Zustand des Fahrzeugs herauszuhören. So können zum Beispiel Defekte oder Unregelmäßigkeiten der Betriebsgeräusche erlauscht werden. Selbst eine Analyse der Straßenoberfläche durch Kontaktmikrofone ist denkbar, da über akustische Merkmale auch auf die Art des Straßenbelags geschlossen werden kann.

Ein Vorteil eines Erkennersystems besteht also nicht nur darin, dass es im Gegensatz zum Menschen nicht abgelenkt werden kann. Durch die Positionen der Mikrofone etwa direkt im Radkasten oder an der Radaufhängung nimmt es auch Geräusche wahr, die der oder die Fahrende in der Kabine niemals hören könnte. Kommt es dann zu akustischen Auffälligkeiten, können die Insassen beispielsweise durch ein Warnsystem oder durch die Anbindung des Erkennersystems an das Audiowiedergabesystem im Fahrzeug informiert werden.

Die Kombination aus Außenmikrofonen und Erkennersystem ermöglicht außerdem noch weitere Funktionen: Die Forscher arbeiten derzeit auch an einer Sprachsteuerung, mit der bestimmte Fahrzeugfunktionen außerhalb des Wagens bedient werden können. Beispielsweise ein akustisches Verschließen oder erneutes Öffnen des Fahrzeugs. Für derlei Sicherheits- und Komfortfunktionen reichen Spracherkennungssysteme wie wir sie bislang kennen in der Regel nicht aus. Denn das richtige Interpretieren von Sprachbefehlen etwa auf einem Parkplatz ist deshalb so problematisch, weil zahlreiche Störgeräusche hinzukommen und der Geräuschpegel je nach Standort unspezifischer und höher ist als in der Kabine. »Wir testen am Institut deshalb mehrere Methoden für eine zuverlässige Sprachsteuerung außerhalb des Fahrzeugs. Eine Möglichkeit ist, Störgeräusche durch die Signalverarbeitung herauszufiltern. Zudem arbeiten wir an Ansätzen, um mit dem Erkenner Geräuscharten zu trainieren, so dass er sie als wichtig interpretiert oder ignoriert«, erläutert Goetze. Um dies zu erreichen, werden Sprachaufnahmen an verschiedenen Orten gemacht, etwa an einer vielbefahrenen Straße oder neben einer Bahntrasse. Diese Methode hat den Vorteil, dass sie nicht nur für die Spracherkennung sondern auch für die akustische Ereigniserkennung genutzt werden kann. Für die Spracherkennung lernt das System nicht einzelne Worte, sondern Phoneme – also die Laute, aus denen sich die Sprache zusammensetzt. Ein Phonem ist die kleinste bedeutungsunterscheidende sprachliche Einheit. So unterschieden sich zum Beispiel die Wörter »Bein« und »Pein« nur durch die Phoneme /b/ und /p/ voneinander. »Einem System alle Wörter beizubringen, die es in einer Sprache gibt, wäre zu viel. Das kann ein Rechner nicht leisten«, so Goetze. Die Anzahl der Phoneme in der deutschen Sprache hingegen ist auf etwa 40 begrenzt. Um sie dem System beizubringen, müssen sie von verschiedenen Personen unterschiedlichen Geschlechts und in verschiedenen Dialekten eingesprochen werden. Nur so ist es dem Rechner möglich, sie zuverlässig zuzuordnen. Bei der Spracherkennung durchsucht das System dann den Speicher nach einem entsprechenden Muster und gleicht ab, wozu das Gehörte statistisch am besten passt. »Genauso funktioniert es mit Geräuschen für die Ereigniserkennung, die dem Erkenner in einem Trainingsprozess beigebracht werden. Die Algorithmen der Erkennersysteme funktionieren ähnlich wie das menschliche Gehirn. Während der Mensch allerdings mehrere Jahre für sein Sprachverständnis trainieren muss, brauchen sie nur ein paar Tage«, sagt Goetze. Weil viele Fahrzeuge schon heute mit Erkennern ausgestattet sind, mit denen beispielsweise die Infotainmentsysteme bedient werden, ist die Erweiterung um Mikrofone rund um das Fahrzeug ohne allzu großen Aufwand möglich. Auf diese Weise würde ein Plus an Sicherheit und Komfort ermöglicht. (mdi)

Keine Kommentare vorhanden

Das Kommentarfeld darf nicht leer sein
Bitte einen Namen angeben
Bitte valide E-Mail-Adresse angeben
Sicherheits-Check:
Fünf + = 10
Bitte Zahl eintragen!
image description
Experte
Alle anzeigen
Dr. Stefan Goetze
  • Fraunhofer-Institut für Digitale Medientechnologie IDMT
Kontakt für die Medien: Christian Colmer
  • Fraunhofer-Institut für Digitale Medientechnologie IDMT - Oldenburg
Weitere Artikel
Alle anzeigen
Audiosignale gekonnt optimiert
Expo 2020 in Dubai
Klingt einfach, und besser
Stellenangebote
Alle anzeigen