Von autonomem Fahren über die Wartungsvorhersage für Maschinen bis zur Früherkennung eines Schlaganfallrisikos – Künstliche Intelligenz bietet enorme Potenziale. Allerdings sind KI-Systeme äußerst rechenintensiv und damit auch energiehungrig. Vor allem bei mobilen Anwendungen wird der Strombedarf deshalb schnell zum limitierenden Faktor. Ein neuartiges Chip-System könnte dies bald ändern. Beim Pilotinnovationswettbewerb »Energieeffiziente KI-Systeme« des BMBF erzielte das Forscher*innenteam von Fraunhofer IIS und der Universität Erlangen-Nürnberg damit einen 1. Platz.

Erfahrungen lernt man am schnellsten und besten anhand von Beispielen – vielen Beispielen. Dies gilt für Menschen ebenso wie für das zufriedenstellende Funktionieren einer Künstlichen Intelligenz. Mit jedem Datensatz, den sie kennenlernt, sammelt sie mehr »Erfahrung« und kann dadurch ihre Erkennungsleistung verbessern. Ein paar Tausend Trainingsrunden müssen es dafür allerdings schon sein. Mindestens. Jede dieser Trainingsrunden verbraucht Energie. Aber auch jeder Einsatz danach, wenn ein trainiertes KI-System einen Datensatz verstehen und bewerten soll. Jedes Mal müssen die Algorithmen eine Vielzahl von Rechenschritten und Analyseroutinen abarbeiten. Dieser »Stromhunger« der KI-Systeme wird schnell zum Problem. Vor allem dann, wenn die Künstliche Intelligenz nicht in der Cloud oder einem Rechenzentrum arbeiten soll, sondern vor Ort im Feld oder auf einem Mobilgerät – direkt an einem Sensor in einem Fahrzeug oder in einer Smartwatch. »Die Beispielanwendung in unserem Projekt Lo3-ML ist ein KI-System zur Erkennung eines Schlaganfallrisikos«, erklärt Dr. Marco Breiling vom Fraunhofer-Institut für Integrierte Schaltungen IIS. Eingebettet in eine Smartwatch könnte das System künftig die gemessenen EKG-Werte von Risikopatient*innen kontinuierlich analysieren und sporadisches Herzflimmern frühzeitig erkennen. 

Die Entwicklung und Alltagstauglichkeit eines solchen Wearable aber setzt nicht nur Funktionalität an sich voraus, sondern auch, dass diese über einen langen Zeitraum zuverlässig gegeben ist. Entscheidend ist es deshalb, dass die Auswertung der EKG-Daten möglichst wenig Energie des Smartwatch-Akkus verbraucht. »Eines der entscheidenden Ziele dieses Projekts war es, alle Systemkomponenten und die gesamte Verarbeitungskette der EKG-Signale in Hinblick auf den Gesamtenergieverbrauch des KI-Systems zu optimieren«, so Breiling. Gleichzeitig aber müsse das Analysesystem natürlich ein gefährliches Vorhofflimmern anhand der EKG-Daten zuverlässig erkennen können und die eingesetzten Systemkomponenten dürfen keine kostspieligen Chips sein. 

Gemeinsam mit Forscher*innen der Friedrich-Alexander-Universität Erlangen-Nürnberg hat das Team um Marco Breiling nun ein KI-Chip-System entwickelt, das nicht nur die EKG-Signale zuverlässig, schnell und besonders energieeffizient analysiert, sondern grundsätzlich auch für die Auswertung verschiedenster Zeitreihensignale verwendet werden kann. Mögliche Einsatzbereiche wären zum Beispiel die Analyse von Signalen eines Vibrationssensors an einem Motor, um einen Verschleiß frühzeitig zu erkennen, oder die Unterscheidung zwischen Sprache und Störgeräuschen in einem Hörgerät.

Fließbandarbeit programmierter Spezialisten 

Die grundlegende Architektur des Chip-Systems gehört zu einem neuen Typus namens neuromorphe Hardware. Die Rechenarbeit übernimmt hierbei nicht mehr - wie bei klassischen Systemen - eine CPU. Vielmehr wird die nötige Leistung verteilt auf eine Vielzahl kleiner Rechenknoten, die - ähnlich wie bei einem menschlichen Gehirn – für die Verarbeitung eines neuronalen Netzes verknüpft sind. Jeder Knoten dieses Netzes besteht aus einer programmierbaren Recheneinheit und übernimmt einen zuvor durch die Programmierung festgelegten, spezifischen Analyseschritt. Eine Gruppe von Knoten sucht beispielsweise gezielt nach Spitzen im EKG-Signal. Eine zweite zählt die Häufigkeit von Abweichungen gegenüber einer unauffälligen EKG-Kurve. Eine weitere bestimmt die Stärke auffälliger Messsequenzen. »Wie bei einem Fließband in der Produktion durchlaufen die auszuwertenden EKG-Daten nacheinander diese Analyseknoten. So erreichen wir Schritt für Schritt, dass jedes Signal umfassend auf alle relevanten Kriterien untersucht wird, um am Ende eine zuverlässige Gesamtbewertung durch die KI vornehmen zu lassen«, erklärt Breiling. Die Vorteile dieser Chip-Architektur liegen nicht nur darin, dass sie für die Auswertung von Zeitreihensignalen mittels der KI-Algorithmen besonders gut geeignet sind. Sie benötigt dafür auch herausragend wenig Energie. Auch eine normale, universelle CPU könnte die einzelnen Analyseschritte nacheinander abarbeiten. »Den allergrößten Teil an Energie würde ein solches System jedoch dafür benötigen, der CPU mitzuteilen, was sie im nächsten Schritt zu tun hat. Unsere verteilten Rechenknoten dagegen wissen das, weil sie von Anfang an dafür - und nur dafür - entwickelt wurden «, betont Breiling. Die Konsequenz: Das Chip-System kommt mit einem Bruchteil an Kontrollbefehlen aus. Ein Großteil an Energie wird gespart.

Das Einmaleins des Einfachen

Aber auch für den noch verbleibenden Energiebedarf, den die einzelnen Rechenknoten für die Signalauswertung benötigen, haben die Forscher*innen eine Methode entwickelt, um weitere Einsparungen möglich zu machen. Sie setzen dabei am Rechenaufwand an, den der Algorithmus benötigt, um die einzelnen Analyseergebnisse zu gewichten. Üblicherweise wird jedes gefundene Analyseergebnis mit einem Gewichtungswert beispielsweise zwischen minus Hundert und plus Hundert multipliziert. Für ihr Rechensystem erlauben die Forscher*innen dagegen lediglich drei Werte: -1, 0 und 1. Entsprechend standardisiert ist die Multiplikation. »Das jeweilige Ergebnis kann jeder Mensch ohne großes Nachdenken nennen. Beim Computer ist es nicht anders, auch er muss dafür keine aufwändige Multiplikationsschaltung bemühen«, so Breiling. Allerdings limitiert die Vorgehensweise einer ternären Gewichtung auch die Aussagekraft der Ergebnisse. Die Zuverlässigkeit der Erkennungsleistung würde sich reduzieren. 

Deshalb haben die Forscher*innen an verschiedenen Möglichkeiten gearbeitet, wie sich dieser Nachteil der stark eingeschränkten Gewichtung ausgleichen lässt. Eine erste Hoffnung, nämlich eine Erhöhung der Zuverlässigkeit der Analyseergebnisse durch die Verwendung von vier statt drei Gewichtungswerten hatte sich allerdings nicht bewährt. Erfolg hatten sie letztlich aber, weil sie die Anzahl der Analyseschritte weiter erhöhten. Jedes EKG-Signal muss nun also etwas mehr Rechenknoten durchlaufen und wird nach zusätzlichen Kriterien, beziehungsweise Subkriterien, analysiert. »Zum Teil geht die Rechenersparnis, die die ternäre Gewichtung bringt, also wieder dadurch verloren, dass zusätzliche Analyseschritte eingeführt werden müssen. In der Gesamtsumme aber realisieren wir durch diese Vorgehensweise eine weitere Energieeinsparung und das vor allem bei gleich hoher Qualität der KI-Ergebnisse«, urteilt Breiling. Damit die ternäre Gewichtung funktioniert, mussten die Forscher*innen aber ganz neue Software-Werkzeuge zum Training des neuronalen Netzes entwickeln, die die Beschränkung auf -1, 0 und 1 kennen und berücksichtigen.

Schlafen spart Energie – bei der Maschine wie beim Menschen

Mit 95 Prozent den höchsten Einsparquotienten erreichte das Projektteam an den Rechenknoten durch einen ebenso simplen wie effektiven Trick: Wenn keine Daten zur Verarbeitung bereitstehen, legen sie die Recheneinheiten einfach schlafen. »Fast dreizehn Sekunden dauert es, bis ein EKG-Datensatz in den Arbeitsspeicher des KI-Chips eingelesen ist. Die eigentliche Datenverarbeitung dagegen erledigt das Rechensystem innerhalb von 24 Millisekunden«, erklärt Breiling. Die Leistung der Recheneinheit wird also nur 0,2 Prozent der gesamten Zeit benötigt. Wäre sie auch die übrige Zeit rechenbereit, verbraucht sie auch in dieser Leerlaufzeit relativ viel Energie. Für ihr energiesparendes Chip-System entwickelten die Forscher*innen daher ein Konzept, das die Datenverarbeitung während des Datensammelns in einen Schlafmodus versetzt. Die auszuwertenden Daten laden sie dazu in einen nicht-flüchtigen Arbeitsspeicher. Auf dieser RRAM-Einheit (Resistive RAM) stehen sie dann sofort bereit, wenn das System die Recheneinheit erweckt, um Analysen durchzuführen. Im Vergleich zu einem Always-on-System spart diese Lösung bei der Verarbeitung der Daten 95 Prozent Energieverbrauch ein.

Deutsche Meisterschaft der Energiespar-KIs

Das Projekt »Lo3-ML – Low-Power Low-Memory Low-Cost EKG-Signalanalyse mit ML-Algorithmen« führte das Forscher*innenteam im Rahmen des Pilotinnovationswettbewerbs »Energieeffizientes KI-System« durch. Für den vom Bundesministerium für Bildung und Forschung BMBF initiierten Forscher*innenwettstreit hatten sich insgesamt 27 Teams mit Ideen für energiesparenden KI-Systeme zur Auswertung von EKG-Daten beworben. Elf davon erhielten jeweils 400.000 Euro, um ihr Konzept als Demonstrator umzusetzen. Die vier besten Technologielösungen erhalten vom BMBF die Möglichkeit, für ein Nachfolgeprojekt eine Förderung über 1 Million Euro zu erhalten, um ihren Wettbewerbsbeitrag mit Anwendungspartnern weiterzuentwickeln und als Hard- und Softwaresystem prototypisch umzusetzen.

Einen der ersten Preise erhielt das Gemeinschaftsteam von Fraunhofer IIS und der Universität Erlangen-Nürnberg. Einen weiteren ersten Preis erzielten die Wissenschaftler*innen vom Fraunhofer-Institut für Techno- und Wirtschaftsmathematik ITWM. In einem gemeinsamen Team mit Forscher*innen der TU Kaiserslautern entwickelten sie eine energieoptimierte Architektur für Field Programmable Gate Arrays (FPGA).

(stw)

Keine Kommentare vorhanden

Das Kommentarfeld darf nicht leer sein
Bitte einen Namen angeben
Bitte valide E-Mail-Adresse angeben
Sicherheits-Check:
Zwei + = 10
Bitte Zahl eintragen!
image description
Experte
Alle anzeigen
Dr.  Marco Breiling
  • Fraunhofer-Institut für Integrierte Schaltungen IIS
Weitere Artikel
Alle anzeigen
Digitale Diagnostik
Tagespflege mit System
Mein Gesundheitsnetz. Meine Datenhoheit.
Veranstaltungen
Alle anzeigen
Stellenangebote
Alle anzeigen