Veranstaltungen

Lernlabor Cybersicherheit: Textforensik mit NLP und maschinellem Lernen

Darmstadt

Ein Großteil der weltweit verfügbaren Informationen liegt in Textform vor. Das Suchen nach relevanten Informationen im Text, um z.B. Texte nach Themen oder Stimmungen einzuordnen oder den Autor zu identifizieren, ist für viele Anwendungen wichtig.


Herausforderungen hierbei sind Unstrukturiertheit von Texten oder das Fehlen von Metadaten. Darüber hinaus existiert das Risiko, dass Texte unentdeckt kopiert oder manipuliert werden können, da sie praktisch von jedermann ohne Fachkenntnisse oder spezielle Werkzeuge vervielfältigt oder verändert werden können – noch einfacher als bei Digitalfotos, Videos oder Audiodaten.

Um trotzdem relevante Informationen aus Texten abzuleiten, lernen Sie in unserem Seminar Methoden der Natürlichen Sprachverarbeitung (NLP) und des maschinellen Lernens (ML) kennen. Der Kurs kombiniert Linguistik und Informatik. Ihnen werden Methoden der digitalen Textforensik vermittelt, mit Schwerpunkt auf NLP und ML. Sie lernen, wie Textdaten maschinenlesbar bereinigt und strukturiert und wie relevante Merkmale aus den verarbeiteten Texten gewonnen werden können.

Sie lernen verschiedene ML-Methoden kennen, etwa zum automatischen Klassifizieren von Texten oder zum Herauslesen von Stimmungen und Meinungen im Text. Ebenso lernen Sie Evaluierungstechniken kennen, mit denen Sie die Güte der ML-Verfahren messen können. Diese Kenntnisse werden Sie in praktischen Übungen am PC vertiefen, etwa mit den Werkzeugen NLTK, Spacy oder Pattern.

Mehr Informationen zu Programm, Inhalt und Anmeldung finden Sie hier.

Veranstaltungsort:
Darmstadt
Fraunhofer-Institut für Sichere Informationstechnologie SIT
Rheinstr. 75
64295 Darmstadt
Veranstalter:
Fraunhofer-Institut für Sichere Informationstechnologie SIT
Tags:
image description