Saar-Sprachforscher bringen Computer bei, zwischen den Zeilen zu lesen

23. März 2015


Michael Wiegand von der Universität des Saarlandes arbeitet daran, dass der Computer in Zukunft wie ein Mensch Meinungen, Stimmungen und Gefühle aus Äußerungen herauslesen kann. Gemeinsam mit Forschern der Universität Hildesheim will der Sprachtechnologe dazu beitragen, dass Computer den Sinn von Texten automatisch besser verstehen und nicht von vornherein an Wortwitz oder Sprachspiel scheitern. Hierzu kombinieren sie verschiedene Sprachanalyseverfahren, um den Rechner mit Informationen zu füttern, die hinter Wörtern und Sätzen stecken. Die Forschung wird von der Deutschen Forschungsgemeinschaft (DFG) in Höhe von 500.000 € gefördert, rund die Hälfte davon fließt an die Saar-Universität.

Die Forscher arbeiten mit zwei Sprachen: Englisch und Deutsch. "Für die deutsche Sprache besteht großer Bedarf, weil auf diesem Gebiet noch kaum etwas existiert. Im Englischen gibt es bereits Forschungsergebnisse, die wir mit unserer Arbeit ergänzen wollen", sagt sagt Michael Wiegand. Der promovierte Computerlinguist forscht an der Saar-Uni am Lehrstuhl für Sprach- und Signalverarbeitung von Professor Dietrich Klakow.

Bislang wird in der Forschung bei der sog. "Sentimentanalyse" vor allem auf große Textmengen gesetzt: Zum Beispiel zählen Analyseprogramme Wörter, die mehr verraten: Je nachdem wie häufig etwa "schlecht" oder "traurig" vorkommen, kann der Rechner schätzen, ob es im Text eher positiv oder negativ zugeht. Demgegenüber begeben sich Wiegand und seine Forscherkollegen in ihrem Projekt sozusagen auf "molekulare" Ebene: "Wir schauen auf den einzelnen Satz und die Wörter, konzentrieren uns also auf die feingranulare Analyse. Dort bestimmen wir, wer im Text etwas sagt, das mit Meinung zu tun hat", erklärt Wiegand. So ermitteln die Forscher, ob zum Beispiel mit den gewählten Worten in Wahrheit das Gegenteil gemeint ist und übersetzen es dann so für den Computer, dass er diese Information erkennen und verarbeiten kann.

Ihre Ergebnisse wollen die Sprachtechnologen als lexikalische Ressource – also als eine Art "Wörterbuch" für künftige computerlinguistische Forschung – zur Verfügung stellen.

(Quelle: https://idw-online.de/de/news626293)