Harold Treysse

Privat
13407, Berlin
08.10.2012

Sprachanalyse Zukunft oder Wirklichkeit, Fluch oder Segen?

Wikipedia führt unter dem Begriff Sprachanalyse aus:

Sprachanalyse ist einerseits ein Fachbegriff aus der Sprachwissenschaft. Dort bezeichnet er die inhaltliche (Semantik) und formale (Syntaktik) Untersuchung eines Textes nach dem Charakter der verwendeten Sprachmittel. Andererseits wird “Sprachanalyse” in unterschiedlichem Sinn in der Philosophie verwendet, etwa sehr allgemein für die Analyse natürlicher Sprache überhaupt als ein Teilprojekt neben anderen Aufgabenbereichen oder spezifischer für Forschungsprogramme, die vorsehen, Philosophie zu betreiben als Analyse der Alltagssprache.”
http://de.wikipedia.org/wiki/Sprachanalyse

Aber gibt diese Darstellung wirklich das wieder, was heute unter Sprachanalyse bereits möglich ist? Ich glaube nicht.
Im Rahmen eines Beratungsauftrages bin ich auf ein Produkt http://www.nice.com/speech-analytics gestoßen, welches eine Reihe interessante Möglichkeiten enthält, die ich hier kurz darstellen möchte.

Phonetische Indexierung
Diese Funktion gibt die Möglichkeit, z. B. ein gesamtes Gespräch oder Telefonat in Phoneme (kleinste sprachliche Einheit) zu unterteilen und diese in einer Datenbank abzuspeichern. Diese wiederum kann nach einer Vielzahl von Kriterien, wie z. B. Wörter, Begriffe etc. durchsucht werden.

Speech-to-Text-Transcription
Eigentlich nichts neues. Hier wird gesprochener und gespeicherter Text in Schriftform umgesetzt, also genau das, was auch eine digitale Spracherkennung leistet.
Wäre da nicht die Möglichkeit der Erstellung von Text- u. Data-Mining-Modellen.

Ziehen wir wieder Wikipedia zu Rate:

Text Mining, seltener auch TextminingText Data Mining oder Textual Data Mining, ist ein Bündel von Algorithmus-basierten Analyseverfahren zur Entdeckung von Bedeutungsstrukturen aus un- oder schwachstrukturierten Textdaten. Mit statistischen und linguistischen Mitteln erschließt Text-Mining-Software aus Texten Strukturen, die die Benutzer in die Lage versetzen sollen, Kerninformationen der verarbeiteten Texten schnell zu erkennen. Im Optimalfall liefern Text-Mining-Systeme Informationen, von denen die Benutzer zuvor nicht wissen, ob und dass sie in den verarbeiteten Texte enthalten sind. Bei zielgerichteter Anwendung sind Werkzeuge des Text Mining außerdem dazu in der Lage, Hypothesen zu generieren, diese zu überprüfen und schrittweise zu verfeinern.”
http://de.wikipedia.org/wiki/Text_Mining

Speaker Trennung
Hier werden die Gespräche der beteiligten Personen analysiert dahingehend, welcher Gesprächsteil welcher Person zuzuordnen ist.

Emotion Erkennung
Bemühen wir zur ersten Erklärung wieder Wikipedia:

Emotionserkennung ist der Prozess der Abstraktion und Klassifikation von audio-visuellen Signalen und ihre Entschlüsselung als Zeichen für Emotionen. Sie findet vor allem in der Emotionspsychologie, der Psychotherapie, der Humanethologie und der Robotik Anwendung. In der Robotik unterscheidet man zwischen visueller Emotionserkennung und akustischer Emotionserkennung. Im Gegensatz zur Humanethologie und der Psychologie hat die Robotik ein sehr einfaches Bild menschlicher Emotionen. So werden hier der Ausdruck und die Darstellung von Emotionen häufig mit dem Empfinden von Emotionen gleichgesetzt. Folgendes Beispiel soll dies verdeutlichen. Sobald eine Person seine Mundwinkel nach oben zieht oder z. B. den Satz „ich bin fröhlich“ spricht, deutet das die Robotik als Freude. Die Psychologie hingegen würde hier erstmal nur den Ausdruck eines fröhlichen Satzes sehen – aber noch lange keine echte Freude.”
http://de.wikipedia.org/wiki/Emotionserkennung

Vereinfacht ausgedrückt gibt das Tool die Möglichkeit, Emotionen der Beteiligten eines aufgenommenen Telefonats analysieren zu können, also ob Zufriedenheit oder Unzufriedenheit vorliegt, aber auch Nervosität etc.

Talk-over-Analyse
Diese verschafft einen Eindruck über den Gesprächsfluss eines Telefonats, also ob einer der Beteiligten geschwiegen, gezögert oder fließend gesprochen hat, oder ob die Beteiligten gemeinsam gesprochen haben, was wieder Rückschluss auf eine Vielzahl von Erkenntnissen zulässt.

Fazit
Sicherlich ist dieses Programm vordergründig für Supportcentren, Callcenter etc. gedacht, um – natürlich nach Vorankündigung – Gespräche über Grund, Inhalt, Ablauf, Zufriedenheit etc. analysieren zu können, um “die Kundenzufriedenheit” zu erhöhen.
Aber wird es dabei bleiben?