Medizinische Physik

"A microscopic model of speech recognition for listeners with normal and impaired hearing" - Dissertation Tim Jürgens

Eines der Hauptprobleme von Menschen mit einer Schallempfindungsschwerhörigkeit ist eine verschlechterte Sprachverständlichkeit sowohl in Ruhe, als auch in Umgebungen mit Störgeräusch. Ein Verständnis davon zu gewinnen, wie Schwerhörigkeit Sprachverständlichkeit beeinflusst, ist daher von großer Wichtigkeit für die Rehabilitation Schwerhörender, z.B. in Form der Entwicklung neuer Hörgerätealgorithmen. Schallempfindungsschwerhörigkeit kann allerdings sehr individuell sein, wenn man die Art und Anzahl der geschädigten Komponenten des Innenohres und des gesamten auditorischen Systems betrachtet. Wichtige individuelle Faktoren der Schallempfindungs-schwerhörigkeit, welche Sprachverständlichkeit beeinflussen, können zum Beispiel sein: die Hörbarkeit des Sprachsignals, unterschiedliche kompressive Eigenschaften in der Verarbeitung des Innenohres oder unterschiedlich starke aktive Prozesse im Innenohr. Die letzteren beiden können als überschwellige Faktoren bezeichnet werden, da sie die Verarbeitung von Sprache oberhalb der Hörschwelle beeinflussen. Es ist aus ethischen Gründen nicht möglich, den Einfluss dieser überschwelligen Faktoren auf die menschliche Spracherkennung direkt (also invasiv) zu messen und zu studieren. Allerdings können Computermodelle der menschlichen Spracherkennung einen Einblick geben, wie diese Faktoren die Sprachverständlichkeitsleistung beeinflussen können.

Diese Dissertation präsentiert ein mikroskopisches Modell der menschlichen Spracherkennung, mikroskopisch in dem Sinne, dass erstens die Erkennung von einzelnen Phonemen anstelle der Erkennung von ganzen Wörtern oder Sätzen modelliert wird. Zweitens wird die genaue spektro-temporale Struktur von Sprache auf eine Art und Weise verarbeitet, die sehr ähnlich zu der Verarbeitung ist, wie sie auch im menschlichen auditorischen System stattfindet. Andere gängige Modelle der menschlichen Spracherkennung nutzen im Gegensatz dazu nur die spektrale Struktur von Sprache und einem optionalen Störgeräusch aus. Dieses mikroskopische Modell ist dazu in der Lage Phonemerkennungsraten für Normalhörende unter Einfluss von Hintergrundrauschen (Kapitel 2) und wichtige Aspekte der Konsonanterkennung für Normal- und Schwerhörende in Ruhe (Kapitel 5) vorherzusagen. Außerdem kann eine Erweiterung dieses Modells auf die Erkennung von Wörtern (eingebettet in ganzen deutschen Sätzen) die Sprachverständlichkeitsschwellen von Normal- und Schwerhörenden mit ebenso großer Genauigkeit vorhersagen wie ein anderes gängiges Sprachverständlichkeitsmodell (Kapitel 3).

Parameter, die die überschwellige auditorische Verarbeitung in Normal- und Schwerhörenden quantifizieren, wurden mit Hilfe von indirekten psychoakustischen Messungen, nämlich einem Nachverdeckungsexperiment und der kategorialen Lautheitsskalierung geschätzt (Kapitel 4). In Kapitel 5 wurde dann schlussendlich untersucht, welchen Einfluss eine Veränderung der überschwelligen Verarbeitung (geschätzt aus den Messungen aus Kapitel 4) auf die modellierte Sprachverständlichkeit hat. Die Ergebnisse zeigen, dass der Einbau einer überschwelligen Verarbeitung, so wie sie in Schwerhörenden beobachtet wird, die Vorhersage der Sprachverständlichkeit verbessert. Allerdings ist der Vorteil, der durch den Einbau der genauen überschwelligen Verarbeitung (geschätzt durch überschwellige psychoakustische Messungen) erreicht wird, marginal im Gegensatz zu einer alleinigen Schätzung dieser überschwelligen Verarbeitung durch das Audiogramm.

Tim Jürgens