Sprache [Archiv] - Roboternetz

Archiv verlassen und diese Seite im Standarddesign anzeigen : Sprache

hirnfrei

21.01.2016, 02:56

Mahlzeit!

Gibt es denn für Linux gute Spracherkennung und Sprachausgabe?

Ich habe Simon Listen gefunden und Festival. Festival kenne ich von FlightGear, aber so toll ist die Ausgabe in Deutsch jetzt nicht, es sei denn ich mache etwas falsch und Simon ist Neuland.

Interessant wäre auch noch, gibt es denn so etwas wie Sprache verstehen? Also das man mit dem Computer mehr oder minder wirklich reden kann?

i_make_it

21.01.2016, 09:56

Die Forschung ist überwiegend englischsprachig,
Dementsprechend findet man mehr wenn man englischsprachig sucht.
Spracherkennung - speech recognition

Bei den Systemen unterscheidet man zwichen:
Sprecherunabhängig / Sprecherabhängig
Ob es:
Front End System / Back End System
sind (auf dem Rechner lokal oder auf ein entferntes Sstem z.B. über Internet zugreift)
Und ob es:
diskrete Sprache / kontnuierliche Sprache
verarbeiten kann

https://en.wikipedia.org/wiki/Speech_recognition_software_for_Linux
Hier findest Du eine Liste mit freien und Proprietären Engines

https://de.wikipedia.org/wiki/Spracherkennung
https://de.wikipedia.org/wiki/Homophon

Sprachsynthese - text to speech system
https://de.wikipedia.org/wiki/Sprachsynthese

Dialog Systeme gibt es auch (mehr oder weniger)
https://de.wikipedia.org/wiki/ELIZA

https://de.wikipedia.org/wiki/Watson_%28K%C3%BCnstliche_Intelligenz%29
http://www.programmableweb.com/api/att-speech
http://www.programmableweb.com/api/google-prediction
http://www.programmableweb.com/api/wit.ai
http://www.programmableweb.com/category/all/apis?keyword=alchemyAPI
http://www.programmableweb.com/category/all/apis?keyword=diffbot

https://de.wikipedia.org/wiki/Siri_%28Software%29

Andree-HB

21.01.2016, 12:41

...habe kürzlich mit Arduino & BitVoicer gearbeitet - cloudbasiert, mit erstaunlich guter Spracherkennung ohne "Einlernphase":
http://www.bitsophia.com/en-US/BitVoicer/Overview.aspx

hirnfrei

23.01.2016, 01:08

Ist schon ein bisschen schade das es irgendwie kein TTS gibt was man direkt ins Programm einbinden kann und die die richtig gut klingen dann das Gesprochene erst hochladen müssen.

Peter(TOO)

23.01.2016, 07:38

Hallo,

Ist schon ein bisschen schade das es irgendwie kein TTS gibt was man direkt ins Programm einbinden kann und die die richtig gut klingen dann das Gesprochene erst hochladen müssen.

Für eine vollsynthetische Sprachgeneration, braucht man vor allem grosse Wörterbücher und Rechenleistung.
Zuerst muss die Schrift in eine phonetische Form übersetzt werden. Besonders bei Lehnwörtern ergibt sich eine von den allgemeinen Regeln abweichende Aussprache. Manche Wörter erhalten erst im Kontext ihren Sinn und werden dann anders ausgesprochen.
Als Schweizer fällt mir da "St. Moritz" als Beispiel ein. Nach den deutschen Regeln liegt die Betonung auf der ersten Silbe, wir betonen aber die Letzte.
Für eine lebendige Sprache müssen noch andere Elemente, wie z.B. Satzeichen berücksichtigt werden. Der selbe Satz wird unterschiedlich betont, je nachdem ob hinten ein Punkt, Fragezeichen oder Ausrufezeichen steht.

Ein weiteres Problem ist, dass die Fachsprache in der Forschung Englisch ist und sich die Forschung vor allem auf die englische Sprache bezieht.

Füttert man eine TTS für englisch mit deutschen Sätzen hat man ein Ergebnis mit grauenhaftem englischen Akzent.

MfG Peter(TOO)