PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Sprachsteuerung



Woftschik
17.06.2008, 22:03
Hallo Leute!!!!

Ich hatte mir gedacht es wäre bestimmt interesant ein Roboter mit Sprachsteuerung zu machen. :-k

Wollte zuerst mal eure Meinung drüber hören bevor ich starte!

Hat jemand mal von euch schon mal mit Sprachsteuerung zutun gehabt????
Wenn "ja" bitte ich kurz um Anmerkungen wie und was gemacht wurde![-o<

Danke

Roboterbauen
20.06.2008, 18:19
klingt sehr interessant und macht absolut sinn. ich denke da an eine software wie Dragon Naturally Speaking...ist wirklich schon sehr gut umgesetzt und langsam aus den kinderschuhen...geht auch per bluetooth headset...ich bin immer noch in der planungsphase, aber ich denke auch an eine solche lösung wenn die grundfunktionen stehen...allerdings weiss ich nicht, ob es eine API gibt bei Dragon Naturally Speaking

Woftschik
21.06.2008, 18:29
Hey Roboterbauen!!

Ich kenne dieses Programm nicht.
Kann man Dragon Naturally Speaking downloaden???

Ich habe mich ein wenig erkundigt bezüglich der Sprachsteuerung!!
Man braucht einen speziellen IC, ist das richtig??
Hast du ein Plan, Schaltung um zu wissen wie sowas aus sieht?

Roboterbauen
21.06.2008, 19:23
hi woftschik!
genauere ic kenntnisse fehlen mir für eine direkte programmierung. ich arbeite an einem konzept, in dem ich einen vollwertigen pc als steuerung nutze ( schande auf mein haupt, ein roboter mit micro$oft... )
hier der link, ist eine online demo
http://www.endlich-versteht-dich-jemand.de/dragon-naturally-speaking-demo/index.htm
ich möchte die api benutzen...

Woftschik
21.06.2008, 23:04
HI Roboterbauen!!!

Danke für die Antwort und den Link ... werde mir das jetzt anschauen!!!

Woftschik
22.06.2008, 15:52
Hat sonst keiner eine Meinung oder Anregung zu diesem Thema??
Hat sich keiner mit der Sprachsteuerung befasst??????????????


Ich will eure Meinung oder Erfahrungen haben.

MSN
22.06.2008, 18:52
conrad hat(oder hatte?) mal ne sprachsteuerung im angebot, habs aber nie getestet...

Roboterbauen
23.06.2008, 18:20
meine meinung ist, dass das ganze ein sehr hohes zukunftspotential hat. ich habe Microsoft Voice Command auf meinen PDA installiert und auch wenn das eher "Spielerei" ist im vergleich zu einer robotersteuerung via stimme ist es doch funktional. jeder kennt die bescheidene "sprachsteuerung" in handys, seit jahren schlummert eine eher rudimentäre funktion auf unseren handys und wer nutzt sie? keiner, denn es funktioniert eher sporadisch ( "wähle meier" --> "zähle eier?" ). zudem ist eine sprachsteuerung fast immer nur über headset möglich, da jedes leise papierrascheln im hintergrung gleich eine Zahlen- und Zifferorgie auf dem Bildschirm auslöst. ich aber hoffe und denke, das in dem bereich fortschritte gemacht wird.
mich interessiert dabei eher die möglichkeit, dass eine software eine sprache lernt, soll heissen sich dem wortschatz des benutzers anpasst und bedeutungen von wörtern lernt...uffff, was für ein algorythm...meld mich wieder, wenn ich weiteres auf diesem gebiet finden sollte...

Gock
23.06.2008, 23:14
Ja, eine funktionierende Sprachsteuerung setzt voraus, dass die Sprache aus Hintergrundgeräuschen herausgefiltert werden kann. Schließlich willst Du nicht immer am Mikro sitzen. Alleine das setzt entsprechende Hardware und Software voraus.
Die Spracherkennung ist mittlerweile schon gut, aber die Filter eben nicht, vor allem sind sie nicht billig und nicht klein in der Bauform. Derzeitige bestehen meist aus einer Vielzahl von Mikrofonen (Arrays) und benötigen entsprechenden Platz.
Ein weiteres Problem ist die Fehleranfälligkeit. Wenn die zu hoch ist endet es noch wie in RoboCop: "Er hat die Waffe nicht fallen hören..." ;-)
Ansonsten sehr interessant.

Gock
23.06.2008, 23:36
Achja, das mit Abstand beste Win Vista Ultimate Feature ist die Spracherkennung. Die ist wirklich gut, dafür, dass man sie dazu "geschenkt" bekommt. Leider kann man keine Befehle lehren...
Aber ob Natural Speaking so viel besser ist?

johns
24.06.2008, 01:24
hallo,

ich hab mal mit microsoft speech api experimentiert. klappte ganz gut, nur für eine robotersteuerung hat es nicht gereicht, da ich keinen roboter hatte ;)
http://msdn.microsoft.com/en-us/library/ms723627(VS.85).aspx
die (afaik) aktuelle version 5.3 gibt es nicht mehr als standalone download, sie ist im platform sdk enthalten
http://www.microsoft.com/downloads/details.aspx?familyid=E6E1C3DF-A74F-4207-8586-711EBE331CDC&displaylang=en (nicht vom namen abschrecken lassen, das ist auch für xp und vista, siehe system requirements)
entweder beim sdk oder auf msdn gibts auch beispiel code.

lg

ps, bei meinem handy funtioniert die spracherkennung ziemlich gut, und das ohne diese auf meine stimme trainieren zu müssen

edit: ms speech api wird meist durch SAPI abgekürzt...


edit (2.10.08): da ich mich kürzlich wieder mit SAPI beschäftigt habe, eine ergänzung: so wie es aussieht ist weder bei windows xp noch beim SAPI sdk (bzw. windows sdk) eine recognition engine dabei. vista (zumindest einige versionen?) hat eine solche engine out-of-the-box, xp lässt sich mittels der in einigen MS Office (word) enthaltene version nachrüsten (office xp und 2003; 2007 afaik nicht). vmtl lassen sich auch 3rd-party engines einbinden...
ps. die samples aus dem windows sdk lassen sich nicht mit visual studio express erstellen, da ATL fehlt. workaround: VS 2008 pro trial installieren, und atlmfc ordner dem (express) projekt verfügbar machen... natürlich nicht vergessen die libs nach ablauf der trialperiode nicht mehr zu verwenden ;)

Gock
24.06.2008, 09:41
Sehe ich das richtig?
Es gibt eine Speech API, also eine .Net Library(Sammlung), die zur nichtkommerziellen Nutzung frei gegeben ist und auf die man mit dem entsprechenden SDK zugreifen kann, wenn man .Net beherrscht?
Damit wäre es dann möglich, Sprache per Mikrofon zu erkennen und auszuwerten?
Wie kann ich mir das vorstellen?

johns
24.06.2008, 10:28
ja, spracherkennung und sprachsynthese, und das schon seit jahren. warum die so selten verwendet wird ist mir nicht ganz klar. so wie ich das sehe ist die auch für kommerzielle applikation kostenlos, wie zb directX auch.
ältere versionen sind afaik auch ohne .net nutzbar, und sonst könnte man wie ich Managed C++ verwenden, wo die umstellung von C++ nicht so dramatisch ausfällt. aber wenn es schon mit 1-2 verschiedenen programmiersprachen zu tun gehabt hat, findet man sich auch mit C# schnell zurecht, und da gibts von microsoft, ganz uneigennützig ;), mehr beispielcode und bessere doku...

daran hab ich auch erst jetzt gedacht.... http://de.wikipedia.org/wiki/Speech_Application_Programming_Interface

lg

detbot
03.08.2008, 01:05
Also das mit der Spracherkennung ist so eine Sache.

Die hier bisher vorgestellten Software Pakete (Nuance, IBM, ...) sind alle Sprecherabhängig, das bedeutet das diese erste auf Deine Stimme trainiert werden müssen. Für einige Anwendungen mag das OK sein, aber für viele andere eher nicht, denn die Kids oder die Frau soll ja auch verstanden werden.

Es gibt daneben weitere Pakete die SprecherUNabhängig sind. Ergo kann damit jeder umgehen. Bei diesen Lösungen muss vorher ein Wortschatz erstellt werden (Text, XML File) mit dem das von Dir gesprochene Wort vergleichen wird. Diese Pakete sind deutlich teurer und nicht offen vorhanden. Hersteller sind hier Loqundo, Net2Voice, Nuance und....

Langsam fängt aber zudem eine Open Source Gemeinde an dazu Lösungen zu erstellen (Sourceforge und nach ASR suchen) und zudem kommen einige sehr günstige Lösungen aus den USA (Cepstrel, Lumenvox ,.. ) die aber noch nicht alle die Deutsche Sprache beherschen.

In der Linux Telefonie Software Asterisk wird bald Spracherkennung integriert sein. Das bedeutet, das mit einem SIP Gerät über WLAN wunderbare Lösungen denkbar sind. Das macht vermutlich mehr Sinn als alles auf API Ebene mit MS zu coden....

Mehr zu diesem ganzen Thema gern in per PN oder unter http://www.voice-compass.com (Mein aktuelles Buch über Sprachautomation)

detbot

Woftschik
03.08.2008, 12:50
Hallo detbot!!

Wilkommen im Forum!!

Ich danke dir für deine Antwort. Hätte da eine Frage zu diesem Buch
" voice compass "
ich meine es wird ja schon ein bischen beschrieben:

"Der voice compass ist das Kompendium für Informations- und Telekommunikationstechnologie (ITK) und beleuchtet den Bereich der Sprachanwendungen am Telefon in aller Tiefe. Jeder Unternehmer oder Entscheider muss heute über die Möglichkeiten von Sprachapplikationen informiert sein. Der voice compass ist das kompakte Medium dazu."

aber was wird genau in diesem Buch behandelt ??
(die Problemmathik,elektrotechnik,ablauf der spracherkennung,allgemeines zum Thema Spracherkennung)

Wenn du es doch bitte etwas auflisten könntest, wäre ich dir sehr dankbar!!!

detbot
03.08.2008, 16:00
Hallo,

ich möchte hier eigentlich ungern Eigenwerbung machen, aber Du hast ja gefragt.

Das Buch führt einen interessierten Leser durch alle Grundlagen der Sprachtechnologie (Spracherkennung, Sprachsynthese, Sprecheverifikation), zeigt mögliche Plattformen mit ISDN oder VoiP, erklärt einige Lösungsansätze, zeigt die relevanten Anbieter im Markt, stellt mehrere Kalkulationsgrundlagen zur Verfügung um zum Schluß in Empfehlungen zu münden.

Dabei versucht der voice compass all dieses mit einfachen Worten zu erklären, um damit eine Grundlage und ein Basiswissen zu schafften. Die Zielgruppe sind dabei Entscheider in der WIrtschaft, Marketingmitarbeiter und Projektleiter weniger die "echten" Techniker die in C Progranmmieren. Aber auch diese finden in den Übersichten einen echten Mehrwert, denn es werden erstmalig nahezu alle Anbieter zusammengefasst.

Schau doch einfach mal in die 50 Seiten Vorschau http://voice-compass.com/german/main/lesen/leseprobe.html und mach dir ein eigenes Bild. Da ist auch ein Inhaltsverzeichniss zu sehen und eine 16 seitige Broschüre. Das Buch gibt es zudem in Deutsch (voice compass 2007) und in Englisch (voice compass international 2008/2009)

PS: Wer Interesse an dem Werk hat bekommt von mit gern 10% Ermäßigung. Einfach den OptionCode "DART10" beim Bestellen nutzen und mit Paypal zahlen. http://voice-compass.com/german/main/kaufen.html

Bei weiteren Fragen zu Sprachtechnologie stehe ich gern zur Verfügung.