Verwenden der Spracherkennung zur Umwandlung beliebiger Texte

  • VB.NET

Es gibt 11 Antworten in diesem Thema. Der letzte Beitrag () ist von Sky Super.

    Verwenden der Spracherkennung zur Umwandlung beliebiger Texte

    1.: Tut mir so leid fürs ausgraben, ich wollte nur keinen komplett neuen Thread anfangen, und da das Ganze noch nicht SO lange her ist...
    2.: Meine eigentliche Frage: Wie kann man es anstellen, dass, wenn man ein X-Beliebiges Wort sagt, zum Beispiel "Schokoladentorte", und dieses Wort gar nicht in der grammar.xml aufgeschrieben wurde, erkannt und in die TB geschrieben wird? Wäre für mich überaus interessant zu wissen!

    Von hier ausgelagert: Sprachsteuerung [Überarbeitet]. ~Thunderbolt
    There are only 10 types of poeple in the world: Those who understand binary and those who don't.

    Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von „Thunderbolt“ ()

    Oh. Viel einfacher als ich dachte! Musste mal an MSDN schicken, damit auch "normale" Menschen ihr Kauderwelsch verstehen. Vielen Dank! Dafür gibt's ein "hilfreich"!

    EDIT: Auch was die Antwort von @moiko betrifft, ich würde vorschlagen, da sich ja so viele Leute, wie bei einer Kettenreaktion, an der Diskussion beteiligen, einen neuen Thread zu starten.
    There are only 10 types of poeple in the world: Those who understand binary and those who don't.

    Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von „Sky Super“ ()

    Hallo, erstmal danke für den Ansatz, ich habe mir mal ein Wörterbuch mit ~21.000 Wörter in die grammer.xml geladen um mal etwas die Performance zu testen.
    Deutlich besser als erwartet. Top!
    Mir fehlt allerdings etwas die Unabhängigkeit zur grammer.xml, wie verhält sich das mit DictationGrammar-Objekt?
    Aktuell muss exakt der Befehl gesagt werden, der in der Grammer.xml steht und beim DictationGrammar-Objekt handelt es sich um Freitext.

    Nehmen wir an, mein Programm reagiert auf "Computer, wie spät ist es?". Nun würde ich aus Zeitdruck sagen "Wie spät?", hätte ich mit dem DictationGrammar-Objekt
    jetzt die Möglichkeit den gesagten Satz als kompletten String zu greifen, damit ich mit diesem weiter arbeiten kann? Oder wie verhält er sich beim freien Reden?

    Beste Grüße
    Die kurze Antwort: Kommt darauf an. Probiere es aus.

    Die lange Antwort: Die Spracherkennung versucht, immer ganze Sätze oder Satzteile zu generieren. Diese werden dann weitergegeben, wenn der Sprecher eine Pause einlegt, oder der Text relativ lang geworden ist. Eine genaue Aussage kann man hier nicht unbedingt treffen, da das von zu vielen Faktoren abhängt. Du bekommst aber immer einen String.
    Mit freundlichen Grüßen,
    Thunderbolt
    Danke, habe ich gerade getestet.
    Aber er versucht ja tatsächlich aus allem etwas zu generieren. "Wort nicht gefunden" kennt er gar nicht :D
    Da wirkt die grammar.xml schon zuverlässiger, da man Fachwörter oder spezielle Wörter angeben kann.
    Nur wie verhält sich das ganze, wenn ich einen Satz sage und die einzelnen Wörter in der grammar.xml suchen möchte?
    Kommt die Spracherkennung von Microsoft dann überhaupt noch in Frage?
    1. Ich würde, wie ich bereits in dem früheren Post hinzugefügt habe, einen neuen Thread beginnen, denn wenn wir jedes mal auf die Moderation warten müssen, bis ein Post veröffentlicht wird, kann das auch mal länger dauern.
    2. Mich würde wirklich interessieren, ob es mit dieser Funktion möglich ist, einen Sprach-Texteditor zu kreieren. Mein Plan besteht darin, dass der Nutzer Worte sagt und dass die dann in eine Textbox geschrieben werden. Ich will aber dass ich trotzdem noch eigene Befehle (wie zB. "Programm beenden" oder "Datei speichern") hinzufügen kann. Geht das? Und wenn ja: Wie?
    There are only 10 types of poeple in the world: Those who understand binary and those who don't.
    Ich will die Spracherkennung standardmässig in meinem Projekt verwenden. DH., dass die Spracherkennung beim Öffnen einer bestimmten Form beginnt, gesprochenes aufzunehmen und in eine Textbox reinzuschreiben. Meine Idee ist es, einen Browser mit Spracherkennung zu kreieren. Sollte ich da die DictationGrammar verwenden oder eine eigene Grammar erstellen?
    There are only 10 types of poeple in the world: Those who understand binary and those who don't.