OCR mit Windows-Boardmitteln (ab Windows 10)

    • VB.NET
    • .NET (FX) 4.5–4.8

    Es gibt 7 Antworten in diesem Thema. Der letzte Beitrag () ist von -Franky-.

      OCR mit Windows-Boardmitteln (ab Windows 10)

      Neu

      Hi@all

      Windows 10 bietet eine einfache OCR, um in Bildern enthaltenen Text, auszulesen. Dieses Beispiel zeigt wie es funktioniert. Für eine einfache Texterkennung in Bildern reicht das grundsätzlich aus. Dabei werden verschiedene Bildformate unterstützt (vermutlich alle, die von WIC auch unterstützt werden). Die Erkennungsrate ist recht gut. Am Ende kommt man an die einzelnen Textzeilen, die darin enthaltenen Wörter und an welcher Position die Wörter im Bild gestanden haben. Für weitere Sprachen, die die OCR nutzen soll, müssen entsprechende Sprachpakete vom MS nachgeladen werden. Bei mir sind Deutsch und Englisch vorhanden gewesen.

      Das ganze ist wie immer ohne zusätzliche Verweise oder Fremdpakete und darf wie immer gern verbessert und erweitert werden.
      Bilder
      • OCR.png

        35,55 kB, 655×482, 52 mal angesehen
      Dateien
      • VBN_OCR.zip

        (140,5 kB, 23 mal heruntergeladen, zuletzt: )
      Mfg -Franky-

      Neu

      Ich hab (noch) keine Ahnung, wie es (genau) funktioniert, aber tolle Sache. Hab jetzt mal n Foto einer alten Zeitung hergenommen. Ergebnis: überraschend gut! Ich bin gespannt, wie das mit meinen Spezialdokumenten funktioniert …

      Gut, auskommentierte Codeblöcke und verbesserbare Projektcodegrundeinstellungen hinterlassen ein paar Fragezeichen, aber die Funktionalität ist schnell und auf den ersten Blick überzeugend. Vielen Dank!
      (Obwohl ich mir da wieder mal die Frage stelle: Wie machst Du das nur immer wieder?!?)
      Dieser Beitrag wurde bereits 5 mal editiert, zuletzt von „VaporiZed“, mal wieder aus Grammatikgründen.

      Aufgrund spontaner Selbsteintrübung sind all meine Glaskugeln beim Hersteller. Lasst mich daher bitte nicht den Spekulatiusbackmodus wechseln.

      Neu

      @VaporiZed

      Das ganze basiert auf einem AutoHotKey-Script: autohotkey.com/boards/viewtopic.php?f=6&t=72674 Ich hab das nur ein wenig ausgebaut und da das alles auf COM aufsetzt, ist das für mich einfach umzusetzen.

      Öhm, böses F-Wort: fu**. Da hab ich doch glatt vergessen den bösen Namespace raus zu nehmen und ein Häkchen zu setzen. ;)

      Der auskommentierte Codeblock zeigt halt weitere Möglichkeiten. Da kommst an jede einzelne Textzeile, darüber wieder an jedes einzelne Wort und die Position und Dimension wo das Wort im Bild gestanden hat. Vllt Sinnvoll wenn es ein zweispaltiger Text war und man diese Angaben nutzen möchte, um das Wort zb in einer RTF zu positionieren damit auch wieder zwei Spalten draus werden. Oder mit den Angaben die Wörter auf dem Bild markieren. z.B im Zusammenhang mit den in Windows vorhandenen SpellChecker um falsch erkannte Wörter sichtbar zu machen. Oder oder. Einfach mal die Fantasie spielen lassen. PDF zu Bitmap, Bitmap zu Text für zb Stichwortsuche. Nur so als Idee.

      Und zu Deiner letzten Frage: Ich versuche, soweit wie es geht, auf Drittkomponenten zu verzichten wenn das System bereits entsprechendes anbietet. Ich hab den Code dazu selbst in der Hand und kann das so gestalten wie ich das brauche. Außerdem macht es Spaß Sachen auszuprobieren, die im Framework nicht vorhanden sind. ;)
      Mfg -Franky-

      Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von „-Franky-“ ()

      Neu

      @-Franky- Ich hab noch ein wenig gespielt und folgendes festgestellt:
      Der Font der zu erkennenden Schrift spielt eine gewisse Rolle.
      Text im Notepad++ mit Courier New wird anders erkannt wie derselbe Text in Word mit Arial, wenn von beiden ein Screenshot gemacht wird.
      Mehr Pixel pro Buchstabe bringt natürlich klar eine bessere Erkennung.
      In jedem Falle ist eine Rechtschreibkontrolle zwingend erforderlich.
      Falls Du diesen Code kopierst, achte auf die C&P-Bremse.
      Jede einzelne Zeile Deines Programms, die Du nicht explizit getestet hast, ist falsch :!:
      Ein guter .NET-Snippetkonverter (der ist verfügbar).
      Programmierfragen über PN / Konversation werden ignoriert!

      Neu

      @Der flotte Johann Dafür gibt es den Hilfreich-Bitton.
      ====
      Nicht für mich, sondern für @-Franky- ;)
      Falls Du diesen Code kopierst, achte auf die C&P-Bremse.
      Jede einzelne Zeile Deines Programms, die Du nicht explizit getestet hast, ist falsch :!:
      Ein guter .NET-Snippetkonverter (der ist verfügbar).
      Programmierfragen über PN / Konversation werden ignoriert!

      Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von „RodFromGermany“ ()