PDF bestimmten Inhalt in TextBox "extrahieren"

  • VB.NET

Es gibt 4 Antworten in diesem Thema. Der letzte Beitrag () ist von Viercnt.

    PDF bestimmten Inhalt in TextBox "extrahieren"

    Mooin :)

    Neues Langzeitprojekt:
    Vorgeschichte:
    Ich habe viele, strukturell gleich aufgebaute, PDF Datein. Alle haben innerhalb das selbe Muster, es gibt bsp. zwei spaltige Tabellen, links sogesehen das Topic, rechts die Information, Beispiel:

    Test 1
    Ergebnisse bla bla
    mehr Ergebnisse
    noch mehr
    Test 2
    Ergebnisse
    Mehr ergebnisse
    Zeilenumbrüche in den Ergebnissen
    Test 3
    s.o.

    Jetzt möchte ich diese PDFs "einlesen", sodass ich bsp. die PDF importiere, und er mir in beispielsweise 3 vorgefertigte Textboxen die "Ergebnisse" ausgibt.

    Beispiel:

    Label1 = Test 1 Ergebnisse (muss nicht geändert werden, da immer gleich)
    TextBox1 = Inhalt aus Spalte 1, Zeile 1 importieren aus dem PDF Dokument, da immer verschieden, und ich muss diese auslesen.

    Label2 = Test 2 Ergebnisse (muss nicht geändert werden, da immer gleich)
    TextBox2 = Inhalt aus Spalte 2, Zeile 2 importieren aus dem PDF Dokument, da immer verschieden, und ich muss diese auslesen.


    Label3 = Test 3 Ergebnisse (muss nicht geändert werden, da immer gleich)
    TextBox3 = Inhalt aus Spalte 3, Zeile 3 importieren aus dem PDF Dokument, da immer verschieden, und ich muss diese auslesen.

    Das ist erstmal das Grundproblem.
    Später kommen noch Extraktionen, bzw. Exporte aus den Kopf/Fußzeilen hinzu. aber erstmal eins nach dem anderen.

    Weiß jemand, wie ich dies realisieren kann? (Da ich noch etwas frisch bei VB.NET bin, bitte etwas leichter verständlich, beispielhaft, oder über Tutorials wäre ich mehr als dankbar! :-))


    tl;dr: Ich möchte bestimmte Inhalte aus strukturierten PDF Datein auslesen und in bsp. Textboxen ausgeben.
    Danke!

    Grüße,
    Kevin

    Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von „Viercnt“ ()

    Hier sagst Du dies:

    Viercnt schrieb:

    leider bin ich noch relativ neu in VB.net
    und in diesem Thread kommst Du schon mit relativ großen Problemen?
    Sollen wie Dir Deine Hausaufgaben erledigen?
    Falls Du diesen Code kopierst, achte auf die C&P-Bremse.
    Jede einzelne Zeile Deines Programms, die Du nicht explizit getestet hast, ist falsch :!:
    Ein guter .NET-Snippetkonverter (der ist verfügbar).
    Programmierfragen über PN / Konversation werden ignoriert!
    Zwei Minuten googlen:
    felixz.de/programmieren/pdf.htm
    Es war einmal ein kleiner Bär... der wollte eine Geschichte hörn... Da erzählte ihm seine Mutti:
    Es war einmal ein kleiner Bär... der wollte eine Geschichte hörn... Da erzählte ihm seine Mutti:
    Es war einmal ein kleiner Bär... der wollte eine Geschichte hörn... Da erzählte ihm seine Mutti:
    ... Nun solltest es selber wissen. :'D

    RodFromGermany schrieb:

    Hier sagst Du dies:

    Viercnt schrieb:

    leider bin ich noch relativ neu in VB.net
    und in diesem Thread kommst Du schon mit relativ großen Problemen?
    Sollen wie Dir Deine Hausaufgaben erledigen?


    relativ bezieht sich ja auf die Relation zur Zeit ;) Ich bin nunmal halt kein Profi, aber ich wachse gerne mit meinen Aufgaben, dazu braucht man nunmal ab und an Hilfe, bzw. Denkanstöße, keinesfalls soll mir jmd mein Problem abnehmen, nur weiß ich ohne eben genannte "Denkanstöße" manchmal nicht weiter :P
    Hausaufgaben, wäre schön wenn ich sowas noch zu erledigen hätte :P


    @MemoAnMichSelbst: Danke dir, das werde ich mir mal genauer zu Gemüte führen und dir auch eine Rückmeldung geben :)
    Danke!

    Grüße,
    Kevin

    MemoAnMichSelbst schrieb:

    Zwei Minuten googlen:
    felixz.de/programmieren/pdf.htm


    Grad mal durchgelesen, sieht schonmal sehr vielversprechend Aus.
    Würde das ganze gerne mal ganz grob testen, nur eine Frage bleibt mir, wie genau kann ich meine PDF denn nun dort einlesen?
    Über OpenFileDialog?
    Wenn ja, welcher function muss ich meine PDF denn übergeben, damit ich den return text bekomme?
    Danke!

    Grüße,
    Kevin