ScreenScraping? Oder anders?

  • VB.NET
  • .NET (FX) 4.5–4.8

Es gibt 9 Antworten in diesem Thema. Der letzte Beitrag () ist von Andy.

    ScreenScraping? Oder anders?

    Hallo liebes Forum...

    ich schreibe zur Zeit eine Webanwendung für meine Frau. Einfache Mandantenverwaltung, Aktenablage... Nichts wildes. Jedoch braucht Sie ein Gerichtsverzeichnis, welches es an tausend Stellen kostenlos im Internet gibt...

    Ich möchte es gern in die Anwendung integrieren, habe sowas aber noch nicht gemacht... Hier ist der Link zur Seite: www2.justizadressen.nrw.de/og.php

    Ich möchte in der Anwendung das Postleitzahlenfeld haben und dann das Ergebnis entsprechend aus einer Ergebnisliste mit einem Klick auswählen können und dann in die Datenbank schreiben.

    Kann man sowas realisieren? Wenn ja, wie?

    Sachdienliche Hinweise werden gern angenommen ;) :P

    Danköö

    Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von „toddel“ ()

    eine einfache möglichkeit ist es die seite via http protokoll anzusprechen und das ergebnis entsprechend zu verwerten.
    die webrequest klasse eignet sich um einen entsprechenden request zu senden, das ergebnis kann man dann auswerten zb mit regex oder einem html parser, grundsätzlich kann man dort alles nutzen was einem zur stringverarbeitung einfällt.
    wie die requests an die seite aufgebaut sein müssen verrät einem der eigene browser wenn man die entsprechende interaktion ausführt und das ganze mit einem tool seiner wahl aufzeichnet, zb mit dem browserplugin livehttpheaders oder einem externen tool wie wireshark.

    Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von „tolio“ ()

    Hallo, entweder die Seite hat eine API z.b. über XML, dann kannst du die nutzen oder aber wenn nicht musst du halt die Adressen mit regex parsen, was dann schon etwas "Wildes" ist.
    Meine Projekte Genesis Game Engine | GFX | smartli.me - Der smarte URL shortener

    petaod schrieb:

    Nur zur Vorsicht: Dass du bei der Seite die Parameter direkt in der URL mitgeben kannst, ist dir klar?

    ​http://www2.justizadressen.nrw.de/og.php?plz=40210&ort=&suchen=+Absenden+&gerausw=ALL&plz1=&ort1=&landausw=ALL&MD=


    Ja, das habe ich auch gesehen und funktioniert auch... :)

    Nur wie komme ich an die Ergebnisliste? Ich finde da leider kein (für mich einfaches) tutorial.

    Und wenn ich das Feld auf der Seite habe, wie rufe ich den Link auf und wo speichere ich dann das Zwischenergebnis hin, bei dem ich eines der vielen Treffer auswählen kann?

    :)
    Ich habe nach Regex gegoogelt...

    Ist wie einem ohne Führerschein zu sagen "Da ist ein Auto".

    Aber wie man da rein kommt, was vorzubereiten ist, wie es losgeht und wie man richtig fährt... Die Infos fehlen mir.

    Das sieht mir alles fremd aus. So fit bin ich da nicht...

    Wie hast Du das gelernt?


    Ich glaube, ich kaufe bei fiverr.com einen Inder, der mir das für 5€ programmiert... ;)

    fiverr.com/ngadhavi/scrape-dat…bsite?from_buyers_hp_rv=1
    ja regex ist schon eine sache für sich, die wie ich finde man nicht von heute auf morgen lernt. Es gibt hier ein gutes Tutorial zu dem Thema was meiner Meinung nach sehr gut ist ( RegEx Tutorial - Blutige Anfänger und Fortgeschrittene )

    und dann gibt es noch Online Regex tester mit dennen du deine Pattern testen kannst myregextester.com/ hoffe das dir das ein wenig hilft.
    Meine Projekte Genesis Game Engine | GFX | smartli.me - Der smarte URL shortener