Änderung an html überprüfen

  • VB.NET

    Änderung an html überprüfen

    So, mal ne Frage, die sich nicht "direkt" auf den Code bezieht:
    Ich bastel gerade ein "Website-Monitoring-Tool" das eben Änderungen an Websiten feststellen kann/soll.

    bisher bilde ich aus

    Quellcode

    1. .WebBrowser1.Document.Body.InnerText
    einen md5-hash und vergleiche diesen mit dem gespeicherten (will ja nicht den ganzen quelltext speichern)

    Das Problem sind seiten mit "plugins" ala "Top Angebot" "Hit counter" o.ä

    logischerweise führen veränderte Angaben auf der Seite zu einem veränderten Quelltext, auch wenn die eigentliche Seite noch die selbe ist... Wie kann ich das Problem am besten lösen?

    habe es auch schon mit DocumentText probiert (also dem reinen quelltext) aber da war das ergebnis der "genauigkeit" noch schlechter...

    am besten wäre ja, wenn der user einen bereich der SEite markieren kann, der überprüft werden soll...

    Frage: Wie kann ich eine Auswahl in der dargestellten version einer seite am besten auf den quelltext übertragen ? durchwühlen bis hit, substring von 10 chars vor text bis 10 chars nach text? oder gibt es da was "besseres"? (Problem dabei wäre, wenn mehrere Preise angegeben sind... )

    grüße, dognose

    Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von „dognose“ ()