Website + Alle Daten darauf herunterladen?

  • VB.NET

Es gibt 4 Antworten in diesem Thema. Der letzte Beitrag () ist von rotherford.

    Website + Alle Daten darauf herunterladen?

    Hi,
    also erstmal: das Forum hier hat mir schon viel geholfen, und jetzt hab ich mich einfach mal registriert, in der Hoffung Hilfe zu bekommen :)

    Zu meinem Anliegen: Wenn man mit Browsern (jedenfalls bei Google Chrome) Websiten herunterladen möchte gibt es immer 2 Möglichkeiten: Die Website als *.html speichern und oder die Wesite komplett speichern. Dann werden in einem Ordner noch seperat alle Bilder, Dateien... auf der Site in einem Ordner gespeichert.

    Meine Frage: Wie macht man 2. Variante mit VB? 1. Variante ist klar: HTML-Quelltetxt auslesen und in einer HTML-Datei speichern...
    1. HTML zwischenspeichern (Variable, Datei, Clipboard...)
    2. Aus der HTML alle Pfade ermitteln (Style-Sheets, Bilder...)
    2.1. Diese Daten dann herunterladen in relative Ordner
    2.2. Die Pfade im Dokument durch relative Pfade ersetzen
    3. HTML abspeichern als *.html
    4. Freuen und (optional) Kuchen backen!

    MfG,
    X-Zat / Momo

    X-Zat schrieb:

    Aus der HTML alle Pfade ermitteln (Style-Sheets, Bilder...)

    Mein Problem dabei ist ja, das ich nur alle Dateien(Bilder, EXE, ZIP, usw) ermitteln möchte und nicht auch noch alle anderen HTML-Seiten. Es ist ja unmöglich sich ein Verzeichnis mit allen dateitypen anzulegen...

    X-Zat schrieb:

    Kuchen backen!

    Der Kuchen geht an dich :D
    //Edit: Nur damit dus weisst: Ich bin grad bei nem Freund drin, deswegen bin ich Live xD
    --- Zurzeit inaktiv ---

    Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von „Live“ ()

    Einfach mit im webbrower Element zur Seite navigieren...
    und dann einfach


    VB.NET-Quellcode

    1. For Each image As HtmlElement In Webbrowser1.GetElementsByTagName("img")
    2. Dim x As String = image.GetAttribute("src")
    3. imagelist1.images.add(New System.Drawing.Bitmap(New IO.MemoryStream(New System.Net.WebClient().DownloadData(x))))
    4. Next
    /nicht getestet