InnerHtml aus HTTPWebRequest auslesen

  • VB.NET

Es gibt 4 Antworten in diesem Thema. Der letzte Beitrag () ist von froyo321.

    InnerHtml aus HTTPWebRequest auslesen

    Nabend,

    Der Webbrowser als Control bietet mir ja die möglichkeit per wb.Document.Body.InnerHtml das HTML-Markup der Seite auf der ich mich aktuell im Webbrowser befinde auszulesen, meine Frage/mein problem wäre nun, wie ich die gleiche Ausgabe über HTTPWebRequest erhalte, da ich bislang lediglich das gleiche wie bei wb.Document.Text über die Request rausbekomme, ist das irgendwie über HtmlDocument zulösen oder wie kann ich die sache angehen? Würde mich über einen ansatz freuen.

    MfG.

    slice schrieb:

    Hast du dir überhaupt mal die Mühe gemacht die Info selbst zu finden? HttpWebRequest.GetResponse-Methode


    Ja, ich habe mich bereits vorher damit befasst, sehe aber nicht was ich denn Falsch gemacht habe.

    VB.NET-Quellcode

    1. Dim request As HttpWebRequest = CType(WebRequest.Create(url), HttpWebRequest)
    2. request.Method = "GET"
    3. request.CookieContainer = CContainer
    4. Dim wr As WebResponse = request.GetResponse
    5. Dim reader As New StreamReader(wr.GetResponseStream, System.Text.Encoding.UTF8)
    6. Dim result As String = reader.ReadToEnd
    7. reader.Close()
    8. wr.Close()

    Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von „froyo321“ ()

    sieht korrekt aus -und da in result steht nicht das ganze Html, was abgerufen wurde?
    Was steht denn dann darin?
    Natürlich gibt es Unterschiede HtmlDocument.InnerHtml ist ja eine recht aufwändig aufbereitete Ausgabe, währen der ResponseStream ganz unverarbeitet ist.
    Insbesonder bei Einsatz von Java- und anderem -Script vermute ich da enorme Abweichungen.

    ErfinderDesRades schrieb:

    sieht korrekt aus -und da in result steht nicht das ganze Html, was abgerufen wurde?
    Was steht denn dann darin?


    Morgen,

    result Enthält zwar den HTML Code, aber der gewünschte auszulesende berreich wird (scheinbar) erst "nachgeladen", heißt: Beim aufruf "generiert"/"geladen" (wenn ich das richtig sehe) anders kann ich mir zumindest nicht erklären weshalb der WebBrowser da per InnerHtml rankommt, in der Ausagbe von InnerHtml bsp. ist sagen wir mal das Schlagwort IchBinEinSchlagwort enthalten, dieses Schlagwort ist allerdings nicht im result von meiner WebResponse zu finden.