Kopie der Mitgliederliste WebBrowser

  • VB.NET

Es gibt 9 Antworten in diesem Thema. Der letzte Beitrag () ist von AsdAsd1337.

    Kopie der Mitgliederliste WebBrowser

    Hallo VB-paradise.de,

    Ich bin zurzeit an der Aufgabe eine Kopie der Mitgliederliste einer Website zu machen, Ich bin mir SICHER das man RegEx dafür benötigt, doch Wie sag ich dem RegEx auf Welcher Webseite er Wonach zusuchen hat, und das etwas immer an Gleicher Stelle ist,

    Beispielsweise so:

    Quellcode

    1. <tr class="bg11">
    2. <td><span class="rank-img">Hierstehtirgendwas</span><a href="http://my.webpage.com/user-u11.html">Username</a></td>
    3. <td class="posts"><a href="http://www.my.webpage.com/phpBB3/user-u11-posts.html" title="Beiträge des Mitglieds anzeigen">26982</a></td>
    4. <td class="info">&nbsp;</td>
    5. <td>26 Jan 2004 16:44</td>
    6. </tr>
    7. <tr class="bg22">
    8. <td><span class="rank-img">Hierstehtirgendwas</span><a href="http://my.webpage.com/user-u12.html">USERNAME</a></td>
    9. <td class="posts"><a href="http://www.my.webpage.com/phpBB3/user-u12-posts.html" title="Beiträge des Mitglieds anzeigen">718</a></td>
    10. <td class="info">&nbsp;</td>
    11. <td>26 Jan 2004 17:31</td>



    Frage wie Filter ich die Usernames raus & Springe dann zur Nächsten Seite ?

    Über antworten & Hilfen wäre ich sehr dankbar
    Mit der mshtml wirst du dir meiner Meinung nach leichter tun:

    Also mshtml als Verweis hinzufügen und:

    VB.NET-Quellcode

    1. Imports mshtml


    Dann mit nem WebClient:

    VB.NET-Quellcode

    1. Dim WebClient As New Net.WebClient
    2. WebClient.Proxy = Nothing
    3. WebClient.Encoding = System.Text.Encoding.UTF8
    4. html = WebClient.DownloadString(url)
    5. Dim htmlDocument As IHTMLDocument2 = New HTMLDocumentClass()
    6. htmlDocument.write(html)
    7. htmlDocument.close()
    8. Dim Elements As IHTMLElementCollection = htmlDocument.body.all
    9. Dim items As IHTMLElementCollection = Elements.tags("td")
    10. Dim sku As IHTMLElement
    11. For Each sku In items
    12. If (sku.className = "Die KLasse des von <td") Then
    13. ' sku.innerText gibt dir dann den inhalt von <td></td>
    14. End If
    15. Next


    Den Code musst du logischerweise noch anpassen!

    MFG
    Hallo mccandy007,

    Erstmal vielen Dank für deine Hilfe :),

    Ich habe jedoch ein paar Probleme, ist das Normal das er "IHTMLDocument2" abändern möchte in "HtmlDocument"
    Das hat er überall gemacht, Jedoch hab ich ein problem bei "htmlDocument.write(html)"


    Er sagt es wäre nicht deklariert obwohl ich es normal drin hab "html = WebClient.DownloadString(UrlmeinerPage)


    Vielen Dank schonmal
    Nun wäre dieser Fehler behoben, jetzt hab ich schon alles angepasst

    Hier der Code: paste2.org/p/1811923


    Dort kriege ich diese Fehler, habe alle gegoogelt aber nichts was dazu trifft gefunden :(.


    "className" ist kein Member von "System.Windows.Forms.HtmlElement"
    "close" ist kein Member von "System.Windows.Forms.HtmlDocument"


    "tags" ist kein Member von "System.Windows.Forms.HtmlElementCollection"

    "Der Typ "HTMLDocumentClass" ist nicht definiert.
    Das Meinte ich ja im Vorletzten beitrag, Mit dem I ist das Komisch, wenn ich wie du sagst alle I anhänge dann Kommt überall :

    Quellcode

    1. Der Typ "IHTMLElementCollection" ist nicht definiert. << der Fehler 2xDer Typ "IHTMLElement" ist nicht definiert.Der Typ "HTMLDocumentClass" ist nicht definiert,
    Das Meinte ich ja im Vorletzten beitrag, Mit dem I ist das Komisch, wenn ich wie du sagst alle I anhänge dann Kommt überall :

    Quellcode

    1. Der Typ "IHTMLElementCollection" ist nicht definiert. << der Fehler 2xDer Typ "IHTMLElement" ist nicht definiert.Der Typ "HTMLDocumentClass" ist nicht definiert,


    Ich hab es einfach probiert zu Debuggen und auszuführen hat aber




    Imports mshtml Habe ich klar,
    Verweis was meinst damit ? ich bin mir eigl sicher das Ich das Richtig hab, hab mir nun wieder mehrere RegEx Tuts durchgeschaut jedoch komm ich nichtmal
    mit den Simpelsten RegEx Anfragen durch :/