Mehrere Labels von einer Webseite auslesen

  • VB.NET

Es gibt 8 Antworten in diesem Thema. Der letzte Beitrag () ist von MrNicolas3003.

    Mehrere Labels von einer Webseite auslesen

    Hallo,
    ich bin neu hier im Forum und ich programmiere noch nicht so lange mit Visual Basic.
    Also ich will ein Programm schreiben, welches ganz viele Label ausließt und in eine ListBox schreibt. Im Anhang ist ein Bild, wie die Labels aussehen!

    Ich habe gesucht und gesucht und leider nichts passendes gefunden. Es soll von ca. 8600 Labels auf der Webseite den Text auslesen. Das nächste Problem ist: es sind nur 300 auf jeder Seite. In den Labels sind IP-Adressen von Proxys. Diese sollen Beispielproxys für meinen Webbrowser werden. Falls es wichtig ist: Das ganze geht über GeckoFX!!

    Also stehen mir folgende Probleme bevor:
    1.) Ich weis nicht, wie ich den Text eines einzelnen Labels in eine Listbox bekomme
    2.) Ich weis nicht, wie ich den Text von Labels, welche auf mehreren Seiten verteilt sind, in eine ListBox bekomme

    Ich hoffe ihr könnt mir helfen.
    Liebe Grüße
    MrNicolas3003


    Bild:
    Ausreichend Infos.

    Du kannst die Sachen entweder mit den String Funktionen oder mit RegEx auslesen.
    Downloade einfach alle Seiten (ggf. vorher auslesen wie viele es überhaupt gibt) und dann die IP's auslesen.
    Wenn du etwas suchst soltlest du sogar ein bisschen was um Thema IP's auslesen hier in diesem Forum finden.
    Danke,
    ich kenne mich mit RegEx noch nicht so gut aus. Hättest du vielleicht eine Seite auf das Beschreiben wird oder so??
    Ich werds mir auf jeden fall mal anschauen :)

    Ich kenne mich wie gesagt noch nicht so gut aus. Ich weis daher weder wie ich die Seitenanzahl auslesen noch wie das mit Regex oder mit den Stringfunktionen mache.
    Ich habe einen Code gefunden, weis allerdings nicht ob der funktioniert:

    Quellcode

    1. Dim links As New List(Of String)
    2. For Each Link As System.Windows.Forms.HtmlElement In WebBrowser1.Document.Links
    3. links.Add(Link.GetAttribute("href"))
    4. Next


    In links kommen dann die IP-Adressen, die von der Webseite(link) in der Attribute href stehen. (Weis nicht ob das so korrekt ist, aber ich denke ihr wisst was ich meine) :D


    Also, hab das mal ausprobiert mit dem oben geposteten Code. Funktioniert leider nicht :(
    Ich habe auch ein Problem mit dem Qullcode der Webseite. Bsp:

    Quellcode

    1. <a class="proxyList" href="http://whois.sc/69.163.96.2" target="_blank">69.163.96.2:8080</a>
    2. <a class="proxyList" href="http://whois.sc/122.144.4.57" target="_blank">122.144.4.57:8080</a>
    3. <a class="proxyList" href="http://whois.sc/1.193.58.95" target="_blank">1.193.58.95:8080</a>

    Ich
    weis nicht, wie ich das hnaz hinten auslesen kann (Zweischen
    target="_blank"> und </a>). Denn nur das hinten ist die
    komplette IP-Adresse mit Port.

    Daher lautet meine Frage daher:
    Wie stelle ich das an?

    Mit freundlichen Grüßen
    MrNicolas3003

    Edit by der_Kurt:
    Bitte keine Doppelposts. Nutze die Bearbeiten-Funktion.
    * Posts zusammengefügt *

    Dieser Beitrag wurde bereits 2 mal editiert, zuletzt von „der_Kurt“ ()

    Du meinst, ich soll RegEx benutzen??
    Das müsste dann ungefähr so aussehen:

    Quellcode

    1. Dim Input As String = WebBrowser1.Document.Links
    2. Dim Res() As String
    3. ListBox1.Items.Clear()
    4. Res = Regex.Split(Input, "(((\d {1,3}) (\.|\:)) {4} (\d) {1,5}", RegexOptions.IgnoreCase)
    5. For Each el As String In Res
    6. ListBox1.Items.Add(el.ToString)
    7. Next


    Stimmt das so??
    Wenn nicht, bitte bescheid geben :)

    Grüße
    MrNicolas3003
    Ok, also so:

    Quellcode

    1. Dim pattern As String = "(((\d){1,3})(\.|\:)){4}(\d){1,5}"
    2. Dim input As String = ""
    3. For Each match As Match In Regex.Matches(input, pattern, RegexOptions.IgnoreCase)
    4. ListBox1.Items.Add(match.Value)
    5. Next


    Aber was muss ich dann als Input nehmen??
    Den Link von der Webseite?
    Ich hätte das ganze gerne im Hintergrund. Allerdings muss ich auswählen welche Reaktionszeit die Proxys usw. haben müssen.
    Wie mache ich das?
    Ich muss unter anderem ein RadionButton sowie zwei DomainUpDown auswählen.

    Sorry, dass ich so viele Fragen habe, aber der Internetbrowser soll demächst fertig werden.

    MfG
    MrNicolas3003

    Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von „MrNicolas3003“ ()