Spezielle Frage zum WebRequest + Streamreader

  • VB.NET

Es gibt 3 Antworten in diesem Thema. Der letzte Beitrag () ist von SomeFriendlyDude.

    Spezielle Frage zum WebRequest + Streamreader

    Tag!

    Bin noch relativ neu hier und auch noch nicht so ganz erfahren in Programmieren deswegen bitte ein bisschen Rücksicht nehmen (und nein, ich wäre nicht zu Faul um mir irgendwelche MSDN-Einträge durchzulesen ;)
    Ich hab gemerkt dass man nur was lernt in dem man wirklich viel übt und nicht durch irgendwelche Tutorials und so weiter.. Aber eine Frage hätte ich jetzt schon.

    Und zwar...

    Vorhaben:

    Von einer bestimmten Seite die an die 6000 Artikel hat, immer ein bestimmtes Wort aus einer Tabelle auslesen. Das PHP-Script hat als Parameter etwas wie "script.php?id=...." und diese ID beginnt bei 1 und geht bis in etwa rauf auf 6000. Der Tabelleneintrag steht folglich immer in der gleichen Zeile, hat jedoch jedesmal einen anderen Eintrag. Diesen Eintrag möchte ich auslesen und mit der Artikel-ID in einer *.txt speichern.

    Problem:

    Mein Problem ist jetzt, dass ich es zwar grundsätzlich schon schaffe, nur geht es einfach viel zu lange wenn der StreamReader jedesmal den ganzen HTML-Quelltext aus dem Stream lesen muss. (Welcher dann in eine Str-Variable übergeben wird)
    Ich weiß jedoch dass dieser Eintrag im HTML-Quelltext immer in der Zeile 237 steht.

    Meine Frage ist jetzt, ob mir jemand eine bessere Möglichkeit schildern könnte. Brauche nicht unbedingt einen fertigen SRC-Code sondern nur den Ansatz oder so..

    Ich hoffe ich hab das jetzt halbwegs verständlich geschrieben - Ich kann natürlich genauere Infos liefern.

    greetz & Schonmal Danke falls jemand vorhat zu helfen ;)

    Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von „SomeFriendlyDude“ ()

    Yo,

    klar kann ich das.

    Quellcode

    1. http://anisearch.de/index.php?page=anime&id=3633&hentai=yes


    Also kurz die Erklärung dazu:

    Quellcode

    1. &id=3633
    ist logischerweise die ID einer Serie. Die geht von 1 bis ziemlich genau 6081.

    Quellcode

    1. &hentai=yes
    schaltet die Altersabfrage ab. Denn manche Serien werden von den Autoren als Jugendgefährdend eingestuft und möchtes deshalb zuerst eine Bestätigung. -> Folge: Name ist dann nicht im HTML-Text enthalten.

    Quellcode

    1. <td valign="top" class="atitle1">Original</td>
    2. <td class="acontent1">Death Note</td>



    -> Das sind die Zeilen in denen der Name enthalten ist. (Zeile 237)


    EDIT: Ausschnitt ausm SRC-Code:


    Quellcode

    1. Dim R As System.Net.WebRequest = System.Net.WebRequest.Create(Link)
    2. Stream = R.GetResponse.GetResponseStream
    3. sr = New System.IO.StreamReader(IoStream)
    4. Return sr.ReadToEnd


    Quellcode

    1. For i = 1 to CInt(Textbox1.text)
    2. temptext = GETHTML("http://anisearch.de/index.php?page=anime&id=" & i & "&hentai=yes")
    3. temppos(1) = temptext.IndexOf("acontent1") + 11
    4. temppos(2) = temptext.IndexOf("</td>", temppos(1))
    5. temppos(3) = temppos(2) - temppos(1)
    6. names(i) = i & "=" & temptext.Substring(temppos(1), temppos(3))
    7. sw.WriteLine(names(i))
    8. Next

    Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von „SomeFriendlyDude“ ()