Text einer Weibseite ausgeben

  • VB.NET

Es gibt 9 Antworten in diesem Thema. Der letzte Beitrag () ist von Kangaroo.

    Text einer Weibseite ausgeben

    Hallo,
    ich versuche gerade ein kleines Programm zuschreiben, welches mir einen bestimmten Teil einer Webseite ausgibt (einen Text).
    Ich habe es schon geschafft den HTML-Code der Webseite in eine TextBox ausgeben zulassen. Wie kann ich nun weiter vorgehen, um mir nur einen bestimmten Teil ausgeben zulassen?

    Freue mich über Antworten.
    Hallo und Willkommen im Forum :)

    Wie hast Du denn den Text der Webseite ausgelesen ? Und wenn Du die Webseite benennen magst, so würde das auch nicht schaden.

    Wenn Du den Text schon hast so kannst Du die Teile die Dich interesseiren
    - per String-Funktionen auslesen ( begrenzt)
    - oder per Regex, was allerdings Anfängern doch manchmal arge Kopfschmerzen bereitet. -> RegEx Tutorial - Blutige Anfänger und Fortgeschrittene

    Ich bin mal davon ausgegangen, dass Du den Text nicht per WebBrowser Control ausgelesen hast, da wäre der Ansatz etwas anders.
    " Ich bin mal davon ausgegangen, dass Du den Text nicht per WebBrowser Control ausgelesen hast, da wäre der Ansatz etwas anders."

    Der weg wäre wohl eher ganz falsch.
    Moderatorin: "Apropo ritzen.." Shin Chan: "hoho sie hat Po ritze gesagt"
    "saying to buy a mac because your anti-virus expired is like saying you're out of condoms so you're just going to go fuck dudes"
    "Wie auch in anderen Threads kann ich leider nichts bieten außer vielleicht spaß beim Skypen aber mehr leider auch nicht." - Sind kinder pornos nicht verboten?

    Glossy Cherry schrieb:

    Der weg wäre wohl eher ganz falsch
    Aha, und warum ist das Deiner Meinung nach 'ganz falsch' ?

    Ich benutze zwar den WB seit Jahren nicht mehr, aber das HtmlDocument bietet per Zugriff auf das Document Object Model mehr + einfachere Möglichkeiten auf Objekte/Methoden/Events als es ein reiner (zwar mächtiger, aber dummer) Text-Parser jemals könnte.

    Aber ich lerne natürlich gerne dazu ...
    @Kangaroo: Mich wunderts dass ich dies sogar noch erklären muss, da dies ziemlich selbstverständlich ist. Das Webbrowser Control rendert die ganze Seite, um nur den Quelltext zu holen benutzt man entweder den webclienten oder einen webrequest, aber keinen Webbrowser, welcher zuerst lahmarschig das ganze unnötige für den Quelltext lädt (zB. Bilder).
    Moderatorin: "Apropo ritzen.." Shin Chan: "hoho sie hat Po ritze gesagt"
    "saying to buy a mac because your anti-virus expired is like saying you're out of condoms so you're just going to go fuck dudes"
    "Wie auch in anderen Threads kann ich leider nichts bieten außer vielleicht spaß beim Skypen aber mehr leider auch nicht." - Sind kinder pornos nicht verboten?

    Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von „Glossy Cherry“ ()

    Weisst Du was der TE insgesamt vorhat ? Ich nicht ...

    Ich denke es macht bei so wenig Projektbeschreibung auch Alternativen aufzuzeigen, wie alles hat auch das WebBrowser Control (manchmal) seinen Sinn.

    Und der Rest steht eh schon oben.
    Also, am besten downloadest du den Code per Webclient den Quelltext und durchsuchst ihn dann nach .jpg" alt=", denn das kommt genau vor jedem Titel. Dann lässt du dir den Nachfolgenden Teil bis zum " ausgeben und speicherst es irgendwo. So dürfte das Funktionieren. Kleine Frage:

    Die Liste der Top100 Charts in Visual Basic ausgeben lassen.
    Die Liste geht bis Top 51.
    Mfg
    Vincent

    @Kangaroo: Wenn es darum geht, eine Seite zu zerlegen, würde ich ihm eher zum HTML Agility Pack raten.
    „Was daraus gefolgert werden kann ist, dass jeder intelligentere User sein Geld lieber für Bier ausgibt, um einen schönen Rausch zu haben, und nicht dieses Ranzprodukt.“

    -Auszug aus einer Unterhaltung über das iPhone und dessen Vermarktung.
    h@Lukas habe ich am Anfang auch benutzt, war nicht schlecht ;)

    Aber dann muss er sich auch in das Document Object Model einarbeiten, irgendeinen Weg muss man halt gehen. Mittlerweile gefällt mir Regex einfach besser.

    Ich denke es ist eher die Frage wie arbeitet die WebSeite:
    - wenn immer per Ajax dynamisch nachgeladen wird ist das Webbrowser Control ungeeignet schwierig zu handhaben, aber vielleicht noch das Einfachste für Neueinsteiger
    - der Webclient genauso
    - und das Agility Pack hilft evtl auch nicht gross weiter