Regexfilter bei einer Internetseite

  • VB.NET

Es gibt 2 Antworten in diesem Thema. Der letzte Beitrag () ist von OneWorld.

    Regexfilter bei einer Internetseite

    Moin Moin alle zusammen,

    ich habe mal wieder ein Problem. Undzwar befasse ich mich zurzeit mit dem Auslesen von Internetseiten mit Regex und HttpWebRequest. Allerdings bräuchte ich da gerade etwas Hilfe mit meinem Patternstring. Der Quelltext von Wikipedia z.b ist ja sehr komplex(Links, Bilder, etc). Eine Menge Informationen davon sind für mich unwichtig also brauch ich die auch nicht auszulesen. Nun zu meiner Frage wenn ich ich jetzt ein Quelltextschnipsel habe wie z.b der hier, wo sich ein Link drinne befindet :

    HTML-Quellcode

    1. <p>Die Mathematik ist eine der ältesten Wissenschaften. Ihre erste Blüte erlebte sie noch vor der"" <a href=""/wiki/Antike"" title=""Antike"">Antike</a> in <a href=""/wiki/Mesopotamien"" title=""Mesopotamien"">Mesopotamien</a>, <a href=""/wiki/Indien"" title=""Indien"">Indien</a> und <a href=""/wiki/China"title="China">China</a>. Später in der <a href="/wiki/Antike" title="Antike">Antike</a> in Griechenland und im <a href="/wiki/Hellenismus" title="Hellenismus">Hellenismus</a>, von dort datiert die Orientierung an der Aufgabenstellung des „rein logischen Beweisens“ und die erste <a href="/wiki/Axiomatisierung" title="Axiomatisierung">Axiomatisierung</a>, nämlich die <a href="/wiki/Euklidische_Geometrie" title="Euklidische Geometrie">euklidische Geometrie</a>. Im Mittelalter überlebte sie unabhängig voneinander im frühen Humanismus der Universitäten und in der arabischen Welt.</p>")


    Wie kann ich den Link dann ganz raus lassen ? Geht das überhaupt ?


    Gruß OnWorld
    Youtube Info Library 2013 jetzt im Showroom.