Httpwebrequest Regex erkennt Zeichen nicht

  • VB.NET
  • .NET (FX) 4.0

Es gibt 4 Antworten in diesem Thema. Der letzte Beitrag () ist von Thunderbolt.

    Httpwebrequest Regex erkennt Zeichen nicht

    Guten Tag,

    heute hätte ich mal eine Farge bezüglich Regex.

    Ich Lese mit einem Httpwebrequest eine Website aus und möchte diese mit Regex dann nach Infos durchsuchen. Soweit so gut.
    Allerdings scheint Regex nicht in der lage zu sein den folgenden String zu trennen.

    HTML-Quellcode

    1. <h3><a href="/movie/4327-charlie-s-angels" title="3 Engel für Charlie">3 Engel für Charlie</a> <span>(2000)</span></h3> <p>Director: <a href="/person/36425-mcg">McG</a></p> <p>Writers: <a href="/person/1300-john-august">John August</a>, <a href="/person/9612-ed-solomon">Ed Solomon</a>, <a href="/person/36426-ryan-rowe">Ryan Rowe</a></p> <p>Starring: <a href="/person/6941-cameron-diaz">Cameron Diaz</a>, <a href="/person/140-lucy-liu">Lucy Liu</a>, <a href="/person/69597-drew-barrymore">Drew Barrymore</a>, <a href="/person/1532-bill-murray">Bill Murray</a></p> </div> <div style="clear: both;"></div> </li> <li> <div class="poster"> <a href="/movie/9471-charlie-s-angels-full-throttle" title="3 Engel für Charlie - Volle Power"><img class="right_shadow" src="http://image.tmdb.org/t/p/w92/ohvKuCKb7ImAXRYWOtwQP8uMMeV.jpg" width="92" height="138" /></a> </div> <div class="info"> <h3><a href="/movie/9471-charlie-s-angels-full-throttle" title="3 Engel für Charlie - Volle Power">3 Engel für Charlie - Volle Power</a> <span>(2003)</span></h3>


    Denn wenn ich mit Regex folgendes suche: <h3><a href=".*title=".*[0-9]{4}\).*h3>
    erhalte ich den kompletten oben gezeigten String zurück.
    D.H. Regex teilt nicht zwischen </span></h3> und <p>Director: in der obersten Zeile auf wo aber ja offensichtlich ein Leerzeichen bzw. ein Zielenumbruch der so etwas ist.

    Regex soll mir eigentlich nur : <h3><a href="/movie/4327-charlie-s-angels" title="3 Engel für Charlie">3 Engel für Charlie</a> <span>(2000)</span></h3>
    auswerfen
    Hat von euch jemand vielleicht eine Idee wie ich Regex dazu bekomme ??

    Vielen Dank
    und schon mal einen guten rutsch ins neue Jahr!!

    Thread-Tags korrigiert. Das ist kein VB6. ~Thunderbolt
    It's not a bug, it's a feature

    Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von „Thunderbolt“ ()