[RegEx] Multiline im Quelltext

  • VB.NET

Es gibt 4 Antworten in diesem Thema. Der letzte Beitrag () ist von Comet.

    [RegEx] Multiline im Quelltext

    Hallo,

    Versuche nun seit mehreren Tagen einen bestimten Inhalt aus einem Quelltext einer Website "herauszulesen". (Quelltext wird via HttpWebRequest geholt)

    Quelltext Ausschnitt:

    HTML-Quellcode

    1. <tr>
    2. <td>Title:</td>
    3. <td>AUSZULESENDER_INHALT</td>
    4. </tr>


    Ich bekomme das Suchmuster für Regex einfach nicht hin. Wenn es nur eine Line betrifft habe ich keine Schwierigkeiten. Doch da komme ich an meine grnzen!

    Hoffe irgentwer hat eine Antwort auf meine Frage.

    Mit freundlichen Grüßen
    Comet
    Wenn es nur eine Line betrifft habe ich keine Schwierigkeiten.
    Ich bin davon ausgegangen das du es verstehst.
    Aber nagut.

    Quellcode

    1. \<td\>Title:\<\/td\> = <td>Title:</td> nur "escaped"
    2. \n = Zeichen für einen Zeilenumbruch
    3. (?(.*))\<td\> = Alle Zeichen bis <td>AUSZULESENDER_INHALT</td>
    4. (?<Inhalt>([^<]+)) = Alle Zeichen nach <td> bis auf <.
    hmm... Danke!
    Aber iwie bin ich wohl zu doof :(

    VB.NET-Quellcode

    1. Dim titelliste As MatchCollection
    2. Dim titelrequest As System.Net.HttpWebRequest = System.Net.HttpWebRequest.Create("http://www.***.com/***/***/" & trid_tb.Text)
    3. titelrequest.CookieContainer = cookie
    4. Dim titelresponse As System.Net.HttpWebResponse = titelrequest.GetResponse
    5. Dim sr As System.IO.StreamReader = New System.IO.StreamReader(titelresponse.GetResponseStream())
    6. Dim rssourcecode As String = sr.ReadToEnd
    7. 'Clipboard.SetText(rssourcecode)
    8. Dim r As New System.Text.RegularExpressions.Regex("\<td\>Title:\<\/td\>\n(?(.*))\<td\>(?<Inhalt>([^<]+))")
    9. titelliste = r.Matches(rssourcecode)
    10. For Each titel As Match In titelliste
    11. TextBox1.Text = titel.ToString ' Treffer zur Kontrolle ausgeben
    12. Next


    Mache ich was falsch? (Textbox1 bleibt leer)