Hi,
ich möchte aus einem HTML Dokument alle HREF="..." Strings extrahieren.
Dazu verwende ich folgenden Search String:
Mit anderen Worten: der String muss mit href=" beginnen und dann mit einem " enden.
Dann wende ich damit RegEx.Matches an, um einen Vektor der Treffer zu erzeugen und diesen dann mit Debug.Print zeilenweise anzuzeigen:
Das ist die Eingabe:
Und das ist das Ergebnis:
Wie man sieht, klappt das Coding ja auch prinzipiell. Aber ....
.... aber die Suche hört nach dem " am Ende des Link nicht auf, sondern wird bis zum letzten " fortgesetzt. Deswegen ist der zweite String zu lang. Es sollte nur
ausgegeben werden !
Wer kennt sich in RegEx aus ? Wie kann man erreichen, dass der Match nach dem Auftreten des ersten " nach dem Link beendet wird ?
Ich hoffe, ich habe mein Problem verständlich machen können.
LG
Peter
P.S.: Einen RegEx Tester habe ich bereits ....
ich möchte aus einem HTML Dokument alle HREF="..." Strings extrahieren.
Dazu verwende ich folgenden Search String:
Mit anderen Worten: der String muss mit href=" beginnen und dann mit einem " enden.
Dann wende ich damit RegEx.Matches an, um einen Vektor der Treffer zu erzeugen und diesen dann mit Debug.Print zeilenweise anzuzeigen:
VB.NET-Quellcode
- Dim regExFound = Regex.Matches(txtData.Text, txtRegExSearch.Text, RegexOptions.IgnoreCase)
- Dim i As Integer = 0
- Debug.Print(NewLine & "Split: " & txtRegExSearch.Text & NewLine)
- For Each myFound In regExFound
- i += 1
- Debug.Print("Line " & i.ToString.PadLeft(5) & ": " & myFound.ToString)
- Next
- Debug.Print(NewLine & "Strings found: " & i.ToString("n0"))
Das ist die Eingabe:
Und das ist das Ergebnis:
Wie man sieht, klappt das Coding ja auch prinzipiell. Aber ....
.... aber die Suche hört nach dem " am Ende des Link nicht auf, sondern wird bis zum letzten " fortgesetzt. Deswegen ist der zweite String zu lang. Es sollte nur
ausgegeben werden !
Wer kennt sich in RegEx aus ? Wie kann man erreichen, dass der Match nach dem Auftreten des ersten " nach dem Link beendet wird ?
Ich hoffe, ich habe mein Problem verständlich machen können.
LG
Peter
P.S.: Einen RegEx Tester habe ich bereits ....
Dieser Beitrag wurde bereits 2 mal editiert, zuletzt von „Peter329“ ()