Links aus einer Webseite auslesen

  • VB.NET

Es gibt 4 Antworten in diesem Thema. Der letzte Beitrag () ist von Michi14.

    Links aus einer Webseite auslesen

    Hi Leute,

    ich habe vor, alle Links aus dem Quelltext einer Webseite auszulesen. Ich habe gehört, dass man das mit Regex, Substrings oder ähnlichem machen kann.
    Es würde mich sehr freuen, wenn ihr mir da weiterhelfen könntet.

    Grüße
    Michi
    @Michi14
    Angucken: [Allgemein] Regular Expressions von 0 an

    VB.NET-Quellcode

    1. Option Strict On
    2. Imports System.Text.RegularExpressions
    3. Public Class Form1
    4. Private WithEvents w As New Net.WebClient
    5. Private Sub Form1_Load(ByVal sender As System.Object, ByVal e As System.EventArgs) Handles MyBase.Load
    6. w.DownloadStringAsync(New Uri("http://de.selfhtml.org/html/verweise/definieren.htm"))
    7. End Sub
    8. Private Sub w_DownloadStringCompleted(ByVal sender As Object, ByVal e As System.Net.DownloadStringCompletedEventArgs) Handles w.DownloadStringCompleted
    9. Dim quelltext As String = e.Result
    10. quelltext = quelltext.Replace(Environment.NewLine, "")
    11. Dim r As New Regex("<a href=.(?<url>(.*?))>")
    12. Dim matches As MatchCollection = r.Matches(quelltext)
    13. For Each m As Match In matches
    14. If m.ToString().Contains("http://") Or m.ToString().Contains("www.") Then
    15. MessageBox.Show(m.Groups("url").Value.ToString())
    16. End If
    17. Next
    18. End Sub
    19. End Class