Guten Tag,
ich baue zurzeit ein Scraper und habe ein paar fragen.
ich habe bereits Threading etc. eingebaut damit es alles im code schneller funktioniert, jedoch läuft mir alles zu langsam.
Der Code ist relativ simpel, er guckt ob die die seite eine IP mit einem Port beinhaltet die Regex dafür ist:
Nun jedoch nimmt er von dem string was runtergeladen wird jede proxy einzelt rauß und das dauert natürlich seine Zeit, kann man es vielleicht irgendwie abändern, dass er alle proxys rausfiltert und direkt in die RichTextBox einfügt?
Das würde so nähmlich viel schneller gehen als wenn er sich von unten nach oben langsam durcharbeitet.
LG
ich baue zurzeit ein Scraper und habe ein paar fragen.
ich habe bereits Threading etc. eingebaut damit es alles im code schneller funktioniert, jedoch läuft mir alles zu langsam.
VB.NET-Quellcode
- Public Sub ScrapeProxyDo(address As String)
- Dim wc As New Net.WebClient
- Dim matchCollection As MatchCollection
- Try
- Dim input As String = wc.DownloadString(address)
- matchCollection = REGEX.Matches(input)
- 'ncihts
- For Each obj As Object In matchCollection
- Dim match As Match = CType(obj, Match)
- Dim item As String = match.ToString()
- RichTextBox2.AppendText(item & Environment.NewLine)
- Next
- Catch ex As Exception
- 'Nichts
- End Try
- End Sub
Der Code ist relativ simpel, er guckt ob die die seite eine IP mit einem Port beinhaltet die Regex dafür ist:
Nun jedoch nimmt er von dem string was runtergeladen wird jede proxy einzelt rauß und das dauert natürlich seine Zeit, kann man es vielleicht irgendwie abändern, dass er alle proxys rausfiltert und direkt in die RichTextBox einfügt?
Das würde so nähmlich viel schneller gehen als wenn er sich von unten nach oben langsam durcharbeitet.
LG