Hey,
habe ein Problem.
Ich habe verschiedene Websites auf denen ich Preise auslesen möchte.
Das klappt bei den meisten URLS, die ich lese auch so:
Dies klappt wie gesagt wunderbar. Leider aber variieren die Seiten teilweise. Als Beispiel jetzt:
idealo.de/preisvergleich/Typ/5702016668223.html
Da gibt es "ab.." nicht im Sourcecode.
Dort gibt es aber folgende Stelle:
Diese 6,90 € möchte ich nun auslesen.
Folgendes gibt mir aber keine Ergebnisse:
Er findet einfach nichts. Es gibt leider keine weitere geeignete Stelle im Quelltext. Mit Regex habe ich meine Probleme, kriege kein Pattern aufgestellt mit den Anführungszeichen in dem HTML-Tag..
Hatte folgendes Pattern probiert:
Dann sollte er wenigstens schonmal den Preis finden (zwar mit dem Teil davor, aber besser als nichts erstmal), jedoch auch hier wieder.. nichts.
Woran kann das liegen?
Vielleicht hat ja jemand einen Tipp..
Danke
Gruß xored
habe ein Problem.
Ich habe verschiedene Websites auf denen ich Preise auslesen möchte.
Das klappt bei den meisten URLS, die ich lese auch so:
Quellcode
- Public Function GetBetween(ByVal Source As String, ByVal Del1 As String, ByVal Del2 As String)
- Dim nIndexStart As Integer = Source.IndexOf(Del1)
- Dim nIndexEnd As Integer = Source.IndexOf(Del2)
- If nIndexStart > -1 AndAlso nIndexEnd > -1 Then
- Dim res As String = Strings.Mid(Source, nIndexStart + Del1.Length + 1, nIndexEnd - nIndexStart - Del1.Length)
- Return res
- Else
- End If
- End Function
- Dim request As System.Net.HttpWebRequest = System.Net.HttpWebRequest.Create(strLine)
- Dim response As System.Net.HttpWebResponse = request.GetResponse()
- Dim sr As System.IO.StreamReader = New System.IO.StreamReader(response.GetResponseStream())
- Dim sourcecode As String = sr.ReadToEnd()
- Dim Price As String = GetBetween(sourcecode, "ab", " € ✓ ")
Dies klappt wie gesagt wunderbar. Leider aber variieren die Seiten teilweise. Als Beispiel jetzt:
idealo.de/preisvergleich/Typ/5702016668223.html
Da gibt es "ab.." nicht im Sourcecode.
Dort gibt es aber folgende Stelle:
<span class="table-cell oopStage-priceRangePrice">6,90 € – 11,99 €</span>
Diese 6,90 € möchte ich nun auslesen.
Folgendes gibt mir aber keine Ergebnisse:
Er findet einfach nichts. Es gibt leider keine weitere geeignete Stelle im Quelltext. Mit Regex habe ich meine Probleme, kriege kein Pattern aufgestellt mit den Anführungszeichen in dem HTML-Tag..
Hatte folgendes Pattern probiert:
Dann sollte er wenigstens schonmal den Preis finden (zwar mit dem Teil davor, aber besser als nichts erstmal), jedoch auch hier wieder.. nichts.
Woran kann das liegen?
Vielleicht hat ja jemand einen Tipp..
Danke
Gruß xored
Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von „xored“ ()