Quelltext eines Frames einer Webseite auslesen

  • Allgemein

Es gibt 10 Antworten in diesem Thema. Der letzte Beitrag () ist von Telcrome.

    Quelltext eines Frames einer Webseite auslesen

    Hallo Leute...
    Ich brauche dringend eure hilfe! Ich komm einfach nicht mehr weiter!

    Ich möchte den Quelltext eines Frames aus einer Webseite auslesen. Möchte die PHP datei aber nicht runterladen! Benutze aber nicht den standart Webbrowser sonder ich habe einen Webkitbrowser in mein Projekt eingebunden ...

    Wie lese ich jetzt den Quelltext eines Frames aus?


    Danke schon mal im voraus!
    Ich denke mal nicht, dass man einen Webseitenquelltext nur in Teilen herunterladen kann. Da müsste man dem entsprechenden Gegenstück auf dem Server erklären können, was man braucht.
    "Luckily luh... luckily it wasn't poi-"
    -- Brady in Wonderland, 23. Februar 2015, 1:56
    Desktop Pinner | ApplicationSettings | OnUtils
    Wenn ich das schreibe:

    VB.NET-Quellcode

    1. MsgBox(WebKitBrowser1.DocumentText)


    dann wird mir das hier ausgegeben:

    HTML-Quellcode

    1. <!DOCTYPE html>
    2. <html>
    3. <head>...</head>
    4. <body>
    5. <iframe name="left" class="left" scrolling="no" src="data/left/index.php" frameborder="0" width="130" ></iframe> </body>
    6. </html>


    was mach ich falsch?
    was mach ich falsch?

    Keine Ahnung? Nichts?
    .DocumentText wird wohl den Quellcode der Seite zurückgeben.
    Woher soll der WebBrowser wissen, dass Du nur das Frame willst?

    Aber Du hast den Quellcode ja schon.
    Dann braucht's nur ein Bisschen RegEx-Parsen und schon hast Du Deine Infos.

    Edit: Oder willst Du den Inhalt der Datei haben, die beim Attribut scr angegeben ist?
    "Luckily luh... luckily it wasn't poi-"
    -- Brady in Wonderland, 23. Februar 2015, 1:56
    Desktop Pinner | ApplicationSettings | OnUtils
    Mein Problem ist nur das der Inhalt des Frames (der Quelltext) im kompletten Quelltext der Seite nicht angezeigt/mitgeladen wird?

    wieso?

    wenn der Quelltext des Frames ja wenigstens geladen wird, hätte ich es ja schon längst mit Reg-ex gemacht
    Das heißt also, dass normalerweise DocumentText sowas sein sollte?:

    HTML-Quellcode

    1. <!DOCTYPE html>
    2. <html>
    3. <head>...</head>
    4. <body>
    5. <iframe name="left" class="left" scrolling="no" src="data/left/index.php" frameborder="0" width="130" >
    6. <beispiel>
    7. Das ist Text... <br />
    8. Hier noch ein Bisschen.
    9. </beispiel>
    10. </iframe> </body>
    11. </html>
    "Luckily luh... luckily it wasn't poi-"
    -- Brady in Wonderland, 23. Februar 2015, 1:56
    Desktop Pinner | ApplicationSettings | OnUtils
    Wenn sowas raus kommen würde wäre mein Problem ja gelöst!

    Wenn ich die Webseite im Google Chrome öffnen und dann mit der rechten Maustaste sage "Seiten-Quelltext anzeigen" kommt auch nur das raus

    HTML-Quellcode

    1. <!DOCTYPE html>
    2. <html>
    3. <head>...</head>
    4. <body>
    5. <iframe name="left" class="left" scrolling="no" src="data/left/index.php" frameborder="0" width="130" ></iframe></body>
    6. </html>


    Sag ich in Google Chrome aber "Frame-Quelltext anzeigen" dann liest er mir nur den Quelltext des Frames aus ... das würde mir aber schon reichen!

    Aber wie mach ich das, dass mir entweder der ganze Quelltext angezeigt wir oder nur der gebrauchte Frame Quelltext?
    Ach so.
    Dann willst Du also doch den Inhalt der Datei auslesen, die beim Attribut src angegeben ist?
    Hier wäre das also src="data/left/index.php".
    Am besten Du probierst mit RegEx herum, bis Du den Pfad raus bekommst.
    Das Pattern dürfte so in der Richtung aussehen:

    Quellcode

    1. \<iframe.* src="(<src>.*)" .*\>

    Parst also den gesamten Bereich von "<iframe" bis zum schließenden ">".
    Dort drin befindet sich eine Grup namens src, die den Pfad beinhaltet.
    Wie Du den Pfad jetzt genau zusammenstellen musst weiß ich nicht.
    Es wäre z.B. so möglich:
    "http://beispiel.xy/" & srcPfad

    Dann kannst Du den Inhalt der Datei herunterladen.
    "Luckily luh... luckily it wasn't poi-"
    -- Brady in Wonderland, 23. Februar 2015, 1:56
    Desktop Pinner | ApplicationSettings | OnUtils
    Das würde mich aber auch leider nicht ans Ziel bringen!

    Ich weis nicht welche Seite in dem Frame gerade Angezeigt wird ... die "index.php" Datei ist so zu sagen nur die start Seite! ich möchte aber jetzt mit dem auslesen des Quelltextes herauslesen wie die Webseite die in dem Frame angezeigt wird aussieht.