Effizientes filtern von URLs aus HTML-File

  • C#

    Effizientes filtern von URLs aus HTML-File

    Hallo alle zusammen,

    ich möchte eine App für mein Handy programmieren, dass den HTML-Code einer Webseite abgreift. Interessant wird es an folgendem Punkt:

    In der HTML Datei gibt es folgendes Element

    HTML-Quellcode

    1. <article ... URL="xy.html" Datum=dd.mm.yyyy> ... Beschreibung </article>

    (sinngemäße Darstellung)

    Ich möchte alle Elemente dieser Art aus der HTML Datei filtern und anschließend aus diesen Elementen das Datum, den Link und die Beschreibung extrahieren. Diese Daten möchte ich in eine Tabelle einpflegen. Ziel ist es, dass ich quasi eine kleine News App für mein Handy programmiere, welche mir die Artikel in tabellarischer Form anzeigt.

    Doch wie mache ich die Stringverarbeitung am effizientesten? Soll ich reguläre Ausdrücke benutzen? Zu denen habe ich gelesen, dass sie weniger effizient sind. Das Handy hat auch nicht unendlich Kapazitäten.

    Mir geht es hier insbesondere nur um den Ansatz und nicht um Programmcodes - genrell möchte ich mein kleines Projekt erstmal skizzieren, bevor ich richtig einsteige.

    Ich freue mich auf Lösungsvorschläge.

    MFG
    Fabian