Hallo,
mich interessiert zur Zeit das Parsen von HTML. Dazu habe ich mir ueberlegt, dass ich das ganze mit RegEx anfangen sollte. Das ganze soll "nur" ein kleiner Parser werden (heisst, keine Styles & .co) und sollte nur <b>, <i>, <h1> & .co (also HTML1)-Tags auslesen koennen. Die Auswertung habe ich mir so vorgestellt, schoen gelistet fuer die spaetere Bearbeitung:
Mfg
knurbl
mich interessiert zur Zeit das Parsen von HTML. Dazu habe ich mir ueberlegt, dass ich das ganze mit RegEx anfangen sollte. Das ganze soll "nur" ein kleiner Parser werden (heisst, keine Styles & .co) und sollte nur <b>, <i>, <h1> & .co (also HTML1)-Tags auslesen koennen. Die Auswertung habe ich mir so vorgestellt, schoen gelistet fuer die spaetere Bearbeitung:
>h1:Das ist ein Titel
... usw. Doch wie kann ich das anstellen?>b:Dieser Text ist fett
Mfg
knurbl