Encoden von Umlauten (ä -> ä), nicht von HTML-Code (<,> etc.)

BjöNi · 5. Januar 2013, 18:20

Hallo,
ich habe einen String, der folgendermaßen aussehen kann:

PHP-Quellcode

$foo = 'Dies ist ein Text mit vielen Ümläüten, wie z.B. ö, der aber auch HTML-Codes enthalten kann.';

Nun möchte ich als Ausgabe

Dies ist ein Text mit vielen Ümläüten, wie z.B. ö, der aber auch HTML-Codes enthalten kann.

, also als Code

HTML-Quellcode

Dies ist ein Text mit vielen Ümläüten, wie z.B. ö, der aber auch HTML-Codes enthalten kann.

. Bei

PHP-Quellcode

echo $foo;

erhalte ich logischerweise unter Umständen eine verranzte Anzeige der Umlaute, also dachte ich,

PHP-Quellcode

echo htmlentities($foo);

zu verwenden. Da kommt nun aber

Dies ist ein Text mit vielen Ümläüten, wie z.B. ö, der aber auch HTML-Codes enthalten kann.

, als Code also

HTML-Quellcode

Dies ist ein Text mit vielen Ümläüten, wie z.B. ö, der aber auch HTML-Codes enthalten kann.

. Auch logisch, da '<' und '>' ja auch codiert werden.
Inzwischen habe ich es folgendermaßen hinbekommen:

PHP-Quellcode

echo htmlspecialchars_decode(htmlentities($foo));

Ich denke aber, dass das keine besonders schöne Variante ist, da ja zunächst alle Zeichen (inkl. HTML-Codes) kodiert werden und anschließend die nicht benötigten wieder dekodiert werden.
Weiß da jemand eine schönere Lösung für dieses Problem?
Gruß, BjöNi

slice · 6. Januar 2013, 13:09

BjöNi schrieb:

...Bei

PHP-Quellcode

echo $foo;

erhalte ich logischerweise unter Umständen eine verranzte Anzeige der Umlaute...

finde ich nicht "logisch" ... nutz einfach das richtige encoding

Quellcode

header('Content-type: ?/?; charset=utf-8');

oder

Quellcode

<meta http-equiv="Content-Type" content="?/?; charset=utf-8"/>

die fragezeichen musst du noch mit deinem entsprechenden content-type ersetzten und dein problem ist gelöst

Samus Aran · 6. Januar 2013, 13:14

Inzwischen haben wir 2013. Da verwendet man HTML5. Und in HTML5 setzt man das charset so:

HTML-Quellcode

<meta charset="utf-8">

Dann muss man die ranzigen HTML-Umlautersatzcodes auch nicht mehr verwenden.

BjöNi · 6. Januar 2013, 18:35

Naja ok danke, aber ich habe letzten Endes keinen Zugriff auf den Header / die Meta-Angabe (Sprich: Es könnte auch ANSI-Codiert sein), insofern sehe ich eigentlich keinen anderen Weg als die

Samus Aran schrieb:

ranzigen HTML-Umlautersatzcodes

:(

Wenn es keinen Anderen Weg gibt ists auch egal, es funktioniert ja und die Performanceprobleme halten sich bei einem String, der zwei mal umgewandelt wird, in Grenzen ;).

big-d · 7. Januar 2013, 18:01

PHP-Quellcode

echo str_replace(('ä','Ä','ö','Ö','ü','Ü'), ('ä','Ä','ö','Ö','ü','Ü'), $text);

so sollte es eigentlich gehen

BjöNi · 7. Januar 2013, 18:09

Naja, und wie siehts mit é,É,í,Í,ú,Ú,ó,Ó,è,È,ì,Ì,ù,Ù,ò,Ò,ê,Ê,î,Î,û,Û,ô,Ô,ß etc. aus? Ich glaube, da ist der Performanceverlust bei allen Aufrufen zusammen geringer als ich jetzt brauche, um das alles hinzuschreiben

Ich lasse es jetzt einfach so.

big-d · 7. Januar 2013, 18:18

Ein PerformanceVERLUST entsteht mMn nicht, das Ersetzen braucht nicht wirklich viel Speicher / whatever.
Die restlichen Zeichen werden wohl nicht oft genutzt werden, trotzdem kannst Du sie noch erweitern, das Muster sollte ja wohl klar sein.

BjöNi · 7. Januar 2013, 18:22

Das Muster ist mir klar, und zur Not wüsste ich auch php.net zu verwenden...

Ich meinte, dass der Performanceverlust, wenn ich nicht die Replace-Funktion nehme, geringer als die Gesamtdauer, die ich zum Schreiben der Replace-Funktion brauche, ist

big-d · 7. Januar 2013, 18:25

Wenn Du es in eine Funktion packst, die Du immer wieder verwendest, musst Du das nur einmal und nicht drölfmal machen! Ätsch.

BjöNi · 7. Januar 2013, 18:31

Ja ach nee... Trotzdem muss ich es 1x schreiben! Und das ist mir, wenn ich eiglich alle nicht in ANSI vorhandenen Sonderzeichen abdecken will, zu viel arbeit.

Encoden von Umlauten (ä -> ä), nicht von HTML-Code (<,> etc.)

Encoden von Umlauten (ä -> ä), nicht von HTML-Code (<,> etc.)

PHP-Quellcode

HTML-Quellcode

PHP-Quellcode

PHP-Quellcode

HTML-Quellcode

PHP-Quellcode

BjöNi schrieb:

PHP-Quellcode

Quellcode

Quellcode

HTML-Quellcode

Samus Aran schrieb:

PHP-Quellcode

Benutzer online 1

Tags

Ähnliche Themen

3 Benutzer haben hier geschrieben