Zeichenkonvertierung von UTF8 zu Latin-1 (iso-8859-1)

tScheckSn · 28. Oktober 2014, 14:50

Hallo,

Ich verzweifle gerade am Konvertieren von Zeichenketten:
Ich möchte eine Zeichenkette die vom SQL Server gelesen wurde und vermutlich im Format utf8 ist nach latin-1 (iso-8859-1) konvertieren.

Meine Funktion dazu sieht so aus:

VB.NET-Quellcode

Private Function ZeichensatzAnpassen(ByVal utf8 As String) As Byte()
Dim unicode As Encoding = Encoding.Default
' auch schon versucht mit Dim unicode As Encoding = Encoding.Unicode
Dim unicodeBytes As Byte() = unicode.GetBytes(utf8)
Dim iso8859 As Encoding = Encoding.GetEncoding("iso-8859-1")
Dim result As Byte() = Encoding.Convert(Encoding.UTF8, iso8859, unicodeBytes)
Return result
End Function

Leider werden alle Sonderzeichen durch ein Fragezeichen ersetzt. Das Latin1 nicht alle sonderzeichen kann ist mir klar, es sollte aber zumindest mit "äüöÖÄÜ" funktionieren.
Hat jemand einen Tipp für mich, wie ich eine saubere Konvertierung hinbekomme?

Schon Danke im Voraus!
Lg

RodFromGermany · 28. Oktober 2014, 15:14

@tScheckSn Konvertiere diese Zeichen nach UNICODE, da sind sie alle darstellbar.

tScheckSn · 28. Oktober 2014, 15:18

Die Zeichen sind in Unicode / UTF8. Da kann ich sie auch richtig darstellen
Ich brauche sie aber Zwingend in latin-1, da das alte System, in dem sie verarbeitet werden sollen nur latin-1 lesen kann. Die Zeichen werden anschließend in eine Datei geschrieben.
Nur wird bei meiner Funktion aus "Überprüfen" "?berpr?fen".
Im Zeichensatz von latin-1 sind aber die "ü"-Zeichen vorhanden. Es wird also nur falsch konvertiert, und ich weis nicht was ich im code ändern soll.
Edit:
Hab die Lösung selbst gefunden, es war ein Tippfehler. Für alle die die Funktion evtl. braucehn:

VB.NET-Quellcode

Private Function ZeichensatzAnpassen(ByVal input As String) As Byte()
Dim OriginalCodierung As Encoding = Encoding.GetEncoding("utf-8")
Dim iso8859 As Encoding = Encoding.GetEncoding("iso-8859-1")
Dim OriginalBytes As Byte() = OriginalCodierung.GetBytes(input)
Dim result As Byte() = Encoding.Convert(OriginalCodierung, iso8859, OriginalBytes)
Return result
End Function

Danke
lg

RodFromGermany · 28. Oktober 2014, 16:02

tScheckSn schrieb:

Die Zeichen sind in Unicode / UTF8

Aha.
Dann musst Du 2 Mal wandeln. Zunächst in UNICODE und von da nach Latin-1. Sonst geht Information flöten.

ErfinderDesRades · 28. Oktober 2014, 16:19

eiglich braucht man sowas ühaupt nicht.
Hat man einen String im Code, so ist der immer unicode. Will man den unter encodeing 0815 abspeichern, so gibt man dem StreamWriter dieses Encoding eben an und gut ist.

Zeichenkonvertierung von UTF8 zu Latin-1 (iso-8859-1)

Zeichenkonvertierung von UTF8 zu Latin-1 (iso-8859-1)

VB.NET-Quellcode

VB.NET-Quellcode

tScheckSn schrieb:

Tags

Ähnliche Themen

3 Benutzer haben hier geschrieben