Guten Tag liebe Freunde der Nacht
Ich habe ein kleines Problem beim einlesen einer CSV-File. Und zwar kann es vorkommen, dass die CSV-Files, welche ich geschickt bekomme, unter anderem Buchstaben von anderen Sprachen enthalten beispielsweise aus dem Ungarischen den Buchstaben "Ő". Dieser wird mir allerdings in der CSV mit dem numerischen Wert "#337;" gespeichert. Wenn ich nun die CSV einlesen und mit dem Seperator ";" unterteilen möchte splittet mir mein Code auch nach wie oben genannten Zeichenketten.
Sprich -> In dem Feld steht komplett "Pet&_#337;fi" (ohne _ )
Nach der Bearbeitung durch meinen Code wird aus dem einen Feld -> zwei Felder "Pető" und "fi".
Momentan lese ich die CSV mit einem StreamReader ein und trenne per Split-Funktion
cSeperator wird aus einer Datenbank gelesen und der Funktion übergeben (";")
Kennt ihr dazu eine mögliche Lösung? Ich habe bereits versucht iwie mit RegEx daran rum zu wursteln, das wollte aber dann nicht so wie ich
UPDATE:
Das Encodierung des StreamReaders ist auf Standard gestellt bei UTF-8 bzw ASCII gibt er Umlaute wie ä,ö,ü fehlerhaft zurück
komischerweise ignoriert die Split-Funktion nicht die Semikolons in einem als Text gekennzeichnetem Wert
Mit freundlichen Grüßen
ChrizzleWhizzle
Ich habe ein kleines Problem beim einlesen einer CSV-File. Und zwar kann es vorkommen, dass die CSV-Files, welche ich geschickt bekomme, unter anderem Buchstaben von anderen Sprachen enthalten beispielsweise aus dem Ungarischen den Buchstaben "Ő". Dieser wird mir allerdings in der CSV mit dem numerischen Wert "#337;" gespeichert. Wenn ich nun die CSV einlesen und mit dem Seperator ";" unterteilen möchte splittet mir mein Code auch nach wie oben genannten Zeichenketten.
Sprich -> In dem Feld steht komplett "Pet&_#337;fi" (ohne _ )
Nach der Bearbeitung durch meinen Code wird aus dem einen Feld -> zwei Felder "Pető" und "fi".
Momentan lese ich die CSV mit einem StreamReader ein und trenne per Split-Funktion
cSeperator wird aus einer Datenbank gelesen und der Funktion übergeben (";")
Kennt ihr dazu eine mögliche Lösung? Ich habe bereits versucht iwie mit RegEx daran rum zu wursteln, das wollte aber dann nicht so wie ich
UPDATE:
Das Encodierung des StreamReaders ist auf Standard gestellt bei UTF-8 bzw ASCII gibt er Umlaute wie ä,ö,ü fehlerhaft zurück
komischerweise ignoriert die Split-Funktion nicht die Semikolons in einem als Text gekennzeichnetem Wert
Mit freundlichen Grüßen
ChrizzleWhizzle
Dieser Beitrag wurde bereits 2 mal editiert, zuletzt von „ChrizzleWhizzle“ ()