ANSI Text einlesen

JLH · 14. August 2023, 10:15

Eigentlich habe ich diese Problem seit dem Anfang aber Kleinigkeiten zum Schluß....
Ich lese Daten ein welche überwiegend mit unserem Berechnungsprogram aus der VB6 Zeit erstellt wurden. Notpad++ sagt es wäre ANSI. Neue Daten aus VS2022 werdn in UTF-8 gespeichert. Öffne ich alte Dateien so habe ich diese schwarzen Karos mit den Fragezeichen drin. Ich habe mein Code (natürlich ohne Erfolg) so probiert:

VB.NET-Quellcode

Dim myStream As System.IO.StreamReader = Nothing
Dim openFileDialog As New OpenFileDialog()
openFileDialog.Filter = "Profil Datei (*.evo)|*.evo|All files (*.*)|*.*"
openFileDialog.FilterIndex = 1
openFileDialog.RestoreDirectory = True
If openFileDialog.ShowDialog() = System.Windows.Forms.DialogResult.Cancel Then
Exit Sub
End If
myStream = My.Computer.FileSystem.OpenTextFileReader(openFileDialog.FileName, System.Text.Encoding.ANSI)
FrmMain.LblKunde.Text = myStream.ReadLine
FrmMain.LblBeschreibung.Text = myStream.ReadLine
FrmMain.LblKomNr.Text = myStream.ReadLine
FrmMain.lblBearbeiter.Text = myStream.ReadLine

Weiß jemand wie ich die Daten richtig einlesen kann?

RodFromGermany · 14. August 2023, 10:33

JLH schrieb:

VB.NET-Quellcode

myStream = My.Computer.FileSystem.OpenTextFileReader(openFileDialog.FileName, System.Text.Encoding.ANSI)

Probier mal
System.Text.Encoding.GetEncoding(437)

VaporiZed · 14. August 2023, 10:38

Das � erhalte ich immer dann, wenn ich z.B. mit IO.File.ReadAllLines ANSI-Dateien einlese, aber als Encoding UTF-8 angebe.
Probier es daher mal mit … eh … mit welchem Framework arbeitest Du? 4.8 kennt kein System.Text.Encoding.ANSI

ISliceUrPanties · 14. August 2023, 10:42

Hallo,
StreamReader implementiert IDisposable und sollte somit disposed werden! Entweder direkt, wenn du fertig mit lesen bist, oder du verwendest einen Using-Block.
Bist du sicher, das der Code kompiliert? System.Text.Encoding.ANSI gibt es doch gar nicht. Du musst herausfinden, mit welcher Codepage deine Datei geschrieben wurde. Dann kannst du mit System.Text.Encoding.GetEncoding(codePage) das korrekte Encoding übergeben.

JLH · 14. August 2023, 11:06

@Rod Neee, funzt nicht. System.NotSupportedException: "No data is available for encoding 437. For information on defining a custom encoding, see the documentation for the Encoding.RegisterProvider method."
@VaporiZed ich verwende .Net 6.0, kein .Net Framework.
@ISliceUrPanties da im Moment 99,999% meiner Dateien ANSI sind würde ich mich zunächst mit dem öffnen dieser als solche begnügen... Und ja, so kompiliert das.

Stop! Eh nein... jetzt nicht mehr. Bevor ich dieses Post verfasst habe hatte ich "ANSI" und dann "UTF8" probiert. Beides ohne Erfolg. Jetzt wieder auf "ANSI" geändert und es geht nicht (mehr)

VaporiZed · 14. August 2023, 11:13

Dass Du .NET 6 verwendest, gehört zur Klarstellung in die Thread-Tags. Ich ergänz das mal …

ANSI gibt es aber auch nicht in .NET

Laut .NET-DLL gibt es:

Spoiler anzeigen

VB.NET-Quellcode

'
' Zusammenfassung:
' Gets an encoding for the UTF-8 format.
'
' Rückgabewerte:
' An encoding for the UTF-8 format.
Public Shared ReadOnly Property UTF8 As Encoding
'
' Zusammenfassung:
' Gets an encoding for the UTF-7 format.
'
' Rückgabewerte:
' An encoding for the UTF-7 format.
<Obsolete("The UTF-7 encoding is insecure and should not be used. Consider using UTF-8 instead.", DiagnosticId:="SYSLIB0001", UrlFormat:="https://aka.ms/dotnet-warnings/{0}")>
Public Shared ReadOnly Property UTF7 As Encoding
'
' Zusammenfassung:
' Gets an encoding for the UTF-32 format using the little endian byte order.
'
' Rückgabewerte:
' An encoding object for the UTF-32 format using the little endian byte order.
Public Shared ReadOnly Property UTF32 As Encoding
'
' Zusammenfassung:
' Gets an encoding for the UTF-16 format using the little endian byte order.
'
' Rückgabewerte:
' An encoding for the UTF-16 format using the little endian byte order.
Public Shared ReadOnly Property Unicode As Encoding
'
' Zusammenfassung:
' Gets an encoding for the UTF-16 format that uses the big endian byte order.
'
' Rückgabewerte:
' An encoding object for the UTF-16 format that uses the big endian byte order.
Public Shared ReadOnly Property BigEndianUnicode As Encoding
'
' Zusammenfassung:
' Gets an encoding for the Latin1 character set (ISO-8859-1).
Public Shared ReadOnly Property Latin1 As Encoding
'
' Zusammenfassung:
' Gets an encoding for the ASCII (7-bit) character set.
'
' Rückgabewerte:
' An encoding for the ASCII (7-bit) character set.
Public Shared ReadOnly Property ASCII As Encoding
'
' Zusammenfassung:
' Gets the default encoding for this .NET implementation.
'
' Rückgabewerte:
' The default encoding for this .NET implementation.
Public Shared ReadOnly Property [Default] As Encoding

Und wenn man System.Text.Encoding.Default in .NET verwendet, bekommt man das UTF-8-Encoding. Und was rauskommt, wenn man ANSI-Dateien mit UTF-8-Encoding ausliest, hab ich bereits in Post#3 geschrieben: Sonderzeichen wie das von Dir beobachtete �

ISliceUrPanties · 14. August 2023, 11:28

Ich bin mir nicht ganz sicher, dass du verstanden hast, worauf ich hinaus will.
System.Text.Encoding.ANSI gibt es nicht - auch nicht unter .NET 6, siehe Doku. Den ANSI-Standard gibt es mit diversen Codepages. Wenn du eine falsche auswählst, hast du halt komische Zeichen in deinem Text. (Dylan Beattie spricht int diesem Video über ebendiese Problematik - sehr kurzweilig :))
Ich würde es mal mit cp 1250 oder 1252 versuchen.

Quellcode

myStream = My.Computer.FileSystem.OpenTextFileReader(openFileDialog.FileName, System.Text.Encoding.GetEncoding(1250))

VaporiZed · 14. August 2023, 11:33

Ah, ok, es gab einen Edit in Post#5.
Also: ANSI scheint es auch bei Dir nicht zu geben.
Jetzt ist die Frage, wie es weitergeht. Ich hatte neulich ein ähnliches Problem mit alten Dateien. Da habe ich mir über ein kleines .NET-Framework-Programm schnell alle Dateien (nach einem Dateibackup

) per System.Text.Encoding.Default (in .NET-Framework = ANSI) eingelesen und mit System.Text.Encoding.UTF8 wieder in die Dateien geschrieben, sodass ich das mit meinen neuen .NET-Programmen langfristig nutzen kann.

JLH · 14. August 2023, 11:52

@VaporiZed: Danke. Das es da eine Unterscheidung gibt wußte ich nicht.
@ISliceUrPanties: Stimme ich Dir zu... siehe meine Verbesserung. Könnte schwören ich hatte es so stehen gehabt...

Es ist wohl 1252 aber damit bekomme ich es auch nicht auf (siehe Post#6) mit 28591 sind die Buchstaben korrekt.
Ich habe jetzt aber eine viel größere Schwierigkeit entdeckt... Zum Testen wollte ich eine neue Datei mit Umlauten im Text anlegen. Fülle ich in meine Felder Wörter mit einen Umlaut ein kommt sofort eine Fehlermeldung "No data availible for encoding 1252." (Wie kann man ein Bild einfügn) Diese Problem müßte ich jetzt zuerst mal lösen...

petaod · 14. August 2023, 12:14

JLH schrieb:

(Wie kann man ein Bild einfügn

Erweiterte Antwort ... Dateianhang

VaporiZed · 14. August 2023, 12:26

JLH schrieb:

Fülle ich in meine Felder Wörter mit einen Umlaut ein kommt sofort eine Fehlermeldung

Und wie lautet der Code, der dazu führt? Wenn man Daten in eine normale TextBox einfügt, passiert sowas garantiert nicht. Welcher Code läuft also zu diesem Zeitpunktt ab? Und warum hast Du Codepage 1252 eingestellt, wenn Du weißt, dass Du 28591 brauchst?

JLH · 14. August 2023, 13:02

Ok... verzeiht mir, aber ich frage mich jetzt was ist das für eine Schei... Ich bin mit VS 2022 brav von .Net Framework zu .Net 6.0 weil das angeblich so besser ist. Ich verwende seit VB6 folgende Zeilen um meine Eingaben zu prüfen. Ein bisschen mehr oder weniger wenn es um . , + - 1 2 3 4 5 6 7 8 9 0 geht.

VB.NET-Quellcode

Private Sub Eingabe_KeyPress(sender As Object, e As KeyPressEventArgs) Handles Eingabe.KeyPress
Dim KeyAscii As Short = Asc(e.KeyChar)
If KeyAscii = 13 Then
System.Windows.Forms.SendKeys.Send("{TAB}")
KeyAscii = 0
End If
e.KeyChar = Chr(KeyAscii)
If KeyAscii = 0 Then
e.Handled = True
End If
End Sub

In .Net Framework ist alles super wie immer, in .Net 6.0 nada. Hab zum Testen eine Form mit TextBox erstellt und den Code eingesetzt. Was kann man machen damit .Net 6.0 was die Codepages angeht die selbe Funktionalität wie .Net Framework hat? Hat es einen tiefen Sinn das man das jetzt aus .Net kastriert hat?

VaporiZed · 14. August 2023, 13:28

Du vermischst nun also VB6-Funktionen mit dem neuesten Unterbau …
28591 und 1252* sind einige wenige von vielen Codepages, die aber nicht genügend Zeichen enthält, um mit den neuesten internationalen Anforderungen gerecht zu werden.
Auch wenn das zu lösende Problem inhaltlich komplett anders angehen würde, probier mal:

VB.NET-Quellcode

Private Sub Eingabe_KeyPress(sender As Object, e As KeyPressEventArgs) Handles Eingabe.KeyPress
Dim KeyAscii = Convert.ToInt16(e.KeyChar)
If KeyAscii = 13 Then
System.Windows.Forms.SendKeys.Send("{TAB}")
KeyAscii = 0
End If
e.KeyChar = Convert.ToChar(KeyAscii)
If KeyAscii = 0 Then
e.Handled = True
End If
End Sub

*offensichtlich arbeitet Asc mit 1252.

Vielleicht liegt es auch daran, dass die 1252 nicht registriert ist, siehe stackoverflow.

JLH · 14. August 2023, 14:01

Naja.... ich habe mit VB2005 glaube ich war's die Sache konvertiert. Dabei kam ein Code raus der mehr oder weniger geändert werden mußte. Die originl Zeilen sind

Visual Basic-Quellcode

Private Sub txtBearbeiter_KeyPress(KeyAscii As Integer)
If KeyAscii = 13 Then
SendKeys "{TAB}"
KeyAscii = 0
End If
End Sub

Ich versuch aber gerne Deinen Vorschlag. Ich bin aber für jede Verbesserung offen. Ich habe eben nichts geändert wenn es lief.

Nicht, daß wir jetzt die zwei Themen verwechseln...

Und warum hast Du Codepage 1252 eingestellt, wenn Du weißt, dass Du 28591 brauchst?

Hab ich ja nicht... Als ich im Program mit dem ich speichere die Fehlermeldung bekommen habe stand da ja drin "No Data for 1252..." Also gehe ich davon aus, daß das VB6 Program die Daten als solche abgelegt hat. Mein Neues kann diese Daten mit 1252 nicht öffnen da 1252 nicht im .Net enthalten ist. Hab ich ja erst bemerkt als ich es probiert habe. Das 28591 habe ich dann im Codepage gefunden. Mit dem hat das Öffnen der Alten Dateien funktioniert. Jetzt habe ich also alte Dateien im 1252 Format und neue im UTF-8. Mit einem neuen Programm was etwas völlig anderes ist sollen nun die Berechnungen weiterverarbeitet werden. Jetzt kommt natürlich die Arbeit mit der Abfrage ob es eine neue oder alte Datei ist...

Dein Code oben verwende ich jetzt im "Speicher Programm" damit Herr Müller auch Kunden mit Umlauten im Namen speichern kann.

VaporiZed · 14. August 2023, 21:10

JLH schrieb:

Jetzt kommt natürlich die Arbeit mit der Abfrage ob es eine neue oder alte Datei ist

Ist ja leicht rauszufinden. Datei mit Encoding einlesen und schauen, ob es passen könnte:

VB.NET-Quellcode

Private Sub CheckFileForFittingCodepage(FilePath As String)
System.Text.Encoding.RegisterProvider(System.Text.CodePagesEncodingProvider.Instance) 'siehe Post#13
For Each Codepage In {1252, 28591, 65001}
Dim DecodedText = IO.File.ReadAllText(FilePath, System.Text.Encoding.GetEncoding(Codepage))
If "äöüÄÖÜ".Any(Function(x) DecodedText.Contains(x)) Then MessageBox.Show($"Codepage {Codepage} würde passen.")
Next
End Sub

JLH · 15. August 2023, 08:14

Thanx! Das werde ich heute einbauen

Eierlein · 17. August 2023, 14:47

Wie funktioniert Ansi Text bei Net core?

Ein Consolen Testprogramm:

VB.NET-Quellcode

Imports System
Imports System.Text
Imports System.IO
Module Program
Sub Main(args As String())
Encoding.RegisterProvider(CodePagesEncodingProvider.Instance)
'Für » nicht Standard NET Codepages « erforderlich
'NET Standard CPs: Ascii, UTF8, UTF16 (LE/BE), UTF32 (LE/BE), Iso-8859-1(28591)
'Siehe
'https://learn.microsoft.com/en-us/dotnet/api/system.text.encoding.getencodings?view=net-7.0#system-text-encoding-getencodings
'unter NOTE
Dim Pfad As String = "d:\#1\" '<---- anpassen
Dim t As String = "aäöüÄÖÜß€z"
'UTF8 mit BOM
File.WriteAllText(Pfad & "UTF8mB.txt", t, Encoding.UTF8)
'UTF8 ohne BOM
File.WriteAllText(Pfad & "UTF8oB.txt", t)
'oder
'File.WriteAllText(Pfad & "UTF8oB.txt", t, Encoding.Default)
' CP 28591
File.WriteAllText(Pfad & "28591.txt", t, Encoding.GetEncoding(28591))
'Hier fehlt das Eurozeichen, weil die Zeichen 128 bis 159 bei
'Iso-8859-1 Steuerzeichen sind
'Ascii
File.WriteAllText(Pfad & "ascii.txt", t, Encoding.ASCII)
'Siehe Ergebnis
'UTF16
File.WriteAllText(Pfad & "utf16.txt", t, Encoding.Unicode)
'Ansi
File.WriteAllText(Pfad & "ansi.txt", t, Encoding.GetEncoding(1252))
'OEM 850 DOS
File.WriteAllText(Pfad & "DOS.txt", t, Encoding.GetEncoding(850))
'Eurozeichen gab's zu DOS Zeiten noch nicht
End Sub
End Module

VaporiZed · 17. August 2023, 15:15

Ich verstehe Deinen Post nicht. Ist das jetzt Code, der nicht wie gewünscht funktioniert oder ein Testprogramm, um zu zeigen, wie es geht? Scheint zwar letzteres zu sein, aber dann find ich Deine Formulierung verwirrend.

ANSI Text einlesen

ANSI Text einlesen

VB.NET-Quellcode

JLH schrieb:

VB.NET-Quellcode

VB.NET-Quellcode

Quellcode

JLH schrieb:

JLH schrieb:

VB.NET-Quellcode

VB.NET-Quellcode

Visual Basic-Quellcode

JLH schrieb:

VB.NET-Quellcode

VB.NET-Quellcode

Ähnliche Themen

6 Benutzer haben hier geschrieben