Hallo
ich wollte mal wissen wie gut man sein muss, wieviel Erfahrung und Fachwissen mach braucht um folgendes Problem zu lösen. Kann man das als Anfänger oder muss man Experte sein?
Es gibt eine Liste mit lauter Berufen, 24000 Stück an der Zahl, jedem Beruf ist eine Nummer zugeordnet. Gibt auch mal 10 ähnlich klingende Berufe mit der gleichen Nummer.
Jetzt bekomme ich einen Fragebogen wo die Befragten ihren Beruf angegeben haben. Da soll jetzt automatisch die richtige Nummer zugeordnet werden. Allerdings stimmen die angegebenen und vorgegebenen Berufe nicht immer 100% überein. Die vorgegebene Liste darf auch nicht verändert werden.
Tippfehler und leichte Abweichungen bekommt man mit der Levenshtein Distanz irgendwie hin. Das Programm muss aber auch einzelne Stringketten in beliebiger Reihenfolge erkennen also
Hochschullehrer = Lehrer in der Hochschule
Es gibt nämlich "Lehrer in ..." in der vorgegebenen Liste, da folgt dann aber etwas anderes und es wird eine falsche Nummer zugeordnet.
Auch gibt es Doppelungen in der Liste. Wenn die Zuordnung nicht eindeutig ist oder das Programm auf Hindernisse stösst soll es sich melden und Vorschläge machen, man wählt die richtige Nummer aus und das Programm muss sich das fürs nächste Mal merken, also lernfähig sein. Die ganzen Feinheiten und Probleme wird man wahrscheinlich auch erst beim programmieren und testen herausbekommen. Denn es gibt viele Fälle die auftauchen können.
Nachdem diese Kodierung abgeschlossen ist, kann die Nummer noch aufgrund weiterer Angaben verändert werden. Im Fragebogen gibt es auch Multiple Choice Fragen zum Anforderungsniveau, normalerweise wird dies durch die Berufsbezeichnung abgedeckt aber die wird unter Umständen nicht richtig angegeben. Das ist also lediglich eine Zusatzinformation.
Bis zum Lehrer Problem hab ich eine Lösung in C# gesehen die über 4 DIN A4 Seiten geht und sehr komplex aussieht. Gelöst werden soll das Problem vorzugsweise in VBA für Excel oder Access weil die Daten in diesem Programm vorliegen, das soll jetzt keiner machen, will nur wissen ob man das so ohne weiteres schnell und unkompliziert machen kann wenn man gerade erst VBA kennen gelernt hat oder wieviel Know How mach dafür braucht. Vielen Dank.
Ist diese Anfrage hier eigentlich richtig oder besser in Bereich Grundlagen/Hauptforum untergebracht?
ich wollte mal wissen wie gut man sein muss, wieviel Erfahrung und Fachwissen mach braucht um folgendes Problem zu lösen. Kann man das als Anfänger oder muss man Experte sein?
Es gibt eine Liste mit lauter Berufen, 24000 Stück an der Zahl, jedem Beruf ist eine Nummer zugeordnet. Gibt auch mal 10 ähnlich klingende Berufe mit der gleichen Nummer.
Jetzt bekomme ich einen Fragebogen wo die Befragten ihren Beruf angegeben haben. Da soll jetzt automatisch die richtige Nummer zugeordnet werden. Allerdings stimmen die angegebenen und vorgegebenen Berufe nicht immer 100% überein. Die vorgegebene Liste darf auch nicht verändert werden.
Tippfehler und leichte Abweichungen bekommt man mit der Levenshtein Distanz irgendwie hin. Das Programm muss aber auch einzelne Stringketten in beliebiger Reihenfolge erkennen also
Hochschullehrer = Lehrer in der Hochschule
Es gibt nämlich "Lehrer in ..." in der vorgegebenen Liste, da folgt dann aber etwas anderes und es wird eine falsche Nummer zugeordnet.
Auch gibt es Doppelungen in der Liste. Wenn die Zuordnung nicht eindeutig ist oder das Programm auf Hindernisse stösst soll es sich melden und Vorschläge machen, man wählt die richtige Nummer aus und das Programm muss sich das fürs nächste Mal merken, also lernfähig sein. Die ganzen Feinheiten und Probleme wird man wahrscheinlich auch erst beim programmieren und testen herausbekommen. Denn es gibt viele Fälle die auftauchen können.
Nachdem diese Kodierung abgeschlossen ist, kann die Nummer noch aufgrund weiterer Angaben verändert werden. Im Fragebogen gibt es auch Multiple Choice Fragen zum Anforderungsniveau, normalerweise wird dies durch die Berufsbezeichnung abgedeckt aber die wird unter Umständen nicht richtig angegeben. Das ist also lediglich eine Zusatzinformation.
Bis zum Lehrer Problem hab ich eine Lösung in C# gesehen die über 4 DIN A4 Seiten geht und sehr komplex aussieht. Gelöst werden soll das Problem vorzugsweise in VBA für Excel oder Access weil die Daten in diesem Programm vorliegen, das soll jetzt keiner machen, will nur wissen ob man das so ohne weiteres schnell und unkompliziert machen kann wenn man gerade erst VBA kennen gelernt hat oder wieviel Know How mach dafür braucht. Vielen Dank.
Ist diese Anfrage hier eigentlich richtig oder besser in Bereich Grundlagen/Hauptforum untergebracht?
Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von „Artifi“ ()