Suchergebnisse

Suchergebnisse 1-6 von insgesamt 6.

  • Benutzer-Avatarbild

    Hallo, Wir haben viele Dokumente in einem Ordner liegen. Um nun das Suchen des richtigen Dokumemts dem Anwender leichter zu machen wäre eine Stichwortliste gut. Hat jemand einen Ansatz wie ich hier an Besten vorgehen kann ? Wie findet man die prägnantesten Wörter eines Textes ? Gruss mikeb69

  • Benutzer-Avatarbild

    Hallo, vielen Dank für den Input. Auf einige der vorgeschlagenen Punkte bin ich auch selbst gekommen, interessant ist der Tipp von @RodFromGermany bezüglich der Dubletten und der groß geschriebenen Wörter. Gruss mikeb69

  • Benutzer-Avatarbild

    Hallo, hab mal eine Klasse hierzu gebastelt. C#-Quellcode (64 Zeilen) Als Text hab ich einfach einen Zeitungsartikel genommen. Was noch fehlt ist das mit den ähnlichen Wörtern. Hier läuft mir immer der Begriff 'Stemmer' über den Weg ?!? Edit: oder besser dieser Weg ? Zitat von "http://stackoverflow.com/a/26049961": „The simplest code would involve regular expressions. For example, this would identify some English suffixes: '^(.*?)(ing|ly|ed|ious|ies|ive|es|s|ment)?$'One problem is that stemming …

  • Benutzer-Avatarbild

    @Acr0most sorry - hab mich da verschrieben. Es fehlt mir das mit den ähnlichen Wörtern - @RodFromGermany nannte diese Dubletten Zitat: „[Schmeiß Dubletten raus (Eisenbahn - Eisenbahnen, ...). “ Die gleichen Wörter schmeiß ich mit dem Code raus C#-Quellcode (2 Zeilen) Gruss mikeb69

  • Benutzer-Avatarbild

    @RodFromGermany hab das hier gebastelt und für den Sourcecode Austausch angemeldet. C#-Quellcode (105 Zeilen) Quelle für die LevenshteinDistanz: https://en.wikibooks.org/wiki/Algorithm_Implementation/Strings/Levenshtein_distance ​Hab ich was übersehen ? Gruss mikeb69

  • Benutzer-Avatarbild

    @RodFromGermany richtig. Zitat von RodFromGermany: „Jede einzelne Zeile Deines Programms, die Du nicht explizit getestet hast, ist falsch “ Gruss mikeb69