Hallo,
ist es mit Regex möglich sich überlappende Treffer als einzelne Matches zu finden?
Mit diesem Regex
Beispiel: Er ging ging für ging für 5 Euro Eis kaufen.
Hier sollte entsprechend
Bei diesem Satz funktionieren klarerweise beide:
Er ging ging, ging für ging für 5 Euro Eis kaufen.
Edit: Ach Gott, ich vergiss mal wieder die Hälfte. An sich sollte es mit einem positive Lookahead funktionieren, aber ich bekomms nicht hin.
Edit2: Zur Not muss halt 2 unterschiedliche Abfragen (eine für Wortdopplungen und eine für Dopplungen von Wortgruppen) laufen lassen, aber was, wenn nun ein Wort/eine Wortgruppe 3 Mal oder öfter hintereinander vorkommt?
LG,
Pascal
ist es mit Regex möglich sich überlappende Treffer als einzelne Matches zu finden?
Mit diesem Regex
(.+)\b\1\b
sollen Wortdopplungen oder Dopplungen von Wortgruppen gefunden werden. Funktioniert an sich recht gut, aber was, wenn sich solche Dopplungen überschneiden?Beispiel: Er ging ging für ging für 5 Euro Eis kaufen.
Hier sollte entsprechend
ging ging
und ging für ging für
erkannt werden, angezeigt wird aber nur ging ging
.Bei diesem Satz funktionieren klarerweise beide:
Er ging ging, ging für ging für 5 Euro Eis kaufen.
Edit: Ach Gott, ich vergiss mal wieder die Hälfte. An sich sollte es mit einem positive Lookahead funktionieren, aber ich bekomms nicht hin.
Edit2: Zur Not muss halt 2 unterschiedliche Abfragen (eine für Wortdopplungen und eine für Dopplungen von Wortgruppen) laufen lassen, aber was, wenn nun ein Wort/eine Wortgruppe 3 Mal oder öfter hintereinander vorkommt?
LG,
Pascal
![:!:](https://www.vb-paradise.de/wcf/images/smilies/attention.png)
Dieser Beitrag wurde bereits 3 mal editiert, zuletzt von „Translating-IT“ ()