Hi,
mein Anliegen hat eigentlich nicht viel mit programmieren zu tun. Aber irgendwie schon.
Es geht um die Titel von YouTube-Videos, speziell um Videos, die Musik beinhalten.
Wer schon mal ein (in)offizielles Musikvideo auf YouTube gesehen hat, wird wahrscheinlich bemerkt haben, dass im Videotitel meist so Sachen wie
Auf keinen Fall sollte es vorkommen, dass wichtige Infos herausgefiltert werden, also lieber zu wenig als zu viel wegnehmen.
Später sollen die gefilterten Songtitel eventuell dafür verwendet werden können, eine Abfrage an diverse Datenbanken zu stellen, um entsprechende Infos/Covers zu erhalten. Das kann aber erstmal vernachlässigt werden.
Wie geht man sowas am Besten an? Einfaches filtern über mehrere RegEx-Patterns? Wenn ja: Würde man da überhaupt noch durch so etwas komplexes durchsteigen?
Oder mit einem neuronalen Netz arbeiten? In welchem Format würde man solch ein Netz füttern? Ich könnte mir nur vorstellen, dass man die Bits der Ascii-Werte nimmt, sie in Floats (0.0/1.0) konvertiert und dann so an das Netz gibt. Andere ERfahrungen habe ich damit leider noch nicht machen können, bisher hab ich es imemr so (oder ähnlich) gemacht. Dann hätte man aber ein Netz, das ca 40*8 == 320 (bei 40 Zeichen) Eingangsneuronen hat. Das würde bestimmt ewig zum trainieren brauchen.
Außerdem: Woher bekomme ich die Lerndaten? Welche Parameter (z. B. Anzahl an Neuronen) wären da angemessen?
Gibt es sonst noch ansätze, die man gehen kann?
nikeee
mein Anliegen hat eigentlich nicht viel mit programmieren zu tun. Aber irgendwie schon.
Es geht um die Titel von YouTube-Videos, speziell um Videos, die Musik beinhalten.
Wer schon mal ein (in)offizielles Musikvideo auf YouTube gesehen hat, wird wahrscheinlich bemerkt haben, dass im Videotitel meist so Sachen wie
(1080p)
, [HD]
, (with Lyrics)
, Full HD 1080p
oder HQ Audio
stehen. Ich arbeite momentan an einer Software, die u. A. in der Lage sein soll, den Videotitel von solchen "Verunreinigungen" zu befreien (so gut es geht natürlich), um - im Idealfall - nur Titel, Interpret und eventuell wichtige Zusätze im Titel zu haben.Auf keinen Fall sollte es vorkommen, dass wichtige Infos herausgefiltert werden, also lieber zu wenig als zu viel wegnehmen.
Später sollen die gefilterten Songtitel eventuell dafür verwendet werden können, eine Abfrage an diverse Datenbanken zu stellen, um entsprechende Infos/Covers zu erhalten. Das kann aber erstmal vernachlässigt werden.
Wie geht man sowas am Besten an? Einfaches filtern über mehrere RegEx-Patterns? Wenn ja: Würde man da überhaupt noch durch so etwas komplexes durchsteigen?
Oder mit einem neuronalen Netz arbeiten? In welchem Format würde man solch ein Netz füttern? Ich könnte mir nur vorstellen, dass man die Bits der Ascii-Werte nimmt, sie in Floats (0.0/1.0) konvertiert und dann so an das Netz gibt. Andere ERfahrungen habe ich damit leider noch nicht machen können, bisher hab ich es imemr so (oder ähnlich) gemacht. Dann hätte man aber ein Netz, das ca 40*8 == 320 (bei 40 Zeichen) Eingangsneuronen hat. Das würde bestimmt ewig zum trainieren brauchen.
Außerdem: Woher bekomme ich die Lerndaten? Welche Parameter (z. B. Anzahl an Neuronen) wären da angemessen?
Gibt es sonst noch ansätze, die man gehen kann?
nikeee
Von meinem iPhone gesendet
Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von „nikeee13“ ()