CSCore - Highperformance Audiobibliothek

thefiloe · 12. Oktober 2013, 01:32

Jetzt auf die Schnelle kann ich dir keine guten Formeln nenne um die Werte zusammenzufassen. Jedoch habe ich kürzlich eine gute Bibliothek ausprobiert(und auch erfolgreich mit CSCore zum laufen gebracht -> war das auf dem Screenshot). Hier ist ein Code welcher aus den Rohen FFT-Werten eine recht gute Visualisierung errechnet: wpfsvl.codeplex.com/SourceCont…alizationLibrary/Spectrum Analyzer/SpectrumAnalyzer.cs

Was die Kanäle(links, rechts,...) angeht. Ist natürlich möglich. Jedoch würde ich mich an deiner Stelle erst darauf beschränken einfach nur den linken Kanal zu verwenden(was du im Moment auch tust). Wenn du wirklich Kanäle willst, dann musst du im Moment selbst anfangen an den Komponenten rumzudrehen was eigentlich nicht wirklich kompliziert wäre, jedoch im Moment sicher den Aufwand nicht wirklich Wert ist.
Ist aber prinzipiell recht einfach möglich(wie gesagt... die Lib ist zu 100% erweiterbar).

nafets3646 · 12. Oktober 2013, 02:23

Soo, ich habe das jetzt einfach mal so gemacht (soll ne Übergangslösung sein, bis ich was besseres gefunden habe, was auch einigermaßen übersichtlich ist ;). Mein Code sieht so aus:

VB.NET-Quellcode

Imports CSCore.DSP
Imports CSCore.SoundIn
Imports CSCore.Streams
Imports System.Runtime.CompilerServices
Public Class Form1
Dim Values As IEnumerable(Of Byte) = Nothing
Private Sub Timer1_Tick(sender As Object, e As EventArgs) Handles Timer1.Tick
If Not Values Is Nothing Then
ProgressBar1.Value = Values(0)
ProgressBar2.Value = Values(1)
ProgressBar3.Value = Values(2)
ProgressBar4.Value = Values(3)
End If
End Sub
Private Sub Aggregator_FFTCalculated(sender As Object, e As FFTCalculatedEventArgs)
'Die ersten 512 Werte abspeichern und den Real in einen Single umwandeln
'Dim Values As IEnumerable(Of Single) = e.Data.Take(512).Select(Function(c) c.Value)
'Testausgabe, Form: 'Output: {0.23, 0.00, 0.01, [...] }'
Values = e.Data.Take(512).Select(Function(c) c.Value).Reduce(4).Select(Function(s) CByte(Math.Max(Math.Min((s * 100 * 200), 255), 0)))
'Debug.WriteLine(String.Format("Output: {{{0}}}", String.Join(", ", ReducedValues.Select(Function(s) s.ToString).ToArray)))
End Sub
Private Buffer() As Byte
Private Sub SoundInSource_OnNewData(sender As Object, e As DataAvailableEventArgs)
While Aggregator.Read(Buffer, 0, Buffer.Length) > 0
'Mit den Daten einfach nichts machen
End While
End Sub
Dim SoundIn As ISoundIn
Dim SoundInSource As SoundInSource
Private WithEvents Aggregator As FFTAggregator
Private Sub Form1_Load(sender As Object, e As EventArgs) Handles Me.Load
SoundIn = New WasapiLoopbackCapture
SoundIn.Initialize()
SoundInSource = New SoundInSource(SoundIn)
Aggregator = New FFTAggregator(SoundInSource)
Buffer = New Byte(Aggregator.WaveFormat.BytesPerSecond) {}
AddHandler SoundInSource.DataAvailable, AddressOf SoundInSource_OnNewData
AddHandler Aggregator.FFTCalculated, AddressOf Aggregator_FFTCalculated
SoundIn.Start()
Timer1.Start()
End Sub
Private Sub Form1_FormClosing(sender As Object, e As FormClosingEventArgs) Handles Me.FormClosing
Timer1.Stop()
SoundIn.Stop()
SoundIn.Dispose()
End Sub
End Class
Public Module EnumerableExtensions
<Extension()>
Public Function Reduce(source As IEnumerable(Of Single), count As Integer) As IEnumerable(Of Single)
Dim [Step] As Double = source.Count / count
Dim Output As New List(Of Single)
For Counter As Integer = 0 To count - 1
Output.Add(source.Skip(CInt([Step] * Counter)).Take(CInt([Step])).Average())
Next
Return Output
End Function
End Module

Die 4 Progressbars sollten eigentlich die Werte anzeigen, jedoch kriege ich da nur eine wirre Art "Flackern" hin. Außerdem zeigt eigentlich nur die ProgressBar1 einen wirklichen Ausschlag.

thefiloe · 12. Oktober 2013, 02:54

Ich habe mich mit solchen Dingen nicht viel befasst. Jedoch wird dir a) eine Progressbar mit der "Animation" wohl zu langsam sein. b) sind 4 Progressbars meiner Meinung nach zu wenig um da ernsthaft was darzustellen. c) Die ersten Frequenzbänder sind in über 99% der Lieder etc. die stärksten -> deshalb der höchste Ausschlag. Damit sich das aber besser verteilt, gibt es da verschiedene Sakalierungen etc. mit welchen ich mich jedoch nicht wirklich auskenne. Aber du kannst mal hier schauen: wpfsvl.codeplex.com/SourceCont…lyzer/SpectrumAnalyzer.cs. Recht weit unten siehst du wie dort die Frequenzbänder zusammengefasst werden und berechnet werden. Diese Lib bietet auch 3 verschiedene Skalierungsverfahren an(Decibel, Linear, Wurzel). Ist sicherlich eine gute Implementation welche du mir recht wenig Aufwand abkucken kannst.

iEi · 12. Oktober 2013, 22:06

@thefiloe

Auch wenn wir uns nicht gut verstehen,muss ich dir sagen das diese Lib einfach beeindruckend ist,man kann einfach so viel machen wo von ich nie gedacht hätte das das allgemein überhaupt in irgend einer Weise möglich ist(Musikkurve auslesen usw.).Hut ab und Respekt

V.I.R.U.S · 17. November 2013, 18:42

Hey, erstmal super Lib! Jedoch habe ich ein kleines Problem:
ich möchte ein Wasapi Loopback Stream aufzeichnen und anschließend durch eine FFT jagen. Ich habe mir hier den Thread durchgelesen und wollte das Beispiel hier in C# übernehmen, jedoch ist der Typ SoundInSource nicht vorhanden. Außerdem fordert der FFTAggregator ein WaveIn-Objekt als Parameter, ich kann mein WasapiCaptureLoopback jedoch nicht nach WaveIn casten. Hat da jemand n Beispiel wie ich den FFTAggregator anweden kann? Ich nutze die letzte Version der Bibliothek.

thefiloe · 17. November 2013, 19:47

Die Probleme sind bzw. waren alle bekannt. Müssten jedoch schon alle beim NuGet-Build behoben sein: docs.nuget.org/docs/start-here/installing-nuget

V.I.R.U.S · 17. November 2013, 20:19

Ahhh Perfekt. Danke :thumbup:

Artentus · 26. November 2013, 12:13

Hey!

Ich war mal so frei, und hab CSCore fest in GameUtils integriert, ich hoffe du hast nichts dagegen (bekommst auch ne Erwähnung).

Ich hätte dann auch zwei klitzekleine Fragen, wegen denen ich mich jetzt nicht auf Codeplex anmelden wollte.

1. Was muss man bei CodecFactory.Instance.GetCodec(obejct key, Stream stream) als Key angeben?
2. Was bewirken der eventSync- und der latency-Parameter beim WasapiOut-Konstruktor?
Ich weiß, ist bestimmte ne heiden Arbeit, aber bei sowas wäre ne XML-Doku schon recht hilfreich.

thefiloe · 26. November 2013, 15:23

Also erstmal: Freut mich natürlich, dass du dir das antust :P. Bin über jeden der das Teil verwendet und vll. zur Behebung eines Fehlers beitragen kann wirklich froh! Also :thumbup:

Jetzt zu

Der key gibt den Codec an, da die Engine nicht wissen kann welches Format sich in dem Stream verbirgt(bei manchen schon, jedoch nicht bei allen). Deshalb gibt es nen Key welcher eigentlich immer nen String wie z.B. "mp3" ist und dadurch wird der Stream als MP3-Stream interpretiert. Werde im nächsten Update mitbringen, dass das durch die Mediafoundation etwas erleichtert wird(sprich wenn null angegeben wird, wird versucht das Format zu ermitteln). Ist jedoch wie immer bei Mediafoundation erst ab Vista verfügbar(es sei denn mit zusätzlichen Installationen auf XP). Wenn du keine keys angeben willst, dann kannst du einfach die Überladung mit einem filename angeben. Dort wird der Typ des Streams aufgrund des Dateinamen ermittelt(z.B. .mp3 => mp3, .flac => flac,...).
EventSync ist etwas was intern von WasapiOut abläuft. Es gibt zwei Möglichkeiten mit dem Treiber zu kommunizieren. a) über EventWaitHandles was in dem Fall eventSync ist und b) durch warten und regelmäßiges anstupsen des Treibers und schauen ob dieser wieder Platz für neue Daten hat. Latency ist die Latenz mit welcher das Playback abläuft. Dies ist von SoundOut zu SoundOut verschieden. Wasapi ist hier am leistungsstärksten und schafft bei mir bis zu 20ms. DirectSoundOut schafft maximal 50 (eher 80-90) und WaveOut kannste mal bei so 100-150 ansetzen. Diese Einstellung beeinflusst die Puffergröße und somit auch das Interval in welchem der Treiber mit neuen Rohdaten gefüttert wird. Bei reinem Playback hat eine etwas höhere Latenz den Vorteil, dass das Playback weniger anfällig für kurze Lags oder Performanceinbrüche ist. Lässt man jedoch z.B. ne Visualisierung in Realtime laufen, dann wirst du nicht froh sein, wenn sich die Anzeige alle 2 Sekunden aktualisiert sondern eher bei 60-70ms. Gleiches Prinzip wenn du z.B. nen Equalizer verwendest und du veränderst die einzelnen Filter. Verwendest du hier eine Latenz von 2000 => 2 sek., dann kann es sein, dass die neuen Einstellungen erst zwei Sekunden später zum Tragen kommen, da bereits der Treiber die Daten für die nächsten 2 Sekunden im Puffer hat, welche jedoch noch nicht die neuen Eq Einstellungen bekommen haben.

Alles in allem ist das immer so ne Gratwanderung zwischen Benutzerfreundlichkeit, Aktualisierungszeit,... und Performance. Wie gesagt oben sind so paar Richtwerte wobei ich bei Wasapi auch so bei 50ms ansetzen würde damit es auf den meisten Rechnern schön flüssig läuft.

Ansonsten bei Fragen/Fehlen/Anliegen immer her damit :!: :!:

Artentus · 26. November 2013, 15:36

Dass es auch mit dem Dateinamen geht, ist mir klar. Der Vollständigkeit halber wollte ich aber beides in die Engine einbauen.
Dann löse ichs am besten so, dass ich das einfach nach oben weiterreiche und der Aufrufer sich drum kümmern muss, oder?

Also in Sachen Bugs: entweder ich mach was falsch, oder mit dem WasapiOut läuft was schief. Ich kann den nur genau einmal abspielen, auch wenn ich die Position in der zugrundeliegende IWaveSource auf 0 setze oder ihn neu initialisiere. Benutze ich nen DirectSoundOut funktioniert mein Code bestens, aber Wasapi spielt wohl besser ab (bei Directsound bekomme ich imme son Knacken am Anfang und Ende).

thefiloe · 26. November 2013, 15:50

Wasapi ist definitiv neuer und hat weniger knacken etc.
Abspielen solltest du theoretische mehrmals können. Wie sieht denn dein Code genau aus?

Artentus · 26. November 2013, 15:53

Der Code sieht so aus (den ersten Teil hab ich aus dem Startpost):

Spoiler anzeigen

C-Quellcode

public class CSCoreEngine : AudioEngine
{
private ISoundOut CreateSoundOut(ref IWaveSource source)
{
ISoundOut soundOut;
if (WasapiOut.IsSupportedOnCurrentPlatform)
soundOut = new WasapiOut(false, AudioClientShareMode.Shared, 100);
else
{
soundOut = new DirectSoundOut() { Latency = 100 };
if (source.WaveFormat.BitsPerSample > 16)
source = source.ToSampleSource().ToWaveSource(16);
}
return soundOut;
}
public override AudioHandle CreateHandle(Stream stream)
{
IWaveSource source = CodecFactory.Instance.GetCodec(null, stream);
ISoundOut soundOut = this.CreateSoundOut(ref source);
return new CSCoreHandle(soundOut, source);
}
public override AudioHandle CreateHandle(string file)
{
IWaveSource source = CodecFactory.Instance.GetCodec(file);
ISoundOut soundOut = this.CreateSoundOut(ref source);
return new CSCoreHandle(soundOut, source);
}
}
internal class CSCoreHandle : AudioHandle
{
readonly ISoundOut soundOut;
readonly IWaveSource source;
public override TimeSpan Length
{
get { return source.GetLength(); }
}
public override TimeSpan Position
{
get { return source.GetPosition(); }
set { source.SetPosition(value); }
}
public override float Volume
{
get { return soundOut.Volume; }
set { soundOut.Volume = value; }
}
public override PlaybackState State
{
get { return (PlaybackState)soundOut.PlaybackState; }
}
internal CSCoreHandle(ISoundOut soundOut, IWaveSource source)
{
this.soundOut = soundOut;
this.source = source;
soundOut.Initialize(source);
soundOut.Stopped += (sender, e) => this.OnPlaybackStopped(EventArgs.Empty);
}
public override void Play()
{
if (soundOut.PlaybackState == sOut.PlaybackState.Stopped)
{
source.Position = 0;
soundOut.Play();
}
else if (soundOut.PlaybackState == sOut.PlaybackState.Paused)
soundOut.Resume();
}
public override void Pause()
{
soundOut.Pause();
}
public override void Stop()
{
soundOut.Stop();
}
protected override void Dispose(bool disposing)
{
soundOut.Dispose();
source.Dispose();
}
}

Aber wie gesagt, wenn ich in CSCoreEngine.CreateSoundOut einfach immer nen DirectSoundOut erstelle, anstatt nen WasapiOut, dann funktionierts so, deswegen kannst doch eigentlich nicht an meinem Code liegen.

thefiloe · 26. November 2013, 16:22

Kann auf die Schnelle jetzt keinen Fehler entdecken. Habe deshalb das auch noch extra bei mir ausprobiert mit folgendem ganz simplen Code:

Quellcode

WasapiOut soundOut = new WasapiOut(); IWaveSource source = CodecFactory.Instance.GetCodec(@"C:\Temp\test.mp3");
while (true)
{
soundOut.Initialize(source);
soundOut.Play();
Thread.Sleep(300);
soundOut.Stop();
source.Position = 0;
}

Und das jetzt knapp 15 Minuten laufen lassen. Ohne Probleme.
Es KANN und wird wahrscheinlich so sein, dass ich grad ne neuere Version habe. Ich kann dir die mal geben, da ich eigentlich laufend am Fehler suchen bin und schon über einen Monat nix mehr auf NuGet geladen habe.

Artentus · 26. November 2013, 16:44

Gut, dass es jetzt noch schlimmer geworden ist. :thumbsup:

Jetzt wird nichtmal beim ersten mal richtig abgespielt.

Edit: ich nehm gleich einfach WaveOut, das funktioniert wunderbar.

Artentus · 26. November 2013, 17:53

So, hab nochmal ein bisschen in nem Testprojekt rumprobiert.
Ist deine Testdatei länger als 300ms? Wenn ja, dann erklärt das, warum es bei dir funktioniert. Bei mir funktionierts nämlich auch, solange ich manuell Stop aufrufe, bevor die Datei zu Ende ist. Lasse ich aber bis zum Ende durchlaufen, dann gehts nicht mehr.

thefiloe · 26. November 2013, 17:56

Ja ist sie. Wenn die Datei fertig ist, dann wird automatisch gestoppt. Ich schau mal kurz.

Artentus · 26. November 2013, 18:08

Jaaa!

Es funktioniert einwandfrei. Vielen Dank und viel Glück bei deiner Arbeit.

ThuCommix · 10. Dezember 2013, 07:18

Gibt es auch irgendwie Pan wenn ich ISoundOut in Kombination mit Wasapi benutze?

thefiloe · 10. Dezember 2013, 17:58

Benutze einfach die CSCore.Streams.PanSource dafür ;).

nafets3646 · 13. Dezember 2013, 23:32

Ich versuche gerade, etwas aufzunehmen und verwende im Grunde genommen den Code aus deinem Startpost. Das funktioniert auch super, alles so, wie ich will. Nun möchte ich aber den abgespeicherten Dateien ID3-Tags hinzufügen. Auslesen kann ich die Dinger schon, das Schreiben ist aber noch nicht möglich. Kurz zusammengefasst, was ich momentan mache:
ISoundIn -> WaveWriter -> Datei und bei Beenden der Aufnahme wird die Datei in eine weitere kopiert. Hier möchte ich halt ein paar ID3-Infos hinzufügen, vorzugsweise ID3v2. Hoffe, du kannst mir helfen :).

//EDIT:
Was mir gerade noch aufgefallen ist: Ein einziges Lied ist bei dieser Aufnahmevariante ca. 100MB groß, gibt es dafür auch Workarounds?

CSCore - Highperformance Audiobibliothek

VB.NET-Quellcode

C-Quellcode

Quellcode

Benutzer online 1

Tags

Ähnliche Themen

50 Benutzer haben hier geschrieben