YouTube Download

viperkill · 16. März 2010, 17:50

Hi,

ich habe vor kurzem einen YouTube Download programmiert aber habe keine Lust den zu Releasen oder ihn weiter zu entwickeln. Damit die ganze "Arbeit" nicht umsonst war, habe ich mich entschieden den Sourececode mit ein paar beschreibungen hier zu veröffentlichen.

Dan wollen wir mal anfangen:

Da wir wahrscheinlich nicht einfach nur das Video downloaden möchten, sondern auch ein paar Infos zu den Videos haben möchten (Autor,Titel), fangen wir auch erstmal damit an. Alle Funktionen(Außer die zum Download vom Quelltext) basieren auf RegEx.

Als erstes brauchen wir den Quelltext von dem YouTube Video:

VB.NET-Quellcode

Dim Request As HttpWebRequest = HttpWebRequest.Create("URL")
Dim Response As HttpWebResponse = Request.GetResponse()
Dim reader As StreamReader = New StreamReader(Response.GetResponseStream)
Dim httpContent As String
httpContent = reader.ReadToEnd

Jetzt haben wir schonmal die vorraussetzung für alle folgenden Schritte.

Titel auslesen:

VB.NET-Quellcode

Dim TitleRegEx As New Regex("title=""(?<Title>(.*))"" />")
Dim title as String
title = TitleRegEx.Match(httpContent).Groups("Title").ToString

Diese Funktion liefert uns schonmal den Titel des Videos. Hier mal eine kleine Erläuterung:

Der Titel eines Videos, liegt in diesem Vormat in dem Quelltext der Seite vor:

Quellcode

title="Titel des Videos" />

Da wir den Titel ja nicht wissen, und ihn auslesen wollen, können wir ja nicht im RegEx den Titel schon angeben(wäre auch ohne sinn).
Deswegen schreibt man "(?<Title>(.*))" wobei man "Title" in jedes x-beliebige Wort ändern kann.

Das "(.*)" sagt dem Programm, dass der Text der da stehen sollte (Also der Titel des Videos) x-beliebige zeichen bzw. Zahlen hat. Das brauchen wir,
da wir auch hier nicht wissen wie Lang der Titel ist oder ob er aus Buchstaben und Zahlen besteht.

Zum schluss haben wir noch das "?" am Anfang der Klammer. Das Fragezeichen sagt dem Programm, dass es den Text der da steht in die Speichern soll und zwar
in der Variable, die wir zwischen den "<>" stehen haben(in diesem Fall "Title")

In der Letzteb Zeile des Codes("title = TitleRegEx.Match(httpContent).Groups("Title").ToString") wird eigentlich erst der/das RegEx gestartet.
"httpContent" steht für den Text der nach den oben angegebenen Zeichen durchsucht werden soll. "Title" steht für die Variable in der der Text gespeichert wurde(wie oben genannt). Wenn wir beim RegEx deklarieren anstatt "Title", "test" geschreiben hätten, müssten wir also auch hier "Title" in "test" ändern.

Autor auslesen:

VB.NET-Quellcode

Dim AutorRegEx As New Regex("'VIDEO_USERNAME': '(?<Autor>(.*))',")
Dim Autor As String
Autor = AutorRegEx.Match(httpContent).Groups("Autor").ToString

Die gleiche Erläuterung wie beim Titel. In diesem Fall liegt aber der Autor des Videos in diesem Format vor:

Quellcode

'VIDEO_USERNAME': '*Autor des Videos*',")

Dementsprechend muss man natürlich auch im RegEx den String ändern nachdem gesucht werden soll.

Aufrufe auslesen:

VB.NET-Quellcode

Dim ViewRegEx As New Regex("<strong class=""watch-view-count"">(?<Views>(.*))</strong><br>Aufrufe")
Dim Views As String
Views = ViewRegEx.Match(httpContent).Groups("Views").ToString

Hier liegt die Anzahl der Aufrufe in diesem Format vor:

Quellcode

<strong class=""watch-view-count"">*Anzahl aufrufe*</strong><br>Aufrufe

Anzahl Bewertungen auslesen:

VB.NET-Quellcode

Dim RateNum As New Regex("<div class=""action-bar-ratings-stats yt-uix-tooltip"" title=""(?<Like>(.*))"">")
Dim RateNums As String
RateNums = RateNum.Match(httpContent).Groups("Like").ToString

Hier liegt die Anzahl der Bewertungen so vor:

Quellcode

<div class=""action-bar-ratings-stats yt-uix-tooltip"" title=""*Anzahl der Leute die es mögen oder nicht*"">

Video Download:

Alles bis hier hin war ja eigentlich noch ganz einfach wenn man weiß wonach man suchen muss

Der Download des Videos ist eigentlich auch ganz simpel wenn man weiß wie sich der Downloadlink zusammen setzt.

In diesem Beispiel wird das Videos als .mp4 gedownloadet.

Der Downloadlink zu einem Video setzt sich aus 3 verschiedenen Teilen zusammen:

Eine bestimmte URL von YouTube, die ID des Videos und die Variable "t".

Diese bestimmte URL von YouTube ist diese :

Quellcode

http://www.youtube.com/get_video?fmt=18&video_id=

An diese URL muss man die ID des Video ran hängen und die Variable "t". An die ID kommt man ziemlich schnell:

Sie steht in jeder URL zu einem Video hinter "v=". Also ist es sehr einfach diese gerauszubekommen:

VB.NET-Quellcode

Dim URL as String = "Link zum Video"
URL = Url.Replace ("http://www.youtube.com/watch?v=","")

Schon hat man die ID des Videos. Man kann diese natürlich auch wie die anderen Informationen über RegEx auslesen aber mit Replace geht es einfacher und schneller.

Jetzt müssen wir noch die Variable "t" auslesen:

VB.NET-Quellcode

Dim tRegEx As New Regex("""t"": ""(?<t>(.*)) """)
Dim t as String
t = (Mid$(tRegEx.Match(httpContent).Groups("t").ToString,1,46))

Ihr seht, dass fasst alles gleich ist wie bei den anderen. Nur jetzt kommt beim speichern des Textes noch ein "Mid$" dazu.
Das "Mid$" steht dort, damit man nur die Variable "t" angezeigt bekommt. Ohne das "Mid$" bekommt man nen haufen Quelltext zurückgeliefert,
den man eigentlich nicht braucht. Das "Mid$" schneidet auch einfach nur alle Buchstaben bzw. Zeichen ab, die nicht in dem Bereich von zeichen 1 bis 46
sind.

Jetzt haben wir alle sachen die wir brauchen um das Video zu downloaden. Also nur noch zusammen setzen:

VB.NET-Quellcode

Dim DownloadURL as String = "http://www.youtube.com/get_video?fmt=18&video_id=" & ID & "&t=" & t

Jetzt einfach nur noch nen Webclient machen und download

Bei diesem Link wird das Video als .mp4 gedownloadet. Allerdings kann man ganz einfach den Dateitypen ändern.
Der erste Teil des Links sieht wie folgt aus:

youtube.com/get_video?fmt=18&video_id="

Ihr seht, dass am in der mitte/ am ende ein "fmt=18" steht. Wenn man diese zahl ändern (also in diesem Fall "18"), bekommt man das Video in einem anderem Format. Folgende Formate gibt es bei YouTube(Danke technobase ;)):

"fmt=5" = .flv Format
"fmt=22" = .mp4 in HD (setzt vorraus, dass das Video auch in HD vorhanden ist)
"fmt=17" = .3gp

So, das wars jetzt

ich hoffe es hat euch ein bischen geholfen. Wenn ihr Fragen oder Anregungen habt dann könnt ihr sie hier posten!

Grüsse,

viperkill

ACHTUNG! Durch die Umstellung des Youtube Layouts, funktionieren manche abfragen nicht mehr. Ich werde mich so bald wie möglich hinsetzten und den Sourcecode updaten.

EDIT: Alle Abfragen gehen wieder! Nur die zusammen setzung des YouTube Downloadlinks will noch nich :P

P.S.: Wer Rechtschreibfehler findet, darf sie behalten :rolleyes:

EDIT: Habe jetzt im Anhang ein Beispiel Projekt "rangehängt" :thumbsup:

PEAR · 17. März 2010, 18:39

Klasse tut!

timi257 · 17. März 2010, 20:50

Wie könnte man denn jetzt in anderen Formaten downloaden??

Edit:
Egal, ich machs einfach mit ffmpeg

viperkill · 17. März 2010, 21:55

timi257 schrieb:

Wie könnte man denn jetzt in anderen Formaten downloaden??

Da brauchst du wieder nen anderen Link. Hab leider grade keine Infos dazu parat aber du kannst ja mal bei google gucken

Grüße,

viperkill

markushettmann · 18. März 2010, 15:33

Hallo,
Ich bekomme beim starten immer einen Fehler:

Spoiler anzeigen

Das ist mein Code:

Spoiler anzeigen

VB.NET-Quellcode

Imports System.Net
Imports System.IO
Imports System.Text.RegularExpressions
Public Class Form1
Dim URL As String = "Link zum Video"
Dim tRegEx As New Regex("""t"": ""(?<t>(.*)) """)
Dim t As String
Dim Request As HttpWebRequest = HttpWebRequest.Create("URL")
Dim Response As HttpWebResponse = Request.GetResponse()
Dim reader As StreamReader = New StreamReader(Response.GetResponseStream)
Dim httpContent As String
Dim TitleRegEx As New Regex("title=""(?<Title>(.*))"" />")
Dim title As String
Private Sub Form1_Load(ByVal sender As Object, ByVal e As System.EventArgs) Handles Me.Load
httpContent = reader.ReadToEnd
title = TitleRegEx.Match(httpContent).Groups("Title").ToString
Label1.Text = title
End Sub
Private Sub Button1_Click(ByVal sender As System.Object, ByVal e As System.EventArgs) Handles Button1.Click
t = (Mid$(tRegEx.Match(httpContent).Groups("t").ToString, 1, 46))
URL = URL.Replace("http://www.youtube.com/watch?v=", "")
End Sub
Private Sub Button2_Click(ByVal sender As System.Object, ByVal e As System.EventArgs) Handles Button2.Click
Dim DownloadURL As String = "http://www.youtube.com/watch?v=4RE_WRsxi5w"
Dim web As New WebClient
web.DownloadFile(URL, My.Computer.FileSystem.SpecialDirectories.Desktop & "/Video1.avi")
End Sub
End Class

viperkill · 18. März 2010, 16:00

Hi,

das kommt wenn an der URL was nicht passt. Ich glaube , du hast vergessen dem String "URL" vorher einen Video Link zu zuweisen(finde ich zumindest nicht im quelltext). Versuch mal im Form Load sub "URL" ein Link zu nen Brei zu geben

Grüße,

viperkill

markushettmann · 18. März 2010, 17:01

Spoiler anzeigen

VB.NET-Quellcode

Imports System.Net
Imports System.IO
Imports System.Text.RegularExpressions
Public Class Form1
Dim URL As String = "Link zum Video"
Dim tRegEx As New Regex("""t"": ""(?<t>(.*)) """)
Dim t As String
Dim Request As HttpWebRequest = HttpWebRequest.Create("URL")
Dim Response As HttpWebResponse = Request.GetResponse()
Dim reader As StreamReader = New StreamReader(Response.GetResponseStream)
Dim httpContent As String
Dim TitleRegEx As New Regex("title=""(?<Title>(.*))"" />")
Dim title As String
Private Sub Form1_Load(ByVal sender As Object, ByVal e As System.EventArgs) Handles Me.Load
URL = "http://www.youtube.com/watch?v=4RE_WRsxi5w"
Dim DownloadURL As String = "http://www.youtube.com/watch?v=4RE_WRsxi5w"
httpContent = reader.ReadToEnd
title = TitleRegEx.Match(httpContent).Groups("Title").ToString
Label1.Text = title
End Sub
Private Sub Button1_Click(ByVal sender As System.Object, ByVal e As System.EventArgs) Handles Button1.Click
t = (Mid$(tRegEx.Match(httpContent).Groups("t").ToString, 1, 46))
URL = URL.Replace("http://www.youtube.com/watch?v=", "")
End Sub
Private Sub Button2_Click(ByVal sender As System.Object, ByVal e As System.EventArgs) Handles Button2.Click
Dim web As New WebClient
web.DownloadFile(URL, My.Computer.FileSystem.SpecialDirectories.Desktop & "/Video1.avi")
End Sub
End Class

Habs jetzt so aber funktioniert immer nohc nnicht :thumbdown:

viperkill · 18. März 2010, 17:55

Hi,

Versuchs mal damit:

VB.NET-Quellcode

Imports System.Net
Imports System.IO
Imports System.Text.RegularExpressions
Public Class Form1
Dim URL As String = "Link zum Video"
Dim tRegEx As New Regex("""t"": ""(?<t>(.*)) """)
Dim t As String
Dim TitleRegEx As New Regex("title=""(?<Title>(.*))"" />")
Dim title As String
Private Sub Form1_Load(ByVal sender As Object, ByVal e As System.EventArgs) Handles Me.Load
URL = "http://www.youtube.com/watch?v=4RE_WRsxi5w"
Dim DownloadURL As String = "http://www.youtube.com/watch?v=4RE_WRsxi5w"
Dim Request As HttpWebRequest = HttpWebRequest.Create("URL")
Dim Response As HttpWebResponse = Request.GetResponse()
Dim reader As StreamReader = New StreamReader(Response.GetResponseStream)
Dim httpContent As String
httpContent = reader.ReadToEnd
title = TitleRegEx.Match(httpContent).Groups("Title").ToString
Label1.Text = title
End Sub
Private Sub Button1_Click(ByVal sender As System.Object, ByVal e As System.EventArgs) Handles Button1.Click
t = (Mid$(tRegEx.Match(httpContent).Groups("t").ToString, 1, 46))
URL = URL.Replace("http://www.youtube.com/watch?v=", "")
End Sub
Private Sub Button2_Click(ByVal sender As System.Object, ByVal e As System.EventArgs) Handles Button2.Click
Dim web As New WebClient
web.DownloadFile(URL, My.Computer.FileSystem.SpecialDirectories.Desktop & "/Video1.avi")
End Sub
End Class

markushettmann · 18. März 2010, 18:42

Der selbe Fehler :thumbdown:

viperkill · 18. März 2010, 19:58

Hmmm... Ich werd gleich mal wenn ich wieder am pc bin ein Beispiel Projekt hochladen. Muss nur mal gucken ob ich das heut noch schaffe

Grüße,

viperkill

KEATiX · 19. März 2010, 13:08

Hi, kannst mal bitte die Sources hochladen ?
Wäre nett, bin noch ein Noob im Coden

Patschi · 19. März 2010, 13:56

Er hat ja gesagt, dass er schaut ob er "heute" noch Zeit hat.

Ich habs auch schon etwas versucht... Bekomme es auch nicht hin.

gs93 · 19. März 2010, 14:09

Schaut doch mal mit welcher URL der Webrequest erstellt wird :rolleyes:

Patschi · 19. März 2010, 15:02

Bei mir meckert der bei: httpContent

viperkill · 19. März 2010, 15:57

Hi,

habe jetzt das beispielprojekt fertig. Könnt es euch im Anhang runterladen

Grüsse,

viperkill

markushettmann · 19. März 2010, 16:57

ze

Patschi schrieb:

Bei mir meckert der bei: httpContent

dann setze die httpcontent deklaration nach public class nirgentwo in ein event
Ah Fehler gefundn:D::D:D:D:D

Snow · 20. März 2010, 21:25

Ich bin momentan dran, einen Youtube Downloader zu programmieren. Vielen Danke für deinen Source, er hat mir sehr geholfen

Wie man sieht benutze ich keine Listview. Das Auslesen der Informationen klappt bestens.

Du hast geschrieben:

VB.NET-Quellcode

Dim t As String = ListView1.FocusedItem.Tag

und ich hab keine Ahnung wie ich das umschreiben soll, ich benutze keine Listview. Der Youtube-Link wird in die Textbox eingeben.

Ich bin gerade am Verzweifeln

Ich komme nicht an die Variable "t" ran.

viperkill · 20. März 2010, 22:07

Hi,

du hast "t" ja mit diesem Code ausgelesen:

VB.NET-Quellcode

Dim tRegEx As New Regex("""t"": ""(?<t>(.*)) """)
Dim t as String
t = (Mid$(tRegEx.Match(httpContent).Groups("t").ToString,1,46))

Das t wird jetzt in den Tag des items gespeichert. Da du aber kein listview hast, kannst dir das sparen und einfach das "t" aus dem Code nehmen. Also einfach dein Code mit dem hier ersetzten.

Grüße,

viperkill

Snow · 20. März 2010, 23:22

VB.NET-Quellcode

Private Sub ButtonDownload_Click(ByVal sender As System.Object, ByVal e As System.EventArgs) Handles ButtonDownload.Click
Dim ZielDatei As String ZielDatei = My.Computer.FileSystem.SpecialDirectories.Desktop & "\YouTubeVideo.mp4"
Dim ID As String = TextBox1.Text ID = ID.Replace("http://www.youtube.com/watch?v=", "")
Dim DownloadURL As String DownloadURL = "http://www.youtube.com/get_video?fmt=18&video_id=" & ID & "&t="
ProgressBar1.Minimum = 0 ProgressBar1.Maximum = 100 HttpClient.DownloadFileAsync(New Uri(DownloadURL), (ZielDatei))

Das ist nun mein Download-Code, habe die Variable "t" entfernt, aber er lädt nichts herunter.
Die Datei wird zwar erstellt, hat aber nur 0kb.

Sakeco · 21. März 2010, 02:09

@Snow:

Die Datei wird zwar erstellt, hat aber nur 0kb.

Versuchs doch mal mit dem Einzelschritt-Debugger(Hotkey: F8) und überprüfe, ob die Variablen auch die richtigen Werte enthalten.

YouTube Download

YouTube Download

VB.NET-Quellcode

VB.NET-Quellcode

Quellcode

VB.NET-Quellcode

Quellcode

VB.NET-Quellcode

Quellcode

VB.NET-Quellcode

Quellcode

Quellcode

VB.NET-Quellcode

VB.NET-Quellcode

VB.NET-Quellcode

timi257 schrieb:

VB.NET-Quellcode

VB.NET-Quellcode

VB.NET-Quellcode

Frage

Patschi schrieb:

VB.NET-Quellcode

VB.NET-Quellcode

VB.NET-Quellcode

Tags

Ähnliche Themen

12 Benutzer haben hier geschrieben