login  Naam:   Wachtwoord: 
Registreer je!
 Forum

Massadownload video's

Offline GRBB - 10/10/2007 15:58 (laatste wijziging 12/10/2007 19:15)
Avatar van GRBBNieuw lid Hallo

Op de gebarensite van de Universiteit Gent staan een hele pak gebarenfilmpjes die ik graag zou downloaden (dit is legaal want er staan links bij de filmpjes zelf). Is het nu mogelijk om deze downloads te automatiseren zodat het filmpje wordt opgeslagen met de titel van de pagina (bv. het filmpje van het gebaar 'Aalst' krijgt dan ook de naam 'Aalst.mpg')? Het is anders echt bijna onbegonnen werk om rond de 7 000 filmpjes te downloaden en te hernoemen (standaard hebben alle filmpjes blijkbaar de naam film.mpg)...

Alvast bedankt, indien er nog vragen zijn stel ze gerust  

GRBB

5 antwoorden

Gesponsorde links
Offline jerone - 10/10/2007 16:05
Avatar van jerone JS gevorderde gebruik FireFox extentie DownThemAll!.
Offline GRBB - 10/10/2007 16:15
Avatar van GRBB Nieuw lid Aan DownThemAll! had ik ook al eens gedacht, maar het probleem is dat er:
-ten eerste: eerst overzichtspagina's zijn van een bepaalde letter (bijvoorbeeld de A) waarop dan alle links staan naar de pagina's waarop de filmpjes van deze gebaren staan en pas op deze pagina staan dan de download links.
-ten tweede: onrechtstreekse downloadlinks staan (bijvoorbeeld: http://gebaren.ugent.be/film.php?movieID=46). Wanneer je dit dan download, download je een php bestand waar ik dus uiteraard niks mee kan doen
-ten derde: de naam van het filmpje wordt niet automatisch aangepast

Ik vrees er zelf ook voor dat wat ik vraag vrij onmogelijk klinkt maar ik hoop toch dat er één of ander manier is   
Offline timmie_loots - 10/10/2007 18:23
Avatar van timmie_loots PHP gevorderde Ik weet niet of je lokaal een serverje draait, maar als dat zo is; zeg het dan even. Dan is er namelijk vast wel iets te bakken in PHP.
Offline Grayen - 10/10/2007 18:49
Avatar van Grayen PHP ver gevorderde Met php weet ik wel iets in elkaar te flansen wat doet wat jij wilt, alleen heb ik vanavond geen tijd. Ik zal je even zeggen waar ik aan te denken zat.

Je maakt een for loop die voor het alfabet in uppercase + ! (die was voor 0-9). Daarvan haal je het content op (file_get_contents). Uit die content filtreer je dan alle links (preg_match). Vervolgens ga je naar al die links (file_get_contents) en haal je met preg_match de waarde van het src attribuut van <object> op en de titel (bijv. aanbellen). Dan haal je content van de waarde tussen het src attribuut op. Dat is de inhoud van het filmpje. Die waarde schrijf je dan weg op de server met de titel die je had opgehaald als naam plus de bij behorende extensie.

Grote nadeel is dat dit een gigantisch zwaar script zal worden. Test daarom eerst veel met alleen enkele bestanden. En als dat allemaal soepel werkt, dan moet je tussen elke handeling wel wat pauzes zetten, anders vindt de server van gebaren.ugent.be het niet zo leuk en natuurlijk de maximale laadtijd dat het mag duren om je pagina te laden uit zetten, want het zal wel even duren voordat hij klaar is.

Dat was mijn idee.
Offline GRBB - 10/10/2007 20:01
Avatar van GRBB Nieuw lid
timmie_loots schreef:
Ik weet niet of je lokaal een serverje draait, maar als dat zo is; zeg het dan even. Dan is er namelijk vast wel iets te bakken in PHP.


Ik heb lokaal een testservertje draaien (WAMP) voor m'n scripts op te testen, dus dat zou moeten lukken.  

Grayen schreef:
Met php weet ik wel iets in elkaar te flansen wat doet wat jij wilt, alleen heb ik vanavond geen tijd. Ik zal je even zeggen waar ik aan te denken zat.

Je maakt een for loop die voor het alfabet in uppercase + ! (die was voor 0-9). Daarvan haal je het content op (file_get_contents). Uit die content filtreer je dan alle links (preg_match). Vervolgens ga je naar al die links (file_get_contents) en haal je met preg_match de waarde van het src attribuut van <object> op en de titel (bijv. aanbellen). Dan haal je content van de waarde tussen het src attribuut op. Dat is de inhoud van het filmpje. Die waarde schrijf je dan weg op de server met de titel die je had opgehaald als naam plus de bij behorende extensie.

Grote nadeel is dat dit een gigantisch zwaar script zal worden. Test daarom eerst veel met alleen enkele bestanden. En als dat allemaal soepel werkt, dan moet je tussen elke handeling wel wat pauzes zetten, anders vindt de server van gebaren.ugent.be het niet zo leuk en natuurlijk de maximale laadtijd dat het mag duren om je pagina te laden uit zetten, want het zal wel even duren voordat hij klaar is.

Dat was mijn idee.


Lijkt mij inderdaad een serieus script. Om eerlijk te zijn ben ik nog niet zo gevorderd met php, hopelijk lukt het mij met een paar goede tutorails om zo'n script te maken 

Maar wel héél erg bedankt voor de tips
Gesponsorde links
Dit onderwerp is gesloten.
Actieve forumberichten
© 2002-2024 Sitemasters.be - Regels - Laadtijd: 0.209s