login  Naam:   Wachtwoord: 
Registreer je!
 Forum

URL's vinden op andere websites

Offline Respectation - 26/05/2005 19:19 (laatste wijziging 26/05/2005 19:23)
Avatar van RespectationNieuw lid Hey, ik heb een scriptje waarmet php een page in de achtergrond laat laden, nu is mijn bedoeling ALLE url's die er op die pagina aanwezig zijn te kunnen krijgen, en daarna toe te voegen in mysql.

Dit is hetgeen wat ik al heb:
  1. <?php
  2. $site = curl_init();
  3. curl_setopt($site, CURLOPT_URL,"http://www.site.com");
  4. curl_setopt($site, CURLOPT_TIMEOUT, 10); //times out after 4s
  5. curl_setopt($site, CURLOPT_RETURNTRANSFER,1);
  6. curl_setopt($site, CURLOPT_REFERER, "http://www.site.com");
  7. curl_setopt($site, CURLOPT_USERAGENT, "Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0)");
  8. curl_setopt($site, CURLOPT_POST, 1);
  9. $result=curl_exec ($site);
  10. //Hier zou dus het stukje moeten komen dat alle url's zoekt op de webpagina $result is dus de webpagina html
  11. curl_close ($site);
  12. ?>


nemesiskoen edit: code tags gebruiken

3 antwoorden

Gesponsorde links
Offline haytjes - 26/05/2005 22:32 (laatste wijziging 26/05/2005 22:33)
Avatar van haytjes Gouden medailleGouden medaille

JS gevorderde
met een ereg_match_all denk ik dat je da wel kan...
denk da je daarvoor wel beter naar php.net even gaat kijken,
want ik ken het ook niet uit mijn hoofd:

  1. <?php
  2. (p)eregmatch("|<a href=(.*)>(.*)</a>|",$subject,$matches);
  3. en de output:
  4. $matches[0][0]="link1";
  5. $matches[0][1]="naam1";
  6. $matches[1][0]="link2";
  7. $matches[1][1]="naam2";
  8. ?>


maar ik zeg toch dat je beter naar php.net kijk,
er staat daar zo'n voorbeeldje
:!: :!: :!:
Offline Respectation - 26/05/2005 23:05 (laatste wijziging 26/05/2005 23:07)
Avatar van Respectation Nieuw lid Ok, heb het een beetje aangepast,
de output die ik nu krijg is gewoon: <a<a

dit is de code:
  1. <?
  2. if(ereg("(href=(.*)>(.*)</a>)",$result,$matches)) {
  3. echo $matches[0][0];
  4. echo $matches[0][1];
  5. echo $matches[1][0];
  6. echo $matches[1][1];
  7.  
  8. }?>
Offline Respectation - 27/05/2005 22:10
Avatar van Respectation Nieuw lid OK, dan zal ik nu de vraag even anders stellen, omdat ik het script heb aangepast.

Nu staat de broncode van de webpaginas in mysql.
Nu zou ik een scriptje moeten hebben dat automatisch alle links zoekt die in deze pagina staan.
Gesponsorde links
Dit onderwerp is gesloten.
Actieve forumberichten
© 2002-2024 Sitemasters.be - Regels - Laadtijd: 0.36s