Ik ben bezig met de functie file_get_contents.
Maar hoe kan ik informatie uitlezen van een site.
Want als ik file_get_contenst("www.nu.nl"); doe dan krijg je gewoon tekst te zien e.d. maar hoe meot je verder?
Kan iemand me misschien helpen?
Zou superrr zijn
Ik snap dat ik er moeite voor moet doen.
Maar als ik meer informatie heb over hoe het in zijn werking gaat, kan ik er aan gaan werken, kan ik dingen gaan proberen, maar wil graag even een basis hebben
Ik wil graag wat data van andere site halen.
Je krijgt de hele pagina inclusief html binnen. Daar kan je zelf met de nodige explode's en regexes de informatie uit halen die je wilt.
Websites die hun content overal beschikbaar willen maken gebruiken ook vaak RSS, dat is er voor gemaakt om data gestructureerd en zonder opmaak op te slaan. Als de website waar je iets vanaf wilt halen RSS heeft is het makkelijker om die feed met een RSS-reader uit te lezen.
Scripts en tutorials staan hiet genoeg op sima volgens mij.
Oke ik zie het.
Dus als ene site GEEN rss heeft, word het al een stuk moeilijker?
Kun je me misschien klein voorbeeldje geven hoe ik starten moet?
Zou ik super fijn vinden
Zo'n script is behoorlijk specifiek als je informatie uit een pagina met html moet halen. Als je zegt om welke informatie op welke website het gaat kan ik je wel op weg helpen.
bijvoorbeeld schadeautos.nl en dan automerk, type, bouwjaar, brandstof, prijs...welk bedrijf de auto hoort...
Dat zou al mooi opgang geholpen zijn.
Als ik weet hoe er 1 werkt, kan ik de rest waarschijnlijk wel zo maken?
Alle gegevens staan in een tabel, dat zou zonder al te veel moeilijkheden uit te lezen moeten zijn. Ik wil best wat voor je maken, maar ik heb nu weinig tijd.
Hmm, na als je een klein beginnetje voor me hebt ben k al blij...
Ik snap er namelijk weinig van.
Zou tof zijn als je iets kleins wilt maken...uitbouwen moet wel lukken denk ik ;)
Als zo'n site niet in een standaard formaat (RSS) informatie aanbiedt, is het waarschijnlijk ook niet de bedoeling dat de inhoud "gedupliceerd" wordt. Het internet staat al vol met geknipte en geplakte informatie.
Maar om antwoord op je vraag te geven:
Analyseer de structuur van de pagina('s), en schrijf reguliere expressies op maat die de informatie eruit filteren.
Ik snap het, maargoed, geen 1 site biedt het aan in rss, dus word het heel moeilijk...
Hopelijk kan toch iemand me opgang helpen, zou het iig op prijs stellen.
edit:
en als een site wel RSS heet, hoe kun je het dan het beste aanpakken? Ben ik ook wel benieuwd naar.
Thanks, ik had het al gevonden.
Heerlijk dat het nu werkt.
Alleen nu heb ik eigenlijk nog 2 vraagjes
Kun je ook zoeken op de site.
Als ik bijvoorbeeld Audi a4 doe, dat hij alle audi a4's eruit haalt?
Is daar een mogelijkheid voor?
En kun je meerdere site's gebruiken om te zoeken dan?
Er zit een zoekfunctie op die site dus daarmee moet je het kunnen vinden.
Je tweede vraag begrijp ik niet helemaal. Maar om op twee verschillende site's te zoeken moet je een scriptje maken dat automatische op beide sites zoekt en de resultaten dan samenvoegt.