Nieuw lid |
|
Ik heb een HTML bestand gekregen met daarin heel veel informatie. Het is zegmaar steeds een bepaalde code die herhaald wordt (steeds een div/tabel). De structuur van de bestanden is dus precies hetzelfde, alleen zijn de waardes dus iets anders. Ik kan het nu natuurlijk handmatig in mijn database gaan zetten, maar ik zou het wel zo handig vinden als ik dit met een scriptje automatisch zou kunnen doen. Waarschijnlijk moet ik deze werkzaamheden ook elke maand gaan doen, dus dan kan het best veel tijd schelen.
De code ziet er ongeveer als volgt uit:
<div>
<p>Koptekst 1</p>
<table border="0" cellpadding="0" cellspacing="0" width="560" >
<tr>
<td>
<p><a href="/1.html">Normale tekst 1</a></p>
</td>
<td>
<p><a href="/2.html">Normale tekst 2</a></p>
</td>
<td>
<p><a href="/3.html">Normale tekst 3</a></p>
</td>
</tr>
<tr>
<td>
<p><a href="/4.html">Normale tekst 4</a></p>
</td>
<td>
<p><a href="/5.html">Normale tekst 5</a></p>
</td>
<td>
<p><a href="/6.html">Normale tekst 6</a></p>
</td>
</tr>
</table>
</div>
<table border="0" cellpadding="0" cellspacing="0" width="560" > <p><a href="/1.html">Normale tekst 1 </a></p> <p><a href="/2.html">Normale tekst 2 </a></p> <p><a href="/3.html">Normale tekst 3 </a></p> <p><a href="/4.html">Normale tekst 4 </a></p> <p><a href="/5.html">Normale tekst 5 </a></p> <p><a href="/6.html">Normale tekst 6 </a></p>
Deze code wordt dus steeds herhaald. Mijn vraag is nu dus eigenlijk hoe ik ervoor kan zorgen dat ik dus alleen steeds over de waardes kan beschikken zodat ik deze daarna in mijn database kan zetten? Ik moet alleen wel het verschil kunnen herkennen tussen de koptekst en de andere waardes.
Ook is het overigens nog zo dat er bovenaan de pagina nog dingen als <title></title> en <head></head> staan, maar deze moeten uiteraard er ook uitgefilterd worden.
Ik hoop dat jullie willen helpen! :-)
|