Lid |
|
Hoi Allen,
Ik heb een aantal CSV bestanden, wat veel producten bevat (ong 2 miljoen, en kan oplopen tot 10 miljoen). De CSV bestanden worden dagelijks geüpdatet. Nu wil ik weten welke producten de nieuwste zijn van de CSV file en deze updaten in de database. In de CSV file worden producten niet geïdentificeerd met een unieke id.
Wellicht zal ik moeten zoeken of de productnaam al in de database bestaat, maar is dit een optimale oplossing? Heeft iemand anders een idee hierover?
Ik heb bijvoorbeeld ook gelezen over een Delta Query in Solr, maar kan ik hiermee hetzelfde bereiken?
|