Lid |
|
beste,
ik ben al een tijdje bezig met de studie over een federated search engine,
mijn bedoeling is om de federated search engine te willen overzetten naar een Sharepoint Search.
wat ik zoek is (en wat ik denk met sharepoint federated search kan) een zoekinterface op basis van wat in het zoekscherm wordt ingegeven voor verschillende webdatabanken de correcte url creert om een zoekactie in die databank te creeren.
De federated search moet al die resultaten opvangen en in één scherm tonen.
dit is onze huidige zoekmotor:
http://www.isci...uery=water
hieronder heb ik een connector van de zoekmachine; de informatie wordt eignelijk uit de website gescraped via vb. html tags:
RIZIV CONNECTOR
<source modified-by="ivs@IVS" max-elt-id="267" name="riziv" maintainers="ivs" display-name="B. RIZIV" modified="1184796510">
<submit>
<form>
<call-function name="standard-form">
<with name="action-value">http://www.riziv.fgov.be/nl/result.asp?ref=a </with>
<with name="method-value">POST</with>
<with name="query-param">query</with>
<with name="page-param">page</with>
<with name="page-offset">0</with>
</call-function>
<input name="Submit" value="Zoeken" />
<input name="page" value="0" />
<input name="scope" value="/" />
<input name="stype" value="1" />
<input name="doctype" value="all" />
<input name="taal" value="nl" />
<input name="searchtype" value="1" />
<input name="rubriek" value="" />
<input name="sortering" value="rank" />
<input name="order" value="[d]" />
</form>
<parser>
<call-function name="regex-parser
">
<with name="case-sensitive">true</with>
<with name="START"><tr><td valign="top" class="noJustify">1</with>
<with name="END"><i><a href="search.asp"><br></with>
<with name="RESULT_START">&nbsp;</td><td class="noJustify"></with>
<with name="RESULT_END"></td></tr></with>
<with name="URL_START"><a href="</with>
<with name="URL_END">" target="_blank"></with>
<with name="TITLE_START"><b></with>
<with name="TITLE_END"></b></a></with>
<with name="DES_START"><br></with>
<with name="DES_END"><br></with>
<with name="URL_BASE">http://www.riziv.fgov.be</with>
</call-function>
</parser>
</submit>
<tests />
<help />
<description />
</source>
<source modified-by="ivs@IVS" max-elt-id="267" name="riziv" maintainers="ivs" display-name="B. RIZIV" modified="1184796510"> <submit> <form> <call-function name="standard-form"> <with name="action-value">http://www.riziv.fgov.be/nl/result.asp?ref=a </with> <with name="method-value">POST</with> <with name="query-param">query</with> <with name="page-param">page</with> <with name="page-offset">0</with> </call-function> <input name="Submit" value="Zoeken" /> <input name="page" value="0" /> <input name="scope" value="/" /> <input name="stype" value="1" /> <input name="doctype" value="all" /> <input name="taal" value="nl" /> <input name="searchtype" value="1" /> <input name="rubriek" value="" /> <input name="sortering" value="rank" /> <input name="order" value="[d]" /> </form> <parser> <call-function name="regex-parser "> <with name="case-sensitive">true</with> <with name="START"><tr><td valign="top" class="noJustify">1</with> <with name="END"><i><a href="search.asp"><br></with> <with name="RESULT_START">&nbsp;</td><td class="noJustify"></with> <with name="RESULT_END"></td></tr></with> <with name="URL_START"><a href="</with> <with name="URL_END">" target="_blank"></with> <with name="TITLE_START"><b></with> <with name="TITLE_END"></b></a></with> <with name="DES_START"><br></with> <with name="DES_END"><br></with> <with name="URL_BASE">http://www.riziv.fgov.be</with> </call-function> </parser> </submit> <tests /> <help /> <description /> </source>
de bedoeling is om het geheel te hosten op 4 virtuele windows machines;
- sharepoint fronted
- microsoft SQL server
- proxy ( naar de publishers)
- IIS (web server) voor STS (secure Token service)
volgens mij moeten we de zoekdata realtime gaan ophalen vanuit de verschillende sites, deze parsen en doorsturen naar sharepoint via RSS/Atom
DATABASE -> Connector ->Zoekresultaten Parsen ->code om resultaten om te vormen naar RSS FEED output -> New content search (SP) -> results.aspx (SP)
hopelijk kan iemand me een stapje in de goede richting helpen.. ik heb me er al suf over gepiekert..
alle ideeën of voorstellen zijn welkom.
bedankt alvast,
laurent
|