0℃
由于业务需要,我需要寻找一个网站数据采集工具,这个采集工具就只需要完成一个工作,就是帮我到指定网站将指定格式的网址抓下来并保存。
经过了解,发现这个就是搜索引擎相关的东东,于是疯狂,百度了下。认识了Nutch、Grub、Swish-e、Larbin、Lucene等,这些都是业内知名的类似google、百度的搜索引擎,而且大部分是开源的。经过了解与比较(参考了Nutch 初体验Nutch 初体验)发现Nutch相对强大,
所以尝试安装玩玩,结果发现这个东东最好是安装在LINUX上,我的电脑上又没有,如果马上安装LINUX就会很烦,而且我...
Cygwin, google, Grub, Larbin, Lucene, Nutch, Swish-e阅读全文



