搜索引擎学习资源汇总
<一>、综合类
1、卢亮的搜索引擎研究 http://www.wespoke.com/
卢亮属于搜索引擎开发上的专家,以前开发过一个搜索引擎"博索"(http://booso.com/),好像现在已经停止开发了,目前他服务于博客网。在他的这个blog上可以了解许多搜索引擎开发的技术和经验,值得持续关注。
2、laolu'blog
有不少来自国外的关于搜索引擎方面的资料,偏重于资料和数字
3、哈斯日志 http://www.loverty.org/
在这里可以看到国内外几大搜索引擎的最新动态,值得关注搜索发展形势的人多看看
4、北京奕天锐新科技有限公司 http://www.21cnbj.com/
搜索引擎、SEO、SEM等行业新闻动态
5、中文搜索引擎指南网 http://www.sowang.com/
搜索引擎最新动态,各种搜索技巧、方法
6、中文全文检索网 http://www.fullsearcher.com/
FullSearcher.Com是有两个对搜索爱好的年轻人创办,我们的目标是让中文互联网全面进入搜索时代,让搜索无处不在。通过搜索改变人们的生活。
FullSearcher提供全文检索的相关知识、垂直搜索引擎知识、搜索的相关新闻等搜索相关内容。
7、周博——每天9点档的搜索引擎动态
8、李彦宏的博客 http://hi.baidu.com/liyanhong
9、中科院软件所- 张俊林博客 http://blog.csdn.net/malefactor/
搜索引擎技术研究
<二>、Google动态
Google官方博客:Google 黑板报 http://googlechinablog.com/
Google 中国的博客网志,走近我们的产品、技术和文化
1、Gfans http://gfans.org/
2、G速客 http://www.gseeker.com/
<二>、其他搜索引擎动态
1、雅虎搜索日志 http://ysearchblog.cn/
记录雅虎搜索引擎的动态、产品、技术等
2、搜狗实验室 http://www.sogou.com/labs/
搜狗实验室(Sogou Labs)是搜狗搜索核心研发团队对外交流的窗口,包含创意产品、原型演示、资料下载、学术论文四个栏目。实验室热烈欢迎一直以来关注搜狗、支持搜狗的各位互联网玩家;对于致力于中文互联网研究的学术界同仁们的经常来访,也予以热切的期待。我们期望通过这个平台,展现搜狗研发团队强大的研发、创新能力;推动学术界和产业界的交互;了解用户对新产品的需求。我们的目标:为中文网民的互联网生活提供更加全面、更加优质的服务。
搜狗实验室博客 http://labs.blog.sohu.com/
3、百度的空间 http://hi.baidu.com/baidu
百度的动态
4、有道搜索博客 http://i.yodao.com/
网易新推搜索引擎--有道搜索的近期动态
5、Live Search's WebLog http://blogs.msdn.com/livesearch/
Microsoft Live Search's news http://windowslivebeta.spaces.live.com/
二、搜索引擎代码资源
一>、搜索引擎/网络蜘蛛程序代码
国外开发的相关程序
1、Nutch
官方网站 http://www.nutch.org/
中文站点 http://www.nutchchina.com/
最新版本:Nutch 0.7.2 Released
Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具,可以建立自己内部网的搜索引擎,也可以针对整个网络建立搜索引擎。自由(Free)而免费(Free)。
2、Lucene
官方网站 http://lucene.apache.org
中文站点 http://www.lucene.com.cn/
Lucene 是apache软件基金会 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包[用Java写的],即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。
3、Larbin: http://larbin.sourceforge.net/index-eng.html
larbin是一种开源的网络爬虫/网络蜘蛛,由法国的年轻人 Sébastien Ailleret独立开发。larbin目的是能够跟踪页面的url进行扩展的抓取,最后为搜索引擎提供广泛的数据来源。