搜索引擎学习资源汇总

来源:互联网  作者:佚名
摘要:一、综合类1、卢亮的搜索引擎研究 http://www.wespoke.com/卢亮属于搜索引擎开发上的专家,以前开发过一个搜索引擎"博索"(http://booso.com/),好像现在已经停止开发了,目前他服务于博客网。在他的这个bl……

<一>、综合类

1、卢亮的搜索引擎研究    http://www.wespoke.com/

卢亮属于搜索引擎开发上的专家,以前开发过一个搜索引擎"博索"(http://booso.com/),好像现在已经停止开发了,目前他服务于博客网。在他的这个blog上可以了解许多搜索引擎开发的技术和经验,值得持续关注。

2、laolu'blog  

有不少来自国外的关于搜索引擎方面的资料,偏重于资料和数字

3、哈斯日志 http://www.loverty.org/

在这里可以看到国内外几大搜索引擎的最新动态,值得关注搜索发展形势的人多看看

4、北京奕天锐新科技有限公司   http://www.21cnbj.com/

搜索引擎、SEO、SEM等行业新闻动态

5、中文搜索引擎指南网     http://www.sowang.com/

搜索引擎最新动态,各种搜索技巧、方法

6、中文全文检索网     http://www.fullsearcher.com/

FullSearcher.Com是有两个对搜索爱好的年轻人创办,我们的目标是让中文互联网全面进入搜索时代,让搜索无处不在。通过搜索改变人们的生活。
  FullSearcher提供全文检索的相关知识、垂直搜索引擎知识、搜索的相关新闻等搜索相关内容。

7、周博——每天9点档的搜索引擎动态  

8、李彦宏的博客  http://hi.baidu.com/liyanhong

9、中科院软件所- 张俊林博客  http://blog.csdn.net/malefactor/

搜索引擎技术研究

<二>、Google动态

Google官方博客:Google 黑板报   http://googlechinablog.com/

                            Google 中国的博客网志,走近我们的产品、技术和文化
1、Gfans   http://gfans.org/

2、G速客 http://www.gseeker.com/


<二>、其他搜索引擎动态

1、雅虎搜索日志  http://ysearchblog.cn/

记录雅虎搜索引擎的动态、产品、技术等

2、搜狗实验室  http://www.sogou.com/labs/

搜狗实验室(Sogou Labs)是搜狗搜索核心研发团队对外交流的窗口,包含创意产品、原型演示、资料下载、学术论文四个栏目。实验室热烈欢迎一直以来关注搜狗、支持搜狗的各位互联网玩家;对于致力于中文互联网研究的学术界同仁们的经常来访,也予以热切的期待。我们期望通过这个平台,展现搜狗研发团队强大的研发、创新能力;推动学术界和产业界的交互;了解用户对新产品的需求。我们的目标:为中文网民的互联网生活提供更加全面、更加优质的服务。

搜狗实验室博客  http://labs.blog.sohu.com/

3、百度的空间 http://hi.baidu.com/baidu

百度的动态

4、有道搜索博客   http://i.yodao.com/

网易新推搜索引擎--有道搜索的近期动态

5、Live Search's WebLog  http://blogs.msdn.com/livesearch/

Microsoft Live Search's news    http://windowslivebeta.spaces.live.com/


二、搜索引擎代码资源


一>、搜索引擎/网络蜘蛛程序代码

国外开发的相关程序

1、Nutch

官方网站 http://www.nutch.org/
中文站点 http://www.nutchchina.com/
最新版本:Nutch 0.7.2 Released

Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具,可以建立自己内部网的搜索引擎,也可以针对整个网络建立搜索引擎。自由(Free)而免费(Free)。

2、Lucene

官方网站  http://lucene.apache.org
中文站点  http://www.lucene.com.cn/

Lucene 是apache软件基金会 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包[用Java写的],即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。

3、Larbin: http://larbin.sourceforge.net/index-eng.html

larbin是一种开源的网络爬虫/网络蜘蛛,由法国的年轻人 Sébastien Ailleret独立开发。larbin目的是能够跟踪页面的url进行扩展的抓取,最后为搜索引擎提供广泛的数据来源。

【相关文章】好搜一下
韩国宽带网速全球最快!中国名列77位

韩国宽带网速全球最快!中国名列77位

近日美国互联网流量监测机构Ookla发布了最新的全球宽带服务统计数据,该报告显示…