静悄悄的搜索引擎革命

系统
我们处在网络信息爆炸时代,平均每天新增近30万新页面。如果说在互联网刚出现时,人工检索还能够应付的话,那么今天如果不借助智能搜索工具从海量信息中选取自己所需,将会彻底迷失。于是搜索引擎应运而生,它带来全新网络体验,使人们在浩瀚的信息大潮中不再那么手足无措。

我们处在网络信息爆炸时代,平均每天新增近30万新页面。如果说在互联网刚出现时,人工检索还能够应付的话,那么今天如果不借助智能搜索工具从海量信息中选取自己所需,将会彻底迷失。于是搜索引擎应运而生,它带来全新网络体验,使人们在浩瀚的信息大潮中不再那么手足无措。

搜索引擎经历了哪些阶段?新一代搜索引擎是什么样?有哪些特点?搜索引擎未来发展趋势如何?近日,笔者就这些问题采访了微软亚洲研究院的高级研究员周明博士。

 

[[72574]]

 

从目录导航到关键字

1995年,雅虎用目录式搜索方式敲开了搜索引擎的大门,以一种把各类网站分类、排序的方法将纷乱如麻的网络信息理出些许头绪。虽然它没有脱离人工,却大大缩短了人们搜寻所需信息的路径。虽然第一代搜索引擎较为原始,但其目录搜索方式仍然具有强大的生命力。对此,周明说:“由于搜索结果简单、直观,目录式搜索不但不会被淘汰,而且还可能走向复兴。”Google举起了第二代搜索引擎的大旗,“关键词”即是这代搜索引擎的关键词。它实现了搜索的机器化,只需在词条框里输入关键词语,相关信息便会列队站好。从抓取题目到抓取全文,关键词式搜索功能越来越强大。但是,在海量信息面前,前两代搜索模式渐渐显得力不从心。目录式搜索只能为人们提供简单的方向,不是精准结果;关键词搜索的结果依然让人眼花缭乱。网络世界正呼唤功能更强大的第三代搜索引擎。

第三代搜索引擎进行时

“附近哪家餐馆比较好?”对于商业人士和大学生,第三代搜索引擎将给出截然不同的答案。那么如何才能达到这样的目标呢?周明表示,社交网络如新浪微博、Facebook的普及给搜索引擎发展带来了新机遇。当我们提出段首这一搜索问题时,来自好友的各种“赞”会映入眼帘。同时,社会关系网络也像知音一样了解用户的搜索、阅读和选择习惯,因此会自动排列搜索结果。除此之外,即使用户不进行搜索,系统也会贴心地主动向用户推荐提供相关信息。

如果说如此智能的服务我们还可望而不可及的话,那么同样印有第三代搜索引擎烙印的实时搜索和智能排序已经悄悄地嵌入现阶段的搜索之中了。“发展独立的微博搜索和社会关系网络搜索,或者把微博和社会关系网网络的内容纳入到通用的搜索,都是实时搜索的重要应用。”周明说。虽然依旧是关键词搜索,但搜索引擎已经能够抓住这些即时消息,通过其他网民的发帖,人们可以更快速地关注到正在发生的事件,并且可以更自由地挖掘新闻信息的深度,这也在一定程度上适应了新闻时效性的特点。另一方面,社交网站上的分享、转发等功能也帮助系统分清什么样的信息是重要的,是人们所关注的,应该排在前列的。这样,就在一定程度上解决了死链、垃圾信息等问题,完成了搜索反馈的更新。归结于一句话,周明定义的的第三代搜索是“全信息基础上的个性化搜索,并在此基础上作推荐”的智能化搜索。

“移动搜索的未来”

移动设备正逐渐变成我们的得力助手。订机票、搜美食、地图导航,它似乎样样精通。但屏幕小、输入不便等因素又使它不能很好地驾驭传统的关键词搜索模式。如何适应移动搜索现实性、交友性和与生活密切相关等特点,成了移动搜索研究的主要课题。语音交互方式的出现很大程度上解决了输入问题,此时的人们不用再为关键词所限,可以随意用长句来提出自己的问题,这就要求系统在自然语言研究方面有一个大的提升,能够“听懂”我们的问题。定位技术的发展在很大程度上满足了移动搜索对于位置信息的需求,周边搜索变得方便、快捷。移动搜索应该具备的功能之一是自动整合社交网站上的信息,包括好友的推荐、评价以及社交网根据用户搜索历史所做出的判断。移动搜索还应帮人们完成后续操作,例如提供商品信息的比较、获取购物优惠券、进行评论甚至直接预定好酒店,这一切都拉进了人和互联网的距离,大大简化了从搜到用的过程。

“第三代搜索引擎时代正悄然来临,但它步履轻盈,悄然无声。或许几年之后,当我们回过头,突然发现搜索变得智能、个性、准确,才恍然大悟,原来我们已登上了新台阶。”周明说。(文/人民日报)

 

[[72575]]

 

微软亚洲研究院高级研究员周明博士

【编辑推荐】

  1. Mozilla的虚伪:苹果能阻止火狐 微软不能
  2. 叫板微软OS 深度体验Ubuntu 12.04 LTS
  3. Mozilla 控告微软阻碍火狐浏览器登陆 ARM 设备
责任编辑:Yeva 来源: mydrivers
相关推荐

2011-06-20 18:23:06

SEO

2009-02-19 09:41:36

搜索引擎搜狐百度

2009-09-22 16:23:52

搜索引擎

2020-03-20 10:14:49

搜索引擎倒排索引

2017-08-07 08:15:31

搜索引擎倒排

2016-12-26 13:41:19

大数据搜索引擎工作原理

2010-06-13 16:27:28

搜索引擎

2010-04-20 11:43:46

2012-09-07 13:22:21

搜索搜狗

2022-10-08 09:13:18

搜索引擎⽹站

2011-06-22 17:28:51

SEO

2020-08-10 14:39:30

搜索引擎

2011-06-15 19:09:24

搜索引擎

2015-08-31 10:41:58

搜索引擎Google云应用

2020-02-24 08:52:08

开源索引YaCy

2011-06-03 10:19:53

2023-09-21 15:05:12

ChatGPT搜索引擎

2009-12-10 15:09:46

PHP搜索引擎类

2023-02-08 10:45:23

2009-07-30 10:40:56

搜索引擎优化网站
点赞
收藏

51CTO技术栈公众号