Google研发实时索引系统 网页更新数秒即可搜到

开发
目前Google公司正在开发一套网页实时索引系统,未来小型网站在更新网页几秒钟之后,Google将会自动进行索引并让网民查询到。

目前Google公司正在开发一套网页实时索引系统,未来小型网站在更新网页几秒钟之后,Google将会自动进行索引并让网民查询到。美国搜索行业专家丹尼 苏利文(Danny Sullivan)表示这将让Google掀起新的“篇章”。

去年秋天,Google负责PubSubHubbub (PuSH)实时分发协议开发的工程师布雷特 斯拉特金(Brett Slatkin)曾表示,希望有朝一日Google能够使用PuSH协议索引互联网网页,而不是目前已经使用了多年的顺藤摸瓜、抓取链接的方式。Google高级产品经理迪兰 凯西(Dylan Casey)日前在加州由苏利文所在公司举办的“搜素营销展会”上表示,Google很快将发布一个标准,让网站管理员能够参加未来的实时索引计划。

PuSH是一套基于ATOM格式的内容分发系统,网站出版商对外界公开一个Hub,一旦网站网页有所更新,Hub将会即使发出通知。订阅者将会对Hub反馈:“如果网站方发布新内容,请直接发送给我们”。这样,订阅者无需像过去那样随时查看网站是否有更新,只需要坐等Hub的通知。整个过程只需要在几秒钟内即可完成。

一旦Google采用PuSH模式索引网页,该公司可能会要求所有的网站实施这项技术,并向Google告知网站Hub信息,就好象Google之前从网站那里获得的RSS源文件。这样,Google将可以快速知晓哪些网站的内容进行了更新。

媒体分析认为,PuSH模式不会完全取代传统的抓取,实际上Google需要依靠抓取过程发现PuSH文件,而这种实时索引将极大增强Google的网页数据库。苏利文也指出,Google在实施这项技术之前还需要进行垃圾信息控制,不能让所有新发布的内容都被立刻索引到。

Google的斯拉特金表示,这种技术将给大量的小型网站带来改观。现在,Google针对小网站一般每周索引一次。而在PuSH技术下,小网站的内容将立刻被Google用户搜索到。需要指出的是,PuSH带来的益处将被Google之外的所有搜索引擎享受到,它属于开放协议,网站的Hub除了Google之外,也能被雅虎或者必应等搜索看到。

【编辑推荐】

  1. 总结2009年Google五大WEB应用
  2. GWT 2.0发布 揭示Google Web开发新战略
  3. 将Google Book Search 集成到 PHP 应用中
  4. 开发人眼中Google Wave的优缺点
  5. 谷歌Gmail愈发靠近Google Wave?
责任编辑:王晓东 来源: 搜狐IT
相关推荐

2014-05-15 10:00:31

Dropbox安全漏洞

2009-07-08 17:04:47

Google Chro

2011-07-26 09:50:29

Mozilla操作系统

2011-12-20 21:10:02

Google

2015-03-09 10:02:58

Google虚拟现实

2010-09-15 11:00:03

CaffeineMapReduceBigTable

2022-06-27 09:09:34

快手Flink数仓建设

2010-05-21 10:37:45

Google SVN

2018-12-12 10:31:15

Google网页快照WEB安全

2012-05-24 13:25:56

HTML5

2012-03-29 13:17:27

GoogleWEB

2013-07-18 10:43:36

加密Google

2019-06-10 16:15:14

微软Windows 10五月更新

2010-03-29 13:39:41

ibmdwPHP

2013-05-16 14:31:49

GoogleGoogle Maps

2010-06-10 13:54:10

MySQL全文搜索

2015-10-10 09:57:23

AMP谷歌网页加载

2010-03-25 16:08:19

2021-05-02 22:53:56

Windows 10Windows微软

2012-05-09 11:56:28

RIM
点赞
收藏

51CTO技术栈公众号