Web2.0下的文件缓存技术优化

安全 应用安全
Web 2.0是一种新的互联网方式,通过网络应用 (Web Applications)促进网络上人与人间的信息交换和协同合作,其模式更加以用户为中心。典型的Web 2.0站点有:网络社区(BBS)、网络应用程序、社交网站、博客、Wiki等等。

51CTO.com综合报道】Web 2.0是一种新的互联网方式,通过网络应用 (Web Applications)促进网络上人与人间的信息交换和协同合作,其模式更加以用户为中心。典型的Web 2.0站点有:网络社区(BBS)、网络应用程序、社交网站、博客、Wiki等等。

正如同创新2.0所倡导的以人为本、草根创新、开放创新、共同创新理念,Web 2.0的核心概念是互动、分享与关系,所有的网络行为,都可用“互动、分享、关系”的概念来做诠释。在Web 2.0兴起的今天,信息的发布已经不再是管理员统一发布的了。Web 2.0网站的内容通常是用户发布的,使得用户既是网站内容的浏览者也是网站内容的制造者,这也就意味着Web 2.0网站为用户提供了更多参与的机会,例如:微博和维基百科就是典型的用户创造内容的指导思想。这一交互方式模式的转变,使得互联网用户的网络访问具备以下特点:

1.海量数据。之前的Web站点多半属于静态网页,信息的发布是基于管理员统一操作,而Web 2.0网站的信息发布主要来自于用户,这使得数据量呈爆炸性的增长,原先一个网站可能几百个G的数据量,而现在一个Web 2.0站点,动辄上T,甚至是几个T。

2.实时刷新。Web2.0体现是用户间的参与、共享、交互,进而给用户带来丰富多彩的访问体验。直接的影响就是网络流量增大,服务器请求压力变大。

而上述两点对传统的Cache服务器的业务实现提出了严峻的挑战。针对Web站点,传统的Cache服务器多半采用直接的页面缓存技术,即将动态页面直接生成静态的页面放在Cache服务器端,用户调取相同页面时,静态页面将直接下载到客户端,不再需要远程访问网站服务器。如果针对Web 2.0网站进行缓存,至少会遇到两个问题,一是单一网页的数据量远超过传统网页,这对Cache服务器的系统性能和存储容量带来挑战;另外,由于Web 2.0网站的内容是动态刷新的,Cache服务器转存为静态页面,会破坏站点内容的时效性,严重影响客户体验。

有些传统Cache服务器的厂商会解决上述难题,考虑过多种处理策略,比如缩短Cache服务器页面内容的抓取间隔,但这一操作同样会加重对网站服务器的请求负担,进而出现无法刷新或者是失败的情况,影响到用户的访问体验。因此如何针对Web 2.0站点的特点来更新缓存机制,是目前Cache服务器厂商所迫切需要解决的问题。网康安全代理服务器(NPS)基于对Web 2.0网站的服务特点进行深入全面的研究,发现Web2.0网站的内容虽然都是在不断更新和变化,但这并不意味着该网站的所有页面信息就是动态内容。通过对Web 2.0网站页面生成逻辑进行进一步分析发现,一般页面内容分为两部分:动态内容和静态内容。动态的内容是指用户每次点击相同的链接时实时获取的信息,由Web服务器应用程序生成的,如常见的ASP,JSP等;与此相对应,静态内容一般就是指由文本、图像和多媒体组成,在用户每次单击相应链接时基本保持不变。

基于以上分析研究,结合国内Web 2.0站点的内容特点,网康安全代理服务器(NPS)提出了对象缓存控制机制、对象多级缓存机制、对象预取机制,从而实现了Web 2.0页面缓存的技术优化。

3.对象缓存控制机制,网康科技依托多年的技术积累及对Web 2.0站点内容的精准把握,网康安全代理服务器实现对单一页面中静态内容和动态内容的有效区分,针对不同类别的网页内容片断分别赋予不同的缓存控制机制。网康安全代理服务器通过这样的控制机制,可以有效地减少从服务器抓取整个页面的次数,而只用从原服务器中提取少量的动态内容,明显减少了网络出口处的网址请求数,同时提高用户访问的响应时间。

4.对象多级缓存机制,根据实际用户对不同页面内容的响应时间要求,可以基于用户配置将需要快速响应的页面对象保留在高速内存中,对响应时间低的对象缓存于磁盘,从而有效的保证了响应速度。

5.对象预取机制,根据对象的关联性,当用户请求一个对象后,代理服务器可以根据对象的关联分析将相关度最高的对象预取到内存,以提升用户体验。

正是基于上述灵活的多级缓存、缓存控制、对象预取等方法,才使得网康安全代理服务器深受用户喜爱,并在金融、能源、航空领域得到业界客户的一致好评。

 

责任编辑:守望幸福 来源: 51CTO.com
相关推荐

2009-11-30 16:36:35

IBM

2009-07-01 08:49:34

架构Web2.0Twitter

2009-03-24 10:14:15

2009-02-09 13:28:11

2010-05-06 15:49:50

Web2.0负载均衡

2019-09-03 18:38:39

2009-02-04 09:11:52

Web2.0术语FTW

2009-07-30 18:12:06

Web 2.0Web 0.2

2010-09-17 14:50:06

2009-06-29 14:15:25

2009-02-20 09:50:21

Web2.0概念趋势

2009-09-15 23:40:52

2010-01-19 08:50:30

Web2.0网站性能调

2009-08-25 15:14:57

IBM模块化服务器

2009-04-02 13:13:44

web2.0O'Reilly网络智能化

2009-08-20 15:01:10

Web2.0时代的PH

2011-05-30 10:10:17

Web2.0

2012-04-02 16:35:49

网络缓存

2009-03-10 10:34:41

2011-05-18 15:02:52

点赞
收藏

51CTO技术栈公众号