Facebook开放图谱:如何从9亿用户数据里找猛料

系统
Facebook 平台有6年历史了,公司借用它的开放图谱正在不断扩张,如今有900万个应用借助这个开放图谱在社交网络平台上分一杯羹,而最近Viddy、SocialCam、VEVO等借助开放图谱获得大量用户,也说明了开放图谱的价值。

Facebook 平台有6年历史了,公司借用它的开放图谱正在不断扩张,如今有900万个应用借助这个开放图谱在社交网络平台上分一杯羹,而最近Viddy、SocialCam、VEVO等借助开放图谱获得大量用户,也说明了开放图谱的价值。

开放图谱介绍:

1. 本质上,开放图谱是一种方式,它抓取Facebook用户在第三方服务上的数据,然后反馈给Facebook 机器。这样它就可以向所有在线的朋友分享全部的信息。比如数字音乐服务Spotify, 你跟你Facebook的朋友分享你喜欢的Spotify音乐,这些小碎片全部汇集到Facebook动态更新, 然后到Facebook时间线,最后这个碎片会影响你的其它Facebook朋友。

Facebook超过9亿用户每天都会产生大量数据,但Facebook不能把所有的信息碎片显示在你的新闻动态中,开放图谱让应用和网站开发者构建他们的数据,这样Facebook机器可以重新分类并有目的性的利用这些数据。

2. Facebook的开放图谱总负责人Mike Vernal表示:“我们可以借助传统的文本分析来得出结果, 但最后还是决定建立一个构架:开发者能够明确告诉我们他应用的相关信息,这样方便我们快速提炼出更有趣,更直观的信息。”

应用开发者在自己的网站上构建数据库,Facebook就在开放图谱上构建这些应用。前Myspace母公司Fox Interactive员工Adrian Aoun认为:“Facebook之所以能打败Myspace, 就是因为它能够有效地管理数据,而且条理清楚。”

 

在开放图谱怎样甄选数据:

Facebook储存着两种数据:目标数据和描述目标数据关系的数据;

1. “在系统的顶层我们支持开发者定义他们的目标数据,然后像整理一般用户信息一样对开发者目标数据进行归类。”

系统主要从两部分工作:1. 分析什么内容能让Facebook听众感兴趣。2. 基于第一个分析出的结果分析什么内容对你是特别重要的。然后我们汇总这两个分析,决定新闻动态系显示什么,时间线显示什么,其他相关的系统显示什么。

2. “在网页上,我们试图分析你在寻找什么, 比如Obama有3000万粉丝, 如果你访问他的主页,我们会提示你的哪些朋友也喜欢他,我们做这个只需要几毫秒。”

当用户在Facebook上这里点击,那里点击的时候, 软件平台Scribe正在实时记录这些数据,另外一个接入Scrible的平台正在进行实时分析,得出什么是最受欢迎的,什么是最不受欢迎的。这些记录会被储存在另一个数据库里,然后显示在新闻动态,时间线里。Vernal 表示,数据从一个系统移到另一个系统耗时20-30秒,每个小时有数亿的转移行为在发生。所以才保证了Facebook这个开放图谱的高速运行。

【编辑推荐】

  1. Facebook开源计划效果类似于NASA?
  2. 再谈Facebook的商业模式
  3. Facebook 的自动化测试
责任编辑:Yeva 来源: 雷锋网
相关推荐

2021-04-06 11:06:02

Facebook黑客论坛泄露的数据

2011-04-11 23:34:44

FacebookHBase迁移

2024-02-01 00:03:02

2021-10-25 05:33:13

Facebook黑客数据泄露

2018-01-24 11:49:34

2015-01-05 09:56:41

UDPLinux TCP

2021-06-30 14:02:21

黑客LinkedIn网络攻击

2021-09-29 15:32:32

数据泄露漏洞信息安全

2011-10-31 09:37:16

2010-08-06 10:56:48

2021-07-01 09:55:47

暗网数据泄露网络攻击

2021-01-20 23:40:27

数据泄露OpenWRT攻击

2011-12-18 21:27:29

Android

2018-09-29 15:36:39

2011-03-25 15:21:43

2020-08-28 15:48:52

IPv6LTE终端网络基础

2020-03-26 10:12:28

网络安全 数据技术

2010-01-20 16:22:58

2021-11-10 19:20:29

微信QQ移动应用

2021-01-06 10:01:09

数据泄露漏洞信息安全
点赞
收藏

51CTO技术栈公众号