贝叶斯算法会是破解“App刷票”的良方

移动开发 算法
根据APP刷排名产业链调查一文中提供的信息,目前苹果App Store中刷排行的方式主要是刷下载量,既用假的itunes账户下载应用。尽管苹果从未透露过排名算法,但据iOS开发者透露,对App Store中应用排名起决定性作用的就是下载量。

  近日,沸沸扬扬的360 App刷排名事件及其背后黑色产业链的浮现让公众对App Store的公正性引发质疑。尽管苹果官方已于2月7日针对其应用程序开发者发出一份带有警告意味的声明,劝告开发者不要试图操纵App Store排行榜,并表示将加大审查和处罚力度。但不难看出在App Store现有的应用排名和评分机制下,苹果很难对刷票者及其带来的负面影响做到全盘精确掌控。

  截至2011年5月,苹果App Store中共有超过50万个应用程序,其中中国区应用程序就高达37万个,光是iPhone用户,每天就有约600万人在App Store中下载应用程序,如此庞大的数量,不置可否的将产生大量管理工作,如审核、上架、下架等等。因此,苹果App Store内应用程序的排名及评价管理不可能采用人工方式,取而代之的是一套苹果自有的程序体系。

  根据APP刷排名产业链调查一文中提供的信息,目前苹果App Store中刷排行的方式主要是刷下载量,既用假的itunes账户下载应用。尽管苹果从未透露过排名算法,但据iOS开发者透露,对App Store中应用排名起决定性作用的就是下载量。

  暂且不论算法的科学性,这种排名方式本身有失公允,很简单的例子就是在我们身边,餐饮店肯定比加油站多,你不能因为每天吃饭的人比加油的多而将吃饭这种消费行为排在加油前面。当然,受制于App Store首页的空间限制,苹果只能笼统地划分出“付费应用软件排行”、“免费应用软件排行”、“畅销应用软件金榜”、“员工最爱”等基于少数几个先决条件的排名方式。而考虑到首页的影响力,相信敢把自己产品刷到首页排名的并不多,这太明显了,假到自己都不信。因此App Store虚假排名的“重灾区”只会存在于分类导航页面中。

  OK,既然大家同属一个分类,那么正常且理想状态下即靠实力吃饭。但在APP刷排名产业链出现后,凭借下载量+评分的传统评判方式显然落伍,因为电脑速度再快也无法判断数字背后的主观意图。如果苹果App Store不想大规模招聘客服,解决的办法唯有改变电脑的判定思维。

  相信喜欢电影的朋友都知道IMDB,它的IMDB评分被誉为是目前电影界相对而言最公正、公平的排名。IMDB所采取的,正是著名地贝叶斯算法,其公式为:加权平均分(WR) = (v ÷ (v+m)) × R + (m ÷ (v+m)) × C 。在这个公式里,R = 该电影的平均分 ;v = 该电影的总投票数 ;m = 列入排名前250所需要的最少票数(各阶段不同) ;C = 数据库中所有电影的总平均分(随权重波动) 。显而易见,这种算法比那些采用简单平均分算法更为科学,它既考虑了电影的受众人数,也考虑了电影的优劣。例如一部电影只有10个人看过,这10个人都给它打了10分,而另一部电影有10000人看过,平均分是9分,你觉得哪个好?相信大部分人会选择后者。这即是贝叶斯算法的依据。

  我们不妨把该公式往App排名中套。将R = 某款App的平均分;v = 某款App的总下载量; m = 列入排名所需要的最少下载量(根据该分类加权计算); C = 该分类中所有App的总平均分。如此一来,苹果只需将排名依据由下载量说了算变成评分说了算,便能有效降低刷排行行为带来的不利影响。

  不过正所谓道高一尺魔高一丈。除用假iTunes账户刷下载量外,一些代刷机构还能绕过技术限制(例如每一部手机上的IMEI只能发布一条评论。但因漏洞存在,代刷机构可通过模拟器伪造IMEI),伪造大量虚假用户评论(评分)。但从根本而言,贝叶斯算法仍是减轻当前App排名不利影响的一道良方。

责任编辑:佚名 来源: Techweb博客
相关推荐

2017-07-24 10:36:37

Python机器学习朴素贝叶斯

2017-08-07 13:02:32

全栈必备贝叶斯

2012-09-24 10:13:35

贝叶斯

2020-10-09 12:41:04

算法优化场景

2017-03-29 14:50:18

2013-05-08 09:05:48

狐狸贝叶斯大数据

2023-01-31 15:49:51

机器学习函数评分函数

2021-04-18 09:57:45

Java朴素贝叶斯贝叶斯定理

2016-08-30 00:19:30

2018-09-13 12:51:58

数据挖掘算法朴素贝叶斯

2023-10-18 08:00:00

贝叶斯网络Python医疗保健

2016-08-30 00:14:09

大数据贝叶斯

2021-08-30 11:53:36

机器学习人工智能计算机

2017-07-12 11:27:05

朴素贝叶斯情感分析Python

2022-09-28 08:00:00

Python机器学习算法

2020-05-21 14:50:37

算法深度学习人工智能

2017-06-12 06:31:55

深度学习贝叶斯算法

2017-08-19 08:36:25

贝叶斯优化超参数函数

2021-07-23 11:48:16

深度学习医疗人工智能

2023-09-12 11:36:15

携程模型
点赞
收藏

51CTO技术栈公众号