90后技术宅与他的非主流另类搜索引擎Magi

新闻 人工智能
最近,一个名叫 Magi 的搜索引擎成了重点关注对象,据称这个搜索引擎和我们常见的搜索引擎很不一样,有一种程序员们钟爱的 X 冷淡风格。

 最近,一个名叫 Magi 的搜索引擎成了重点关注对象,据称这个搜索引擎和我们常见的搜索引擎很不一样,有一种程序员们钟爱的 X 冷淡风格。于是我们打开 Magi 看了看。确实,这个页面看着就很让人舒爽。

重要的是搜索结果也很不一般,属性中的每一个结果有对应的链接,并带有标签和主要学习来源部分,搜索结果以结构化知识的形式呈现。这种模式和国内外主流的搜索引擎完全不一样,让人感觉新鲜。

当然,也让人由此发出疑问:Magi 到底是什么,是谁开发的,好不好用?

按照开发者 PeakJi 季逸超的讲述和 Magi 网站上的说明,Magi 其实并不是单纯的网页搜索引擎,而是自主阅读文本并持续纠错的 AI。

Magi 是由 Peak Labs 从无到有自研的基于机器学习的信息抽取和检索系统,它能将任何领域的自然语言文本中的知识提取成结构化的数据,通过终身学习持续聚合和纠错,进而为人类用户和其他人工智能提供可解析、可检索、可溯源的知识体系。11 月,Peak Labs 发布了公众版 Magi.com。

与搜索引擎不同,Magi 不仅收录互联网上的海量文本,还会去尝试理解并学习这些文本中蕴含的知识和数据。此外,Magi 从零研发了一套互联网搜索引擎,所以 Magi.com 同时提供全网规模的普通搜索结果,学习过程是在无人干预的情况下 7 x 24 小时不间断运行。

互联网数据浩如烟海,质量参差不齐,如何将这些数据处理成机器能够理解的数据结构时隔巨大的挑战。在“Magi 的使命”一项中,Peak Labs这样写道:作为公众版本的 magi.com 为人类用户提供了与互联网数据交互的新方式,而 Magi 系统背后的技术平台则承载着另一半重要的意义:让机器像人一样能理解并充分利用互联网中无穷无尽的知识。

对 Magi 的技术感兴趣的同学,可以访问 www.peak-labs.com 官网和季逸超的知乎,我们在这里就不多说了。

下面来关注一下 Magi 背后的团队——Peak Labs,以及创始人 PeakJi 。

创始人 PeakJi 真名季逸超,90 后男生,在北大附中读高中期间接触 iOS 并加入威锋网 WEIP 技术组,先后参与了 wefit 输入法的完善和各种越狱研究,高三设计并开发猛犸 1 网页浏览器,大一推出猛犸 4。据说,PeakJi 所有的产品都是由他独自完成设计、美工、算法、编码、测试和推广,可见啊这是一个非常有想法,动手能力也很强的“技术宅”了。

[[283111]]

2012 年,在北大念书的季逸超创建 Peak Labs,并发明了 Rasgueado 输入法。据说 Peak Labs 的产品和技术还有很多,什么神经信息提取系统 Ireul,网页大规模搜索引擎 Ramiel,多语言分析 pipeline Arael 和分布式检索系统 Matarael 等等,利用这些技术构架,他们搭建了 Magi 服务,包括普惠版和企业版两种。

如果你要问 Magi 好不好用,我们暂时也无法给出明确回答,因为 Magi 目前完成度还有待提高。但是,比起当做搜索引擎来用,Magi 应该更适合做知识学习链库。

在使用的过程,我们会发现 Magi 也有很多不足之处,尤其是在搜索规模和答案准确度上。面对一些简单搜索,Magi 往往给不出让人满意的答案,而且速度也不够快。另外,它不是一款搜索引擎,像搜索网址这类任务也达不到很好的效果,也无法进行图片搜索。

对于 Magi 的缺点,团队和 PeakJi 都大方坦诚。

Peak Labs 指出,Magi 已经展示出的开放领域信息提取能力,可以应用到企业客户所在的细分领域内,变成一个更加强大的信息抽取系统,让每一个领域、每一家企业都可以轻松地打造属于自己的知识图谱,他们希望未来的 Magi 系统能够成为“知识领域的 ImageNet”。

Magi 现在还远算不上成熟,但其特性决定了它无穷的可能性和成长空间。未来,也许 Magi 会成为打破现有搜索引擎原理的新范式,开启全新的结构化知识搜索引擎时代,改变我们对信息检索和知识获取方式的刻板印象,毕竟在信息大革命和人工智能大发展的时代,千帆竞速,百舸争流,谁都有机会。

 

责任编辑:张燕妮 来源: 威锋网
相关推荐

2011-06-20 18:23:06

SEO

2020-08-10 14:39:30

搜索引擎

2014-07-29 10:44:52

LinuxLinux命令

2009-05-06 14:35:17

搜索引擎PHP技术

2014-08-13 11:04:02

搜索引擎排序算法

2014-08-05 15:10:05

Larbin搜索引擎

2009-02-19 09:41:36

搜索引擎搜狐百度

2009-09-22 16:23:52

搜索引擎

2011-07-01 15:51:20

SEO

2020-03-20 10:14:49

搜索引擎倒排索引

2017-08-07 08:15:31

搜索引擎倒排

2010-08-02 16:08:39

ibmdwJava搜索引擎

2016-12-26 13:41:19

大数据搜索引擎工作原理

2011-07-21 16:32:07

SEO

2010-06-13 16:27:28

搜索引擎

2010-04-20 11:43:46

2011-06-23 14:48:52

网站更新频率搜索引擎

2012-09-07 13:22:21

搜索搜狗

2022-10-08 09:13:18

搜索引擎⽹站

2011-06-19 09:15:25

搜索引擎
点赞
收藏

51CTO技术栈公众号