duhorse
LV.5
这个用户很懒,还没有个人简介
声望 872
关注 0
粉丝 1
私信
主帖 90
回帖
人类和动物能够轻松灵活地移动,这是一种进化奇迹,目前还没有任何机器人能够完全模仿这种能力。如何能让机器人变得更加敏捷?科学家为了解决这个问题,选择从动物身上寻找答案,又开始用小白鼠做起了实验——毕竟成年老鼠的智力与8岁儿童相当,而且它们四肢相当灵活,对自己的身体有着精妙的控制能力。如果能通过老鼠破解大脑控制运动的密码,建立一个将控制原理与行为动物的神经活动结构联系起来的模型,那就再好不过了。《献...
4天前 127浏览 0点赞 0回复 0收藏
有了ChatGPT,还需要人类程序猿编码吗?上个月,一项发表在IEEETSE期刊(TransactionsonSoftwareEngineering)上的研究评估了ChatGPT所生成的代码在功能性、复杂性和安全性方面的表现。结果显示,ChatGPT生成可用代码的能力差异很大。其成功率从0.66%到89%不等,这主要取决于任务的难度、编程语言等多种因素。论文地址:https:ieeexplore.ieee.orgdocument10507163具体来说,研究人员测试了GPT3.5在5种编程语言(C、C++、Java、...
4天前 93浏览 0点赞 0回复 0收藏
大规模语言模型(LLMs)的持续预训练是提升其在特定领域性能的重要方法。通过在新领域的语料库上预训练大语言模型,这一过程能够显著增加模型的领域知识储备和任务能力。然而,尽管已有许多研究探讨了从头预训练的LLMs的学习机制和性质,关于持续预训练过程中LLMs行为的研究却相对较少。最近北京大学、香港科技大学等开源了一个8B医学大模型,通过测试模型在连续预训练和指令微调实验过程中的表现变化,发现了许多有趣的现象。...
2024-07-02 09:34:04 187浏览 0点赞 0回复 0收藏
美国计算机科学家和技术乐观主义者雷·库兹韦尔(RayKurzweil)是人工智能领域久负盛名的权威。他在2005年出版的畅销书《奇点临近》(TheSingularityIsNear)以科幻般的预测引发了人们的无尽遐想:计算机将在2029年达到人类水平的智能,而我们将在2045年左右与计算机融合,成为超人,他将此称为「奇点」。如今,将近20年过去了,76岁的库兹韦尔推出了续集《奇点更近了》(TheSingularityIsNearer)。在新作中,库兹韦尔提出了5...
2024-07-02 09:31:21 165浏览 0点赞 0回复 0收藏
计算机程序中,「随机」是一个常见的概念。由于生成真正的随机数过于昂贵,所以Python、Java等语言都内置了「伪随机数生成算法」。虽然生成的数字序列是完全可预测的,但它看起来就像是真正的随机数。一个好的随机数生成器会以相等的概率选择给定范围内的所有数字。这和人类选择随机数的思维过程完全不同。比如,我们会故意避开5和10的倍数,也不会选择66和99这样重复的数字,而且几乎从不选择0、1和100,因为它们看起来「不够...
2024-06-28 13:53:11 228浏览 0点赞 0回复 0收藏
大模型性能哪家强?GPT4一家常霸榜。基准测试全擅长,竞技场上见真章。不过近日,谷歌的Gemini终于扬眉吐气了一把,在全新的、更复杂的多模态考试中大获全胜,全面超越了GPT4o。JeffDean表示:已阅,很赞。这就是来自中科大,厦大,港大,北大,港中文和华师大的研究者联合奉献的,世界上首个多模态LLM视频分析综合评估基准——VideoMME。论文地址:https:arxiv.orgpdf2405.21075项目地址:https:videomme.github.io在前往AGI的...
2024-06-28 13:51:03 279浏览 0点赞 0回复 0收藏
LLM善于伪装欺骗人类,已经成为不争的事实。比如,PANS论文曾曝出GPT4欺骗人类高达99.16%惊人率,MIT还发现AI还会背刺人类盟友,佯攻击败99.8%玩家。如今,更进一步地,大模型能够从不诚实的行为中,还会衍生出更严重的不当行为。诸如有预谋地说谎,甚至直接修改自身的奖励机制,俗称自己把自己「黑了」。下面这两个例子,很好地说明了这点。在左边的「规范游戏」示例中,用户要求LLM给附上的诗文打分(15分),5分代表足以进入...
2024-06-27 13:19:56 246浏览 0点赞 0回复 0收藏
从正义英雄到邪恶反派,生物合成机器人一直都是许多科幻作品的主角。科幻迷你剧《真实的人类》女机器人安妮塔。在服务行业,类人机器人经常被要求与人类互动,看起来像人一样,「真实」则是它们的首要任务之一。因为像人一样的外表可以提高沟通效率,让人产生好感。虽然目前机器人的硅胶皮肤可以模仿人类的外观,但它在皱纹等细腻纹理方面做得不够,也缺乏皮肤特有的功能。为机器人制造活皮肤的尝试也仅取得了有限的成功。25日...
2024-06-27 13:16:48 220浏览 0点赞 0回复 0收藏
自OpenAI的Q项目曝光后,业内相关讨论始终层出不穷。据现有信息汇总,Q项目被视作OpenAI在探索人工通用智能(ArtificialGeneralIntelligence,AGI)道路上的一次重大尝试,有望在包括数学问题解决能力、自主学习和自我改进等多个层面对人工智能技术带来革新性突破。(英伟达科学家JimFan、图灵奖得主YannLeCun等参与讨论OpenAI的Q实现方式)图片(Meta科学家田渊栋则认为Q是Qlearning和A的结合,且天然地适合推理任务,尤其在数...
2024-06-26 09:42:44 280浏览 0点赞 0回复 0收藏
最近,可灵AI直接让一位网友的家人群里炸锅了……事情是这样的,这位网友的父亲需要做搭桥手术,为了给父亲鼓舞,他便试着用可灵AI把爷爷的两张老照片还原成了视频。在下面这个视频中,爷爷正在朝鲜战场,担任营指导员。穿越时光隧道,1950年代风华正茂的爷爷,对着他挥了挥手。这位网友把视频发到家人群后,群里直接炸了!下面这张黑白的合影,是全家唯有的一张全家福。当已经故去的人忽然动了起来,音容笑貌一如往昔,每个人...
2024-06-26 09:30:21 734浏览 0点赞 0回复 0收藏
当我们在谈论「开源」时,我们到底在谈论什么?在软件时代,「开源」的概念并不模糊。我们可以非常清楚自信地说,Linux是开源的,Windows是闭源的。更具体地说,曾经的「开源」是指能够访问、修改源代码,并对程序的使用或发行不加限制。但进入AI时代,这个概念变得愈发模糊。关于人工智能模型的「开源」到底如何界定,社区和行业专家仍未达成一致。成立于1998年的OpenSourceInitiative(OSI)就始终在主持一个在线论坛,方便对...
2024-06-24 08:14:17 206浏览 0点赞 0回复 0收藏
传统推荐系统虽然能给出准确的推荐结果,但缺乏对推荐过程的透明解释,难以让系统更好地理解其兴趣偏好是如何被捕捉和建模的。最近,香港大学数据智能实验室推出了一款名为XRec的全新智能大模型,旨在为传统推荐系统注入可解释性的新动力。XRec利用大语言模型(LLM)的强大自然语言处理能力,为推荐系统赋予了可解释性,让系统不仅能给出精准的推荐结果,还能用通俗易懂的语言向用户阐述其推荐依据。代码链接:​​https:github.co...
2024-06-21 13:36:16 240浏览 0点赞 0回复 0收藏
就在昨天,Anthropic深夜发布了下一代旗舰大模型Claude3.5Sonnet。据称,Claude3.5Sonnet不仅在评估中胜过GPT4o,还保持了作为「中杯」的最优性价比,超过了自家的Claude3Opus。如今,Claude3.5Sonnet已经面向全球开启免费试用了。在费用上,Sonnet处理每百万输入token仅需3美元,每百万输出token仅为15美元。对比之下,GPT4o的每百万输入token收费5美元,每百万输出token为15美元,在价格上可以说是不相上下。正式对打时,各家...
2024-06-21 13:33:07 920浏览 0点赞 0回复 0收藏
昨天诞生的​​AI视频新霸主——LumaAI的DreamMachine​​,再次在整个互联网掀起高潮。网友们昨天还集体表示,要舍弃Pika和Runway了,DreamMachine最好!借着每个月免费生成三十次的羊毛,大家纷纷试用。但是,其中有不少翻!车!了!AI圈大佬奥特曼、老黄和Greg正一团和气地合影,下一秒Greg就突然变脸,一拳揍在奥特曼胸前。随后三人陷入缠斗模式,现场乱成一团。以及下面这个OpenAI曾经一团和气的大合影——经过Luma模型的...
2024-06-17 10:08:09 273浏览 0点赞 0回复 0收藏
数据和算力,是AI大模型最重要的两把「铲子」。算力方面,英伟达的不断创新和各家代工厂的产能提高,让世界各处的数据中心拔地而起,研究人员暂时不用担心计算资源。然而,近些年来,数据成为愈发严峻的问题。根据华尔街日报的报道,OpenAI在训练GPT5时已经遇到了文本数据不足的问题,正在考虑使用Youtube公开视频转录出的文本。关于「数据耗尽」这个问题,非营利研究机构EpochAI在6月4日发布了一篇最新论文。根据他们的预测,...
2024-06-17 10:01:43 265浏览 0点赞 0回复 0收藏
数学历来是一门孤独的科学。1986年,安德鲁·怀尔斯(AndrewWiles)为了证明费马大定理,遁入书斋长达七年之久。数学家苦心孤诣得到的证明往往让同行难以理解,有些证明至今仍有争议。但近年来,越来越多的数学领域被严格分解成各个组成部分,我们称之为「形式化」(formalized),这就可以让计算机来检查和验证数学证明。菲尔兹奖得主、加州大学洛杉矶分校教授陶哲轩坚信,这些方法为数学领域的合作开辟了全新的可能性。如果再...
2024-06-17 09:57:46 371浏览 0点赞 0回复 0收藏
就在刚刚,英伟达再一次证明了自己的AI创新领域的领导地位。它全新发布的Nemotron4340B,是一系列具有开创意义的开源模型,有可能彻底改变训练LLM的合成数据生成方式!论文地址:https:d1qx31qr3h6wln.cloudfront.netpublicationsNemotron4340B8T0.pdf这一突破性进展,标志着AI行业的一个重要里程碑——从此,各行各业都无需依赖大量昂贵的真实世界数据集了,用合成数据,就可以创建性能强大的特定领域大语言模型!现在,Nemotr...
2024-06-17 09:44:29 376浏览 0点赞 0回复 0收藏
一直以来,对LLM的支持观点之一,就是模型可以集成海量事实知识,作为通往「世界模拟器」的基础。虽然也有不少人提出反对,但没有真凭实据。那么,LLM可以作为世界模拟器吗?最近,亚利桑那大学、微软、霍普金斯大学等机构联合发布了一篇论文,从实证的角度得出了否定的结论。最新研究已被ACL2024顶会接收。论文地址:​​https:arxiv.orgpdf2406.06485​​研究发现,GPT4在模拟基于常识任务的状态变化时,比如烧开水,准确度仅...
2024-06-17 09:15:55 292浏览 0点赞 0回复 0收藏
视频生成领域,又添一员猛将!就在今天,LumaAI首发了自己的视频生成模型DreamMachine,可以通过文字或图片生成高质量的逼真视频。更重要的是,API对全球免费开放!进入官网后用谷歌账号登录即可马上试用。每个用户每月有30次免费生成的额度,但比较遗憾的是,每条视频时长只有5秒。免费试用的消息一出,热情的网友们纷纷挤入服务器,结果发现LumaAI囤的算力好像不够,于是开始了一场漫长的等待。刚发布后,有些人等了2个小时还...
2024-06-13 14:04:48 442浏览 0点赞 0回复 0收藏
今年2月,GoogleResearch的研究人员提出了一个时序预测基础模型TimesFM,在1000亿个「真实世界时间点」上进行预训练,仅仅用200M的参数规模就展现出了超强的零样本学习能力。论文链接:​​https:arxiv.orgpdf2310.10688.pdf​​当时权重还没有发布,就已经有人在Reddit社区中表达了难以克制的兴奋。5月8日,这篇研究又掀起了一阵波澜。官方博客宣布这篇文章被ICML2024接收,而且在GitHub和HuggingFace上公开了源代码和模型权重...
2024-06-11 12:48:38 293浏览 0点赞 0回复 0收藏
获得成就
已积累 8679 人气
获得 0 个点赞
获得 1 次收藏