duhorse
LV.6
这个用户很懒,还没有个人简介
声望 1052
关注 0
粉丝 1
私信
主帖 106
回帖
近年来,随着文本属性图(TAG)在社交媒体、电子商务、推荐系统和学术引用网络等领域的广泛应用,研究人员对如何有效地从这些复杂数据结构中学习变得越来越感兴趣。TAG不仅包含了节点之间的结构关系,还包含了节点本身的文本特征,因此如何同时处理这两种信息成为研究中的一个核心问题。当前,图神经网络(GNN)在TAG学习中得到了广泛的应用,然而其训练过程通常需要大量的人工标注数据,这在实际应用中往往难以获取。大语言模...
2024-08-23 16:08:35 262浏览 0点赞 0回复 0收藏
全球玩家鏖战《黑神话·悟空》!已经有打通关的玩家了,我不羡慕,因为通关后的空虚寂寞马上就会找上你们。开启二周目、三周目的同时,网上已有人用AI让这个神话永不落幕,打开某书就发现网友已经玩得不亦乐乎。让我们的超级英雄去大战西方异形怪物——甚至有人已经提前展望《黑神话》系列的下一部了,看出取景地是祖国大好河山的哪里了吗?更有「慈母」网友让其爱子直接穿越到《黑神话》里,一跃成精——这些都可以通过AI实现...
2024-08-23 16:01:33 325浏览 1点赞 0回复 0收藏
曾经在AI图像生成领域无可匹敌的领导者Midjourney,终于听劝了,上周五推出了网页版图像编辑器。新编辑器巧妙集成了重绘、缩放等核心功能。不仅提高了操作效率,而且使整体交互逻辑更加清晰,对于高频使用Midjourney的用户来说,绝对欣喜!今天,Midjourney宣布,将升级后的新工具向所有人免费开放试用。不论是产品更新,还是发放限时免费试用券,Midjourney似乎都传递出了一种紧迫感——新兴的Flux1强势崛起,表现异常出色;最...
2024-08-23 08:59:44 316浏览 0点赞 0回复 0收藏
最近,提升多模态大模型处理高分辨率图像的能力越来越引起这个领域的关注。绝大多数方法致力于通过对图像进行切分再融合的策略,来提升多模态大模型对图像细节的理解能力。然而,由于对图像的切分操作,不可避免会对目标、联通区域带来割裂,导致MLMMs对于微小或形状不规则的目标的辨识能力。这个现象在文档理解任务中,表现极为明显,由于文字端经常被中断。针对这一挑战,华中科技大学和华南理工大学最近联合发布一个多模态大...
2024-08-13 10:44:42 344浏览 0点赞 0回复 0收藏
​​最近Flux的爆火,简直把所有人的三观都撼动了。​​不懂就问:现在网上的东西,还有什么是真的?Flux震惊全网如今,开源文生图模型Flux,俨然已经在全网掀起了一股风暴。下面这些合影,竟然全是AI生成的?简直把这位博主震惊到怀疑人生。正面特写大光圈,脸部打光、肌肉纹理、毛发,看不出丝毫破绽。注意,即使是背景板人物们,也很自然,挑不出太大毛病。镜头远一点,光线暗一点呢?也很自然。两个人物在光线明暗处的对比...
2024-08-13 09:32:53 445浏览 0点赞 0回复 0收藏
训练一个扩散模型要多少钱?之前最便宜的方法(Wuerstchen)用了28400美元,而像StableDiffusion这样的模型还要再贵一个数量级。大模型时代,一般人根本玩不起。想要各种文生小姐姐,还得靠厂商们负重前行为了降低这庞大的开销,研究者们尝试了各种方案。比如,原始的扩散模型从噪声到图像大约需要1000步,目前已经被减少到20步左右,甚至更少。当扩散模型中的基础模块逐渐由Unet(CNN)替换为DiT(Transformer)之后,一些根据...
2024-08-12 13:59:56 343浏览 0点赞 0回复 0收藏
过去的一周,OpenAI「草莓」项目被炒的热火朝天,把所有人情绪推向了兴奋最高点。在X上,爆料人iruletheworldmo每隔几小时发一次帖,次次几乎与「草莓」相关,甚至暗示这周二就是OpenAI实现第二级AGI的日子。他自称已获得内部消息,并表示全新的GPT4olarge模型将8月13日正式发布。OpenAI草莓项目真正露面还不知哪天,不过,劲敌PerplexityAI已展示了具备「草莓」能力的新模型。或者说,Q已经在PerplexityPro上实现了。今早,CEO...
2024-08-12 13:54:13 249浏览 0点赞 0回复 0收藏
昨天,AndrejKarpathy又发了长推,不过用了一句很有争议的话开头——「RLHF只是勉强的RL」。这条推特可谓「一石激起千层浪」,瞬间点燃了LLM社区的讨论热情。毕竟RLHF作为刚提出没几年的方法,又新颖又有争议。一边遭受质疑,一边又在工业界和学界迅速流行。5G冲浪的LeCun也赶来声援Karpathy,但他的话很短,只有一句——「RLHF不是真正的RL」。RLHF最早可以追溯到OpenAI安全团队2017年发表的论文:论文地址:https:arxiv.orgab...
2024-08-09 13:17:59 248浏览 0点赞 0回复 0收藏
昨天奥特曼率众人搞了一波「草莓暗示」的大阵仗,全网都在翘首以盼OpenAI的惊天大动作。结果今天大家等来的,只是一份安全报告而已……​​今年5月,GPT4o演示一出,立马技惊四座​​。然而,它却一鸽再鸽,等得用户们心都凉了。GPT4o语音功能,为何迟迟不上线?刚刚OpenAI发布的这份红队报告,给我们揭开了谜底——不够安全。在红队测试中,GPT4o的行为怪异,把OpenAI的研究者吓了一大跳。明明是一男一女在对话,GPTo的男声说...
2024-08-09 13:14:18 467浏览 0点赞 0回复 0收藏
7月26日,智谱发布AI生视频产品「清影」,30秒将任意文图生成视频,并上线在他们的AI助手「智谱清言」上,被誉为是国内首个人人可用的Sora。就在发布6天后,「清影」生成到视频数便已突破了百万量级。今天,智谱AI宣布将与「清影」同源的视频生成模型——CogVideoX正式开源。团队表示,希望每一位开发者、每一家企业都能自由地开发属于自己的视频生成模型,从而推动整个行业的快速迭代与创新发展。打开AI助手「智谱清言」即可体...
2024-08-07 09:35:53 376浏览 0点赞 0回复 0收藏
号称OpenAI二代机器人「Figure02」,真的来了!刚刚,FigureAI终于官宣了第二代人形机器人,完全换了一身新形象——黑色的外观,更加灵活的五指。创始人BrettAdcock表示,「这是『地表最强』的人形机器人」!值得一提的是,Figure02的设计评审耗时18个月完成。据介绍,迭代后的Figure手部具有16个自由度,能够承受与人类相当的力量。现在的它,已经进入宝马车厂开始打工了,可以无休止地狂干20个小时。Figure02还可以与人类直接...
2024-08-07 09:31:40 427浏览 0点赞 0回复 0收藏
大语言模型都卷起来了,模型越做越大,token越来越多,输出越来越长。那么问题来了,如何有效地评估大语言模型的长篇大论呢?要是输出长度长了但胡言乱语输出质量差,又臭又长,岂不是白搭首先能想到的方法就是人工评估。人工评估虽然对于评价模型性能至关重要,但受到主观性、评估者之间的差异性以及广泛评估的高成本的限制。考虑到这些因素,谷歌DeepMind研究团队提出了自动评估解决方案FLAMe。论文地址:https:arxiv.orgabs2...
2024-08-02 13:28:31 366浏览 0点赞 0回复 0收藏
Midjourney几个月前画的饼终于端上来了!他们今天刚刚发布了最新版本v6.1!此次更新总结四个大字:细节狂魔。网友纷纷发推测试最新版本的Midjourney,摄影级画面先睹为快!这张图被取名为《天窗》,构图、色彩、光影、明暗,各方面都极度舒适,湖面波光粼粼细节生动,简直可以直接用来做屏保。继续看一幅风景,曙光拨开云层,远处群山连绵,积雪未消;植被茂密,松树纹理逼真,一片静谧祥和。接着看一组静物,原本需要大量人力...
2024-08-02 13:24:19 403浏览 0点赞 0回复 0收藏
斯坦福炒虾机器人作者,又出新作了。这次,机器人不是给我们炒饭了,而是给我们做外科手术!最近,约翰霍普金斯和斯坦福大学的研究者们,进行了一项新的探索——著名的医疗机器人达芬奇,是否可以通过模仿学习,来学习外科手术的操作任务呢?经过实验后,他们成功了!组织操作、针头处理和打结这三项基本的手术任务,达芬奇都可以自己独立完成了。首先是需要医学生苦练指法的缝合打结技术,只见达芬奇「飞针走线」,很熟练地就...
2024-07-31 13:42:05 347浏览 0点赞 0回复 0收藏
大数字一向吸引眼球。千亿参数、万卡集群,——还有各大厂商一直在卷的超长上下文。从一开始的几K几十K,发展到了如今的百万token级别。Gemini的最新版本可以接收200万个token作为上下文。这大概相当于140万个单词、2小时视频或者22小时的音频。但不知诸位平时用得着这么长的上下文吗?毕竟100K已经相当于一部比较长的小说了。更重要的是,LLM真的能在这个长度上进行推理吗?近日,有两篇独立研究分别表明:长上下文水分很大!L...
2024-07-23 13:24:34 457浏览 0点赞 0回复 0收藏
历史再次重演,Llama3.1405B提前泄露了!现在,基准测试和磁力链已经传得满天飞了。除了最大的405B,Meta这次还升级了5月初发布的8B和70B模型,并将上下文长度全部提升到了128K。至此,模型版本也正式从Llama3迭代到了Llama3.1。根据磁力链提供的信息,新模型大小为763.48GiB(约820GB)。从泄露的「基准测试」可以看出,连8B小模型都很能打,而70B的模型,性能在多项基准上都能赶超GPT4o了。开发者们看到测试结果后也原地炸锅...
2024-07-23 13:19:31 535浏览 0点赞 0回复 0收藏
人类和动物能够轻松灵活地移动,这是一种进化奇迹,目前还没有任何机器人能够完全模仿这种能力。如何能让机器人变得更加敏捷?科学家为了解决这个问题,选择从动物身上寻找答案,又开始用小白鼠做起了实验——毕竟成年老鼠的智力与8岁儿童相当,而且它们四肢相当灵活,对自己的身体有着精妙的控制能力。如果能通过老鼠破解大脑控制运动的密码,建立一个将控制原理与行为动物的神经活动结构联系起来的模型,那就再好不过了。《献...
2024-07-08 13:27:23 596浏览 0点赞 0回复 0收藏
有了ChatGPT,还需要人类程序猿编码吗?上个月,一项发表在IEEETSE期刊(TransactionsonSoftwareEngineering)上的研究评估了ChatGPT所生成的代码在功能性、复杂性和安全性方面的表现。结果显示,ChatGPT生成可用代码的能力差异很大。其成功率从0.66%到89%不等,这主要取决于任务的难度、编程语言等多种因素。论文地址:https:ieeexplore.ieee.orgdocument10507163具体来说,研究人员测试了GPT3.5在5种编程语言(C、C++、Java、...
2024-07-08 13:23:50 475浏览 0点赞 0回复 0收藏
大规模语言模型(LLMs)的持续预训练是提升其在特定领域性能的重要方法。通过在新领域的语料库上预训练大语言模型,这一过程能够显著增加模型的领域知识储备和任务能力。然而,尽管已有许多研究探讨了从头预训练的LLMs的学习机制和性质,关于持续预训练过程中LLMs行为的研究却相对较少。最近北京大学、香港科技大学等开源了一个8B医学大模型,通过测试模型在连续预训练和指令微调实验过程中的表现变化,发现了许多有趣的现象。...
2024-07-02 09:34:04 453浏览 0点赞 0回复 0收藏
美国计算机科学家和技术乐观主义者雷·库兹韦尔(RayKurzweil)是人工智能领域久负盛名的权威。他在2005年出版的畅销书《奇点临近》(TheSingularityIsNear)以科幻般的预测引发了人们的无尽遐想:计算机将在2029年达到人类水平的智能,而我们将在2045年左右与计算机融合,成为超人,他将此称为「奇点」。如今,将近20年过去了,76岁的库兹韦尔推出了续集《奇点更近了》(TheSingularityIsNearer)。在新作中,库兹韦尔提出了5...
2024-07-02 09:31:21 471浏览 0点赞 0回复 0收藏
获得成就
已积累 1.6w 人气
获得 1 个点赞
获得 1 次收藏