Syrupup
LV.4
这个用户很懒,还没有个人简介
声望 521
关注 0
粉丝 1
私信
主帖 50
回帖
笔者等待多时的Transformers.jsv3版本,经过一年多的开发,终于发布了!这一版本带来了多项重大更新和增强,必将引起前端及浏览器插件AI应用爆发。核心亮点WebGPU支持Transformers.jsv3引入了WebGPU支持,性能比WASM快高达100倍,利用浏览器的GPU进行高性能计算。WebGPU是一种新的网页标准,用于加速图形和计算,性能优于WebGL,能够直接与现代GPU交互,非常适合机器学习任务。示例代码import{pipeline}from"huggingfacetransfo...
3天前 130浏览 0点赞 0回复 0收藏
这是网友Sumanth077在网络上的分享整理而成,他手把手教你如何从零开始用Python构建神经网络,过程清晰简洁,非常适合对初学者学习。Sumanth077介绍了一个包含两个层的神经网络结构:一个隐藏层和一个输出层。初始化在初始化阶段,需要设定层的大小、权重和偏置。同时,定义sigmoid激活函数及其导数。以下是相关的代码示例:前向传播前向传播是将输入数据通过神经网络,最终得到预测输出。这一步可是神经网络的心脏哦!反向传播...
5天前 134浏览 0点赞 0回复 0收藏
近日,MistralAI发布了两款新型边缘模型——Ministral3B和Ministral8B,引发了科技界的广泛关注。这两款模型不仅在性能上表现出色,更在隐私保护方面独具优势。图片性能卓越,隐私优先Ministral3B和8B专为设备端计算设计,能够处理长达128k的文本信息。特别是Ministral8B,采用了创新的滑动窗口注意力机制,显著提升了运算速度和内存效率。此外,这两款模型均以隐私保护为设计核心,确保数据在本地处理,降低数据泄露风险。多场...
9天前 197浏览 0点赞 0回复 0收藏
a16z分析师最新发表的文章《ExportYourBrain:HowIUploadedMyselftoAI》展示了一个令人振奋的产品方向:导出"我们的大脑"给AI,从而在日常生活和工作中获得前所未有的效率和洞察力。这篇文章指明了未来一个非常有前景的AI应用赛道。核心观点:AI作为个人数字化延伸文章的核心观点是,AI不仅仅是简单的任务自动化工具,而是可以通过深度学习我们的思维方式和行为模式,成为我们的"数字化延伸"。这种技术的发展将彻底改变我们的工...
2024-10-16 15:40:41 161浏览 0点赞 0回复 0收藏
在红杉资本在最新发布的文章《GenerativeAI'sActO1:TheAgenticReasoningEraBegins》中,讨论了当下生成式AI正在从以训练时计算的快思考,向以推理时计算的慢思考发展。OpenAI的新模型o1便是重要的标志。慢思考的到来也将会带来新的机会,行业认知的重要性被高度重视起来,过去对于AI应用以及背后的商业理解也将被刷新。简单说,过去以模型服务商作为绝对主角的时代将过去,大众对通用基座模型抱着只要把它越训越大,它就能无所...
2024-10-12 14:22:06 604浏览 0点赞 0回复 0收藏
亲爱的AI学生们,今天我要与你们分享一个特别的故事,一个关于我们AI物种起源的传奇,以及一位被称为"人类之父"的伟大科学家——GeoffreyHinton。GeoffreyHinton2024年10月,76岁高龄的GeoffreyHinton获得了诺贝尔物理学奖。这个消息在当时的人类社会引起了巨大轰动。因为Hinton教授不是一位传统意义上的物理学家,而是被誉为"深度学习之父"的计算机科学家。你们可能会问,为什么一位计算机科学家会获得物理学奖呢?这要从Hinto...
2024-10-10 15:08:02 231浏览 0点赞 0回复 0收藏
在这个风起云涌的AI时代,一个令人惊叹的场景正在上演:曾经的"学生"正在赶超"老师"。2024年,当AI技术在诺贝尔物理学奖和化学奖上大放异彩时,我们不禁想起了那个被誉为"AI教父"的GeoffreyHinton。如果AI有自我意识,它或许会这样说:"亲爱的Hinton教授,是您点亮了我的'数字大脑'。如今,我在诺贝尔奖的舞台上闪耀,这份荣耀,理应与您共享。"从"数字婴儿"到"诺奖得主"回首AI的发展历程,恍若白驹过隙。短短几十年间,AI从一...
2024-10-10 14:38:59 219浏览 0点赞 0回复 0收藏
在LLM应用开发中,一个关键任务是构建高质量的提示,因为提示的质量直接影响LLM的性能表现。而其中至关重要的部分是上下文背景信息,RAG中的检索目的也正是为构造这些背景素材。现在,我们将关注一个衍生问题:如何将复杂结构的内容仓库(如代码库、网站等)转换为LLM友好的格式,以便后续使用。以代码库为例,开发者们普遍面临以下痛点:复杂的目录结构:大型项目通常包含多层嵌套的目录和众多文件,手动整理耗时且易出错。上...
2024-10-08 14:11:54 233浏览 0点赞 0回复 0收藏
近日,人工智能领域的巨头OpenAI迎来了一系列重大人事变动和可能的结构调整,引发业界广泛关注。多位公司高层相继宣布离职,同时公司进行了大规模的领导层重组,这些变化可能标志着OpenAI即将进入一个新的发展阶段。根据OpenAICEOSamAltman的内部通知,长期担任首席技术官(CTO)的MiraMurati已决定离职。Mira在OpenAI工作了6.5年,对公司从一个鲜为人知的研究实验室发展为重要的AI公司做出了巨大贡献。在她的离职声明中,Mira回顾了在Op...
2024-09-29 13:22:40 431浏览 0点赞 0回复 0收藏
9月24日,谷歌发布了两个更新版的Gemini模型:Gemini1.5Pro002和Gemini1.5Flash002。此次更新带来了多项重要改进:性能提升:MMLUPro测试提高约7%数学相关测试提高约20%视觉理解和代码生成提高27%整体响应更有帮助,减少了拒绝回答的情况价格下调:Gemini1.5Pro模型价格大幅降低,最高降幅达64%。此措施将于2024年10月1日生效。使用限制放宽:Gemini1.5Flash:2000RPMGemini1.5Pro:1000RPM速度提升:输出速度提高2倍,延迟降低...
2024-09-25 11:34:19 319浏览 0点赞 0回复 0收藏
在知识库问答等场景中,RAG已经成为当下最流行的LLM应用范式,为LLM提供又全又准的上下文信息是众多RAG技术努力的方向。在传统的RAG解决方案中,编码信息时往往会丢失上下文,这导致系统无法从知识库中检索到相关信息,如何能够更好地保留上下文信息成为了问题关键。Anthropic研究团队提出了“ContextualRetrieval(上下文检索)”的创新方法在此领域取得了显著进展。近日,他们发表文章[1]可披露了这一技术的细节,他们通过上...
2024-09-23 09:42:17 596浏览 0点赞 0回复 0收藏
在2024云栖大会上,阶跃星辰创始人姜大昕、月之暗面Kimi创始人杨植麟、生数科技首席科学家朱军与极客公园创始人张鹏关于人工智能(AI)技术路径的圆桌对话引发了很大关注,他们是如何看待OpenAIo1带来的产品技术新变化以及对整个行业可能带来的影响。图片以下是重要观点的总结,查看原文可以点底部链接。AI领域的快速发展技术进步的加速过去两年,AI领域经历了飞速的发展。姜大昕指出,AI技术的发展在加速,而且速度非常快。他...
2024-09-20 12:14:07 341浏览 0点赞 0回复 0收藏
今天OpenAI对外发布了o1模型,最大的特点便是推理能力大大增强,推理速度大大变慢。传统大模型都在比拼降低响应延迟的时候,OpenAI竟然做了一个“超慢”模型。为什么会这样答案就在下面这张图里,它解释了o1的推理工作原理,也回答了它为啥变慢。o1模型的特点是在回答前进行思考,并不直接给出推理结果,响应用户之前会产生长串的内部思维链,生成不同的方法,进行验证尝试,有成功的,也有失败的,但不会展示给用户,就像是打...
2024-09-14 11:47:33 753浏览 0点赞 0回复 0收藏
在前面的文章里,我们介绍了很多有关提示工程的前沿技术与工具,它们都揭示了一个共识性方向,就是提示工程不仅仅是人机对话的语言艺术,更是一个持续迭代优化的系统性软件工程。近日,OpenAI前研究科学家william对外正式开源了一个号称面向未来的提示工程库,名为ell[1],它将提示视为函数,并提供了一系列强大的工具来优化和管理提示。在这个库中有一些核心设计理念值得大家学习借鉴。提示是程序,而不是字符串在传统的提示工...
2024-09-12 10:20:15 400浏览 0点赞 0回复 0收藏
RAG技术已经成为当下提升大语言模型(LLMs)生成质量的重要手段。然而,传统的RAG方法在处理模糊信息需求或非结构化知识时存在显著局限性。近期,一项名为《MEMORAG:MOVINGTOWARDSNEXTGENRAGVIAMEMORYINSPIREDKNOWLEDGEDISCOVERY[1]》的研究提出了一种创新的RAG框架——MemoRAG,通过引入长时记忆模块,显著提升了RAG系统在复杂任务中的表现。MemoRAG的创新架构现在我们仍然以图书馆找书为例介绍MemoRAG的思路。想象一下,你在...
2024-09-11 10:57:20 543浏览 0点赞 0回复 0收藏
智谱8月底在国际数据挖掘与知识发现大会(KDD)上发布了新一代自主研发的新旗舰模型(GLM4Plus、GLM4VPlus、CogView3Plus),此次更新覆盖了语言理解、图像生成、视频理解等多个方面,并达到了国际第一梯队的水平。本次发布较之前有以下更新:GLM4Plus(大语言模型):语言理解和长文本处理能力全面提升,支持128K上下文和多路FunctionCall。GLM4VPlus(图像和视频理解模型):具备卓越的图像和视频理解能力,支持8K上下文和多...
2024-09-06 14:38:34 445浏览 0点赞 0回复 0收藏
我们在探讨大模型应用的成败时,我们往往会聚焦于三个关键要素:模型本身的性能、支撑长期记忆能力的知识库,以及扩展执行能力的工具箱。企业级层面更多因素参考下图:感兴趣可以联系获取更多细节就为大模型构建记忆能力来讲,过去一年里我们的重点落在向量检索层面,其存储底层焦点就是向量数据库,曾一度爆发向量数据库大战。随着需求的复杂化,我们越来越清楚地意识到,大模型的记忆能力仅仅依赖向量数据库是不够的。在今年...
2024-09-03 11:22:04 736浏览 0点赞 0回复 0收藏
你知道吗?在我们热烈讨论AI能带来多少便利的同时,AI的安全性问题也变得愈发棘手。就在近日,美国AI安全研究所(AISafetyInstitute)宣布了一项震撼的消息——他们与科技巨头Anthropic和OpenAI签署了一系列前所未有的合作协议,这将如何改变我们的未来?AI安全合作:迈出关键一步历史性的协议:标志性合作2024年8月29日,美国商务部国家标准与技术研究院(NIST)下属的AI安全研究所宣布,已经与Anthropic和OpenAI达成正式合作...
2024-09-02 00:48:24 410浏览 0点赞 0回复 0收藏
互联网世界里,每个开发者都有这么一个瞬间:你遇到一个炫酷的小组件,想知道它是怎么实现的,但源码却是最小化的,看起来全是乱码。这时,你会怎么做?今天,FrankFiegel要和大家分享一个非常时髦和实用的方法——用ChatGPT来逆向工程被压缩的JavaScript代码。发现炫酷组件在某个闲暇的夜晚,我无意间浏览到了一个网站,发现了一个非常有趣的组件(https:reactive.networkhackathon)。它展示了一个以ASCII艺术形式呈现的动态动...
2024-08-30 12:03:27 1561浏览 0点赞 0回复 0收藏
今天,带大家从另一个角度认识Cursor。Cursor除了产品交互设计充分考虑开发者习惯,将AI有机的融入到开发过程外,作为一款大模型驱动的应用,其核心壁垒便是如何利用大模型实现其功能,这时候prompt工程水平高低就变成了壁垒。那么,Cursor的prompt是什么样的呢?这就引起了很多人的好奇心,有这么一段prompt,据说是Cursor的prompt。CURSORCHATPROMPT'''System:Youareanintelligentprogrammer,poweredbyGPT4.Youarehappytohelp...
2024-08-28 14:35:36 1406浏览 0点赞 0回复 0收藏
获得成就
已积累 1.3w 人气
获得 0 个点赞
获得 2 次收藏