公众号矩阵

移动端

视频课免费课排行榜短视频直播课软考学堂

全部课程软考信创认证华为认证厂商认证 IT技术 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

lintoms

LV.2

这个用户很懒，还没有个人简介

帖子 22

声望 187

关注 0

粉丝 0

社区头条作者

私信

关注

主帖 22

回帖

大型语言模型（LLMs）如何能够从长达数十年的符号 AI 项目中受益

将大型语言模型（LLMs）应用于实际应用的主要障碍之一是它们的不可预测性、缺乏推理能力和难以解释性。如果无法解决这些挑战，LLMs将无法成为在关键环境中可信赖的工具。在最近的一篇论文中，认知科学家GaryMarcus和人工智能先驱DouglasLenat深入探讨了这些挑战，他们将这些挑战归纳为了确保通用人工智能的16个愿望清单。TechTalks的创始人BenDickson将其整理发表了一篇名为"HowLLMscouldbenefitfromadecades’longsymbolicAIpr...

2025-02-28 13:23:42 2128浏览 0点赞 0回复 0收藏

Deepseek AI模型本地部署步骤简记：ollama + deepseek-r1 + 本地AI模型的Web UI

deepseek官网经常提示“服务器繁忙，请稍后再试。”，于是想自己实现本地部署。但是由于个人电脑太菜，只能尝试一下步骤，记录一下，后面等有强悍的服务器或者模型进一步优化才能私人真正独立的使用与生产。总体方案：ollama+deepseekr1+本地AI模型的WebUI第一步：ollama网站下载ollama（Ollama是一个用于管理和运行本地AI模型的软件工具。它提供了一种简化的方式来下载、管理和在本地计算机上运行各种AI模型，而无需依赖云计算...

2025-02-13 12:43:51 3750浏览 0点赞 0回复 0收藏

强化学习与大模型后训练：DeepSeek R1 如何获得推理能力？

精华

DeepSeek正在通过其开源模型DeepSeekR1革新AI产业，尽管资源有限，却能媲美OpenAI的能力。通过让前沿大模型更广泛地开放，DeepSeek推动了全球的创新与合作。其创新的基于强化学习（RL）的后训练技术可增强大模型的推理能力和对齐性，使大模型在实际应用中更加高效且易用。在本文中，我们将重点分析DeepSeekR1推理模型背后的关键RL后训练技术。本文由MoPaaS的创始人鲁为民博士最初以英文的形式发表（点击文章末尾“阅读原文”）...

2025-02-13 12:31:17 5526浏览 0点赞 0回复 0收藏

解释生成式人工智能

快速浏览一下头条新闻就会发现，如今生成人工智能似乎无处不在。事实上，其中一些标题实际上可能是由生成人工智能（如OpenAI的ChatGPT）撰写的，这是一个聊天机器人，展示了一种近乎人类写作的不可思议的能力。但当人们说“生成人工智能”时，他们真正指的是什么呢？在过去几年生成人工智能的兴起之前，当人们谈论人工智能时，通常是在谈论能够根据数据进行预测的机器学习模型。例如，这些模型通过数百万个示例进行训练，以预测...

2024-12-23 09:47:15 2480浏览 0点赞 0回复 0收藏

Suno AI v4：音乐创作人的饭碗正逐渐被提示词所取代

近日，AI音乐生成平台Suno正式发布了其第四代模型——Sunov4。本次升级在音质、歌词精准度和歌曲结构等方面都有显著提升，标志着AI音乐创作迈入了一个新的篇章。Sunov4利用深度学习技术，基于大量音乐数据进行训练，生成更加自然、丰富的音乐作品。与之前的版本相比，v4提供了更清晰的音频、更锐利的歌词以及更具动感的作品。此外，新模型能够生成多种风格的音乐，满足不同听众的需求，提供丰富多样的曲风。相比之下，Sunov3虽...

2024-11-25 16:35:19 3642浏览 0点赞 0回复 0收藏

GPT-4和GPT-4V能否像人类一样进行抽象推理

有关类似GPT4这样的大型语言模型（LLM）是否真正模拟人类逻辑和推理的辩论正在进行中。一些研究人员认为，随着规模的扩大，LLM可能会发展出对抽象推理、模式识别和类比制作的新能力。另一方面，一些人认为促使这些能力的内部机制尚未被解释清楚。一些实验证明，这些模型在其训练数据范围之外难以推广。"在创建和推理抽象表示方面的能力对于强大的泛化至关重要，因此有必要了解LLM在这方面已经取得了多大的能力，"圣塔菲研究所的...

2024-11-25 16:24:54 2677浏览 0点赞 0回复 0收藏

游戏中的生成式 AI 革命

AI改变游戏，这项工作的变革性不仅在于它节省了时间和金钱，同时也提供了质量——从而打破了经典的“成本、质量或速度只能有两个”的三角关系。艺术家们现在只需要几个小时就可以创作出高质量的图像，否则手工生成这些图像需要数周时间，真正具有变革性的是：任何人只要能学习一些简单的工具，就可以获得这种创造力；这些工具可以以高度迭代的方式创建无限数量的变化；一旦训练完毕，该过程是实时的——几乎可以立即获得结果。...

2024-11-12 15:27:09 3128浏览 0点赞 0回复 0收藏

LLMs的基本组成：向量、Tokens和嵌入

了解向量、Tokens和嵌入是理解大语言模型怎样处理语言的基础。在处理LLMs时，你经常会遇到“向量”、“Tokens”和“嵌入”这些术语。在深入研究构建聊天机器人和人工智能助手之前，彻底理解这些概念非常重要。随着多模态方法日益普及，这些术语不仅仅适用于大型语言模型（LLMs），还可用于解释图像和视频。本教程的目标是通过简单直接的示例和代码片段向你介绍这些核心概念。向量：机器的语言向量在LLMs和生成式人工智能的运作...

2024-09-04 12:09:25 2969浏览 0点赞 0回复 0收藏

解析Llama 3.1 与Meta 的 AI 战略，以及新的开放前沿模型生态系统

今天，Meta发布了Llama3.1模型，延续了他们从最初的Llama3“预览版”开始就践行的开源理念，即尽早发布和频繁发布。Llama3.1模型有三种规模：8B、70B和长期传闻中的405B参数。对于其规模来说，这些模型是同类中最优秀的开源模型。4050亿参数模型直接与Anthropic的Claude3和OpenAI的GPT4o处于同一水平。Llama3.1的营销以及Meta的AI战略正在直接推动将开源软件实践转化为开源AI。这次发布的核心和AI的未来是AI能有多“开源”，以...

2024-07-29 00:04:21 3103浏览 0点赞 0回复 0收藏

视觉语言模型能够“看见”吗？

来自奥本大学和阿尔伯塔大学的研究人员发现，最先进的具有视觉能力的大型语言模型（VLMs）在理解涉及基本几何形状的空间信息方面表现得非常糟糕，例如判断两个圆是否重叠。他们提出了一个名为BlindTest的新基准测试，包括7项简单任务，这些任务在互联网上自然语言中不太可能有现成答案，以测试VLM像人类一样“看见”图像的能力。现有的VLM基准（如MMMU和ChartQA）涵盖了广泛的主题，但输入图像并非总是回答问题所必需的，即答案...

2024-07-22 09:48:06 2947浏览 0点赞 0回复 0收藏

AI工程中面临的开放挑战

我昨天在AI工程师世界博览会上发表了开幕主题演讲。我是临时加入议程的：OpenAI在最后一刻退出了他们的演讲，我受邀在不到24小时的通知时间内准备一个20分钟的演讲！我决定重点讲述自8个月前上次AI工程师峰会以来LLM（大语言模型）领域的亮点，并讨论该领域的一些未解决的挑战——这是我在早些时候的活动中提出的关于AI工程的开放问题演讲的回应。在过去的8个月里，发生了很多事情。最值得注意的是，GPT4不再是该领域无可争议的...

2024-07-18 09:37:14 2924浏览 0点赞 0回复 0收藏

使用“反事实任务”评估大型语言模型

LLMs的智能本质是什么？在之前的文章中，我谈到了评估大型语言模型能力的困难。这些模型在许多基准测试中表现出色，但我们通常不知道基准测试中的测试项目，或足够相似的项目，是否出现在训练数据中。这些模型是在进行一般性的理解和推理，还是在进行AI研究员SubbaraoKambhampati所说的“近似检索”——依赖于模型训练数据中包含的文本模式？反事实任务范式反事实任务范式可以帮助回答这个问题。在这个范式中，模型在成对的任...

2024-07-09 10:34:11 4002浏览 0点赞 0回复 0收藏

OpenAI联合创始人John Schulman：OpenAI 大模型史，RLHF，AGI 2027 ...

随着前不久IlyaSutskever从OpenAI的离职，OpenAI首席架构师和著名强化学习(ReinforcementLearning,或RL)专家JohnSchulman博士成为OpenAI现存最主要具有技术背景的创始人。最近，Schulman博士接受了著名的科技播客主持人DwarkeshPatel的专访。他解密了OpenAI大模型发展史，介绍了OpenAI怎样训练和产品化大模型，尤其是后训练阶段如何通过RL提升大模型的泛化能力和实用性。Schulman分享了他对大模型伸缩律（ScalingLaw)，大模型...

2024-06-05 13:37:02 4279浏览 0点赞 0回复 0收藏

剖析特定领域大模型

随着人工智能技术的不断发展，大型语言模型成为人们关注的焦点之一。通用语言模型如GPT3在各种语言处理任务上展现了强大的能力，但随着对特定领域需求的增加，领域特定的大型语言模型应运而生。这些模型通过在专业的领域内进行深入训练或精调，提供了有针对性精准定制的解决方案。在《WhataredomainspecificLLMs》“什么是特定领域的LLMs”一文中，作者探讨了大型语言模型的基本概念，并聚焦于领域特定的大型语言模型。他指出随...

2024-05-29 12:11:17 3281浏览 0点赞 0回复 0收藏

大模型的提示工程：提示是对程序的搜索

精华

Google研究员FrançoisChollet是一位在机器学习和深度学习领域具有重要影响力的一线工程师。他以创建流行的开源机器学习库Keras而闻名,同时也是流行的机器学习实战书籍《DeepLearningwithPython(使用Python来深度学习)》的作者。不久前他发表博文：“HowIthinkaboutLLMpromptengineering（大模型的提示工程之我见）”，深入地探讨了大模型提示工程。Chollet从语言模型架构、学习机制和能力的演进来理解大模型的提示工程。他特别...

2024-05-27 14:07:28 3427浏览 0点赞 0回复 0收藏

大模型开始进入收益递减的时代？

目前人们好像已在接受这样的观点：“大语言模型(LLMs)正在以指数速度进步。”就在几天前，宾州大学沃登商学院（TheWhartonSchool)的EthanMollick教授在一篇广受关注的博客文章中声称，“目前对LLMs的能力评估显示，LLM的能力每5到14个月翻一番”。实际上Mollick教授引用的研究并未显示他所声称的内容。如果你仔细阅读，它没有提到能力的提高。它显示的是模型在达到给定性能水平所需的计算资源变得更有效率，“达到给定性能水平...

2024-05-21 13:47:20 3172浏览 0点赞 0回复 0收藏

忘掉 ChatBots，智能体 (AI Agents) 将是未来

随着AIAgents技术的不断发展和成熟，我们可以期待在未来看到更多令人兴奋的创新和应用。这些技术有望成为推动人类进步和提高生活质量的重要工具。本周，一家名为CognitionAI的初创公司引起了轰动，他们发布了一个演示，展示了一个名为Devin的人工智能程序执行通常由高薪软件工程师完成的工作。像ChatGPT和Gemini这样的聊天机器人可以生成代码，但Devin更进一步，规划解决问题的方法，编写代码，然后测试和实施。Devin的创建者将...

2024-05-15 12:24:18 3321浏览 0点赞 0回复 0收藏

Sergey Levine教授解读机器人AI的演进

“想象一下，有一天我们能够打造出一个在厨房里执行各种任务的家庭机器人。那么问题就不仅仅是感知了。你真的需要学会各种个人操纵技能，以便能够广泛地泛化。”——SergeyCraig:嗨，我是CraigSmith，欢迎收听《AI视界》。今天我和SergeyLevine进行了交谈，他是加州大学伯克利分校的副教授，在该校的机器人人工智能与学习实验室从事研究，并推动着AI控制机器人的边界。Sergey谈到了他最近在强化学习和从世界各地的机器人中...

2024-05-11 11:01:19 3558浏览 0点赞 0回复 0收藏

Sora的狂欢、世界模型和AGI

Sora是OpenAI发布的一款视频生成模型，采用了DiffusionTransformer架构，旨在实现高保真度和视频图像的前后一致性。其突出之处在于能够生成逼真流畅的视频内容，令人惊叹不已。Sora一经推出便在极短的时间内迅速引起了科技界和社会各界的关注，同时也引发了关于AI技术发展和产业变革的激烈讨论，日前，MoPaaS魔泊云创始人和CEO鲁为民博士参与腾讯科技举办的：与硅谷专家和创业者共同探讨：Sora的商业逻辑与技术创新分析直播活动...

2024-04-28 15:48:31 3131浏览 0点赞 0回复 0收藏

谷歌 DeepMind CEO Hassabis 畅谈 Gemini、Scalin Law、通用机器人、大模型开源、超级人工智能

OpenAI的Sora又一次出圈，掩盖其它新的AI产品的锋芒，包括几乎同期发布的Google的Gemini1.5和Meta的VJEPA。很多AI从业者为此大抱不平，声称“被Sora夺走风头的Gemini被低估了！”特别是Google这次推出的Gemini1.5Pro是一种多模态大模型（涉及文本、视频、音频），性能水平与谷歌迄今为止最大的模型1.0Ultra类似，并引入了长上下文理解方面的突破性实验特征。它能够稳定处理高达100万Tokens（相当于1小时的视频和超过3万行代码）...

2024-04-23 11:30:31 3227浏览 0点赞 0回复 0收藏

获得成就

已积累 1.6w 人气

获得 0 个点赞

获得 0 次收藏