51CTO内容精选
LV.10
官方
汇聚51CTO网站AIGC方向的优秀原创和译文内容
声望 5255
关注 0
粉丝 11
私信
主帖 349
回帖
本文旨在探讨如何在无服务器环境中部署实时机器学习模型,并应对其间涉及的延迟、成本与性能平衡挑战。机器学习(ML)在诸如欺诈检测和个性化推荐等实时应用中变得越来越重要。由于其可扩展性以及消除了基础设施管理的工作量,这些应用对于在无服务器计算中部署极具吸引力。然而,将机器学习模型部署到无服务器环境中面临着延迟、成本和性能方面的独特挑战。在本文中,我们将详细阐述这些问题,并提供相应的解决方案,以实现实...
10h前 145浏览 0点赞 0回复 0收藏
本文介绍了最流行的图像生成模型架构之一的技术层面。近年来,生成式AI模型已成为一颗冉冉升起的新星,尤其是随着ChatGPT等大语言模型(LLM)产品闪亮登场。这类模型使用人类能够理解的自然语言,可以处理输入,并提供合适的输出。由于ChatGPT等产品的出现,其他形式的生成式AI也变得流行并成为主流。由于能够完全借助自然语言输入生成图像,DALLE和Midjourney等产品在生成式AI热潮中大受欢迎。这些热门产品并非凭空生成图像,...
1天前 342浏览 0点赞 0回复 0收藏
本文介绍了GPT5与Gemini2.5Pro的巅峰对决,在文本内容、图像生成、互联网研究、编程四个方面对这两种人工智能模型进行比较。最终,GPT5在文本、图像生成、互联网研究对决中胜出,编程平局,以总体优势获胜,彰显其作为开创性聊天机器人的强大实力。人工智能领域正在迎来一场世纪级的巅峰对决。两款功能强大的人工智能模型将进行激烈较量,以角逐人工智能模型领域真正的冠军。一方是OpenAI公司的旗舰产品——GPT5,其技术成熟、...
2天前 794浏览 0点赞 0回复 0收藏
在人工智能技术飞速迭代的今天,大模型正以惊人的速度渗透到各行各业,从金融风控到医疗诊断,从智能制造到内容创作,通用人工智能的能力边界不断被拓展。随着技术的成熟,各行业不再满足于通用大模型的基础能力,而是开始将其与垂直领域深度融合,通过定制化开发解决行业痛点——运维领域同样迎来了这场智能化变革。在日常的IT运维工作中,Zabbix作为广泛使用的监控系统,时刻守护着服务器、网络设备和业务系统的稳定运行。当C...
3天前 1208浏览 0点赞 0回复 0收藏
本文将向你介绍OpenAI新发布的两个开源模型gptoss120b和gptoss20b,它们的特点,以及在何种场景下该使用哪个模型。​近期,OpenAI发布了两个开源的大语言模型(LLM)gptoss120b和gptoss20b。它们是自GPT2以来,由OpenAI第一个公开许可的LLM。其旨在创建最好、最先进的、供推理和工具使用的模型。通过开源gptoss,OpenAI允许人们在Apache2.0的范围内,自由地使用和适配。当然,这两种模式也考虑了专业个性化,以及定制到本地和上...
6天前 694浏览 0点赞 0回复 0收藏
本文介绍ColPali与DocLayNet结合的多模态RAG系统,通过视觉语言建模理解文档中的表格、图表等布局信息,显著提升复杂文档问答的准确性和上下文感知能力。简介检索增强生成(RAG)已成为构建开放领域和特定领域问答系统的标准范例。传统意义上,RAG流程严重依赖于基于文本的检索器,这些检索器使用密集或稀疏嵌入来索引和检索段落。虽然这些方法对于纯文本内容有效,但在处理视觉复杂的文档(例如科学论文、财务报告或扫描的PDF...
7天前 756浏览 0点赞 0回复 0收藏
你只需要24GB的内存,除非你的GPU自带VRAM,否则需要相当的耐心。上周,OpenAI发布了两款流行的开放权重模型,均名为gptoss。由于你可以下载它们,因此可以在本地运行。轻量版模型gptoss20b有210亿个参数,需要大约16GB的可用内存。较大版模型gptoss120b有1170亿个参数,需要80GB的内存才能运行。相比之下,像DeepSeekR1这样的前沿模型拥有6710亿个参数,需要大约875GB的内存才能运行,因此LLM开发者及合作伙伴正在尽快构建大型...
8天前 784浏览 0点赞 0回复 0收藏
“AIForAI”是指利用人工智能来构建和优化其他人工智能系统,这能提高效率,但同时也引发了伦理和数据相关的担忧。“AIForAI”(简称AI4AI)作为人工智能学科内一个快速崛起的研究与应用领域,其核心要义在于以人工智能技术本身为工具,赋能其他人工智能系统的开发过程、性能提升与全生命周期管理。具体而言,它通过将人工智能技术渗透于智能系统生命周期的各个关键环节——涵盖模型选型、训练过程、部署实施及持续迭代优化——...
9天前 635浏览 0点赞 0回复 0收藏
AgenticDevOps通过智能体增强开发人员的能力,可以实现编码、测试和运维的自动化,全面提升整个软件开发生命周期(SDLC)的生产力。智能体开发运维(AgenticDevOps)的概念首次亮相于微软公司举办的MicrosoftBuild2025开发者大会。如今有了AgenticAI、AgenticWorkflows、AgenticSystems……当然还有AgenticDevOps纷纷涌现。接下来会是什么本文将深入探讨AgenticDevOps的精彩世界。2025年,一场悄无声息的革命开始重塑软件构建的...
2025-08-11 08:03:45 1712浏览 0点赞 0回复 0收藏
有没有想过,你的口袋里也能装下一个强大的AI助手?它不仅仅是一个应用程序,更是一个先进智能、可配置、私密且高性能的AI语言模型?不妨认识一下Gemma3n。这不仅仅是另一种科技潮流,而是将高性能语言模型径直放在你的手机上。无论你是在列车上构思博客创意、在旅途中翻译信息,还是仅仅想探索AI的未来,Gemma3n都能为你带来极其简单、极其愉悦的体验。不妨逐步了解如何在你的移动设备上发挥AI的魔力。什么是Gemma3n?​Gemma3...
2025-08-08 08:06:40 1003浏览 0点赞 0回复 0收藏
上周,Grok已成为美国、英国和新加坡等主要国家AppStore下载量最高的应用程序。虽然Grok4是一种非常出色的大语言模型(LLM),但这款聊天机器人缺少最热门的AI功能之一:视频。不过,马斯克似乎也感受到了这种“错失恐惧症”(FOMO)的影响。正因如此,他及其团队刚发布了Imagine:这是其聊天机器人中的一项基于AI的视频生成功能。它能与谷歌的Veo3或OpenAI的Sora相媲美吗?本文解答了你的所有疑问。此外,本文还将指导你了解Im...
2025-08-07 07:55:08 1268浏览 0点赞 0回复 0收藏
本文通过介绍麦肯锡的生成式AI平台Lilli,概述了麦肯锡如何围绕AI有效地重塑其业务。​在人们还在考虑如何将人工智能(AI)用作一种提高效率的新工具,发挥其潜在的能力与适用场景时,麦肯锡已经开始采取不同的方法,围绕着AI重建其整体商业模式了。麦肯锡正在使用人工智能来全面重塑他们的运营,并建立了一个能提供对现实世界可衡量结果的系统。这一业务重塑与转型的核心是麦肯锡的生成式AI平台Lilli。它如今已是45,000名专业...
2025-08-06 07:35:49 812浏览 0点赞 0回复 0收藏
从研究、内容创作、图像生成、编程及文档分析等角度对Perplexity和ChatGPT进行性能比较。目前,PerplexityPro已向所有Airtel用户免费开放。你或许已听闻此消息,甚至可能已完成激活。若尚未激活,当下正是绝佳时机。此次合作对双方均意义重大:Perplexity借此获得了数百万Airtel用户的访问入口,而Airtel则通过为用户提供当前最受欢迎的人工智能工具之一,丰富了自身的服务内容。但对于那些已付费使用ChatGPTPlus或Gemini等工具...
2025-08-05 08:11:08 1000浏览 0点赞 0回复 0收藏
模糊指令或缺失关键约束会使AI误解意图,导致输出偏离预期。需通过精准角色设定、任务拆解和背景补充来优化提示词设计,确保模型聚焦核心任务并减少幻觉。因此,有效提示工程是引导AI生成可靠内容的关键。简介我已经一直在努力提高我的提示词技巧,这是迄今为止我学到的最重要的一课:你与人工智能对话的方式可能会让它朝着不利于你答案质量的方向发展。这种影响可能比你想象的要大得多(当然,比我意识到的要大得多)。在本文...
2025-08-04 07:52:22 808浏览 0点赞 0回复 0收藏
开篇​最近,“AgenticAI”的热度在技术圈迅速蹿红。但我认为,这不是偶然现象,而是AI技术发展到当前阶段的一个必然产物。OpenAI、Google、Anthropic这些大公司已经将基础大模型的能力推进到了一个很高的水平——强大的理解、生成和推理能力不再是稀缺品。市场核心命题由此转变:如何将这强大的基础智能,转化为能真正解决商业痛点、创造价值的实用方案。无论是企业还是开发者,目光都已超越模型的实验室表现或炫目的演示。他...
2025-08-01 07:54:33 915浏览 0点赞 0回复 0收藏
合成身份欺诈已不仅仅是一种新的网络犯罪类别,它是对于数字化应用信任关系的根本性挑战。本文深入剖析了合成身份的基本原理、极度危害、流水线模式、产生的信任危机、以及给犯罪供应链带来的变革,也提出了利用技术和监管与之对抗的思路和成本。2025年已过半,在线身份欺诈的行为已经从原始的信用卡号盗用和文件伪造,演变成为更具欺骗性的方式合成身份欺诈(Syntheticidentityfraud),即:由人工智能(AI)生成的角色来盗用...
2025-07-31 10:52:13 2349浏览 0点赞 0回复 0收藏
本文聚焦GPU这一AI时代的核心算力引擎,从CPU与GPU的本质差异切入,解析二者在架构设计(运算单元占比、并行能力)和协同工作流程(数据传输、指令注入、并行计算、结果回传)的底层逻辑。以NVIDIAH100(Hopper架构)为核心案例,深入拆解其基本架构:80GBHBM3显存的高带宽设计、PCIE5.0接口的传输能力,以及内部层级化结构——从顶层GPC(图形处理集群)、中层TPC(纹理处理集群)到核心SM(流式多处理器)的功能分工。同时,...
2025-07-30 07:37:26 2852浏览 0点赞 0回复 0收藏
本文对机器学习在体育运动中的主要应用与实现进行了探讨。通过整合赛事统计、可穿戴设备及视频追踪等多个来源数据,机器学习可以实现比赛结果预测、球员表现评估、伤病风险预警及战术优化,还能够分析球员和比赛的数据,以识别隐藏的模式,帮助球队确定更科学的训练方法。你有没有想过,体育解说员如何能在赛事中快速准确地判断球员的竞技状态或总结关键数据?体育数据分析让球队能够收集数据、评估队员表现并做出深入决策以提...
2025-07-29 07:49:31 1385浏览 0点赞 0回复 0收藏
Anthropic一项最新研究表明,AI模型耗费更长时间“思考”后表现未必更好,在某些情况下性能甚至会显著下降。这一发现,挑战了AI行业推理浪潮的理论根基。这项由Anthropic公司AI安全研究员AryoPradiptaGema及其他几位研究人员主导的项目,发现了所谓“测试时计算反比例”迹象,即延长大语言模型的推理长度实际上会降低其在多种任务中的表现。这一发现可能对当前强调模型推理能力的技术浪潮产生巨大冲击。研究人员在周二发表的论...
2025-07-28 07:43:51 1353浏览 0点赞 0回复 0收藏
假如你将迎来这样的一个同事:从不睡觉,从不拖延,而且就在你去喝了杯咖啡的时候,他已经处理了TB字节为单位的数据,你会因为合作者如此给力而欣喜,还是担心自己的饭碗不保呢?这个问题直接引发了一个大讨论:具有自主性的人工智能会取代传统数据分析师的角色吗?在本文中,你将了解到自主智能体如何重塑数据工作,它们会从你的工作中接手哪些具体任务,以及你如何从表格处理者转变为战略制定者。目录数据工作流中自主智能体...
2025-07-25 08:13:36 1289浏览 0点赞 0回复 0收藏
获得成就
已积累 21.4w 人气
获得 7 个点赞
获得 9 次收藏