鸿蒙开发者社区

公众号矩阵

移动端

视频课免费课排行榜短视频直播课软考学堂

全部课程软考信创认证华为认证厂商认证 IT技术 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

谷歌性价比之王 Gemini 2.5 Flash-Lite发布：最快轻量版AI模型！原创

发布于 2025-6-18 16:47

浏览

0收藏

今天凌晨，谷歌更新了 Gemini 2.5 系列模型：Gemini 2.5 Pro、Gemini 2.5 Flash发布正式版并进入稳定运行阶段，并推出Gemini 2.5 Flash-Lite预览版。

谷歌性价比之王 Gemini 2.5 Flash-Lite发布：最快轻量版AI模型！-AI.x社区

Gemini 2.5 Flash Lite在在编程、数学、科学、推理和多模态基准测试中，全面超越了 2.0 Flash-Lite，广泛任务延迟低于2.0 Flash-Lite和2.0 Flash。谷歌称这一模型为其最经济实惠、速度最快的2.5系列模型。

谷歌性价比之王 Gemini 2.5 Flash-Lite发布：最快轻量版AI模型！-AI.x社区

并且，它在翻译和分类等高容量、延迟敏感的任务中表现尤为出色。在翻译工作中，不仅能够快速给出翻译结果，而且保证了高准确性和流畅度。

与 2.0 Flash-Lite 和 2.0 Flash 相比，它在广泛任务样本中的延迟更低，缩短了首个 token 的获取时间，实现了更高的每秒 token 解码速度，这使得它在处理任务时反应迅速，几乎能做到即时响应。

同时，Gemini 2.5 Flash-Lite允许通过 API 参数动态控制思考预算，虽然 “思考” 功能默认处于关闭状态，但开发者可根据实际需求灵活开启，以应对不同复杂程度的任务。

DeepMind研究副总裁Oriol Vinyals展示了一个应用示例——Neural OS（神经操作系统）。这个看似普通的操作系统界面，实际上所有内容都是用户点击图标后由Gemini 2.5 Flash-Lite实时生成的。

“这本质上是一个非确定性操作系统”，Vinyals解释道，“当你退出文件夹再重新进入时，里面的内容可能已经完全改变。”这种实时生成能力展示了Flash-Lite在低延迟场景下的卓越性能。

Gemini 2.5 Flash-Lite拥有 100 万个 token 的上下文长度，能够处理长篇幅、复杂的内容，充分理解前后文的逻辑关系，从而给出更贴合需求的回答。

在数学方面，Gemini 2.5 Pro的表现略逊色于OpenAI o4-mini，图像理解方面分数略低于OpenAI-o3 high。

谷歌性价比之王 Gemini 2.5 Flash-Lite发布：最快轻量版AI模型！-AI.x社区

在价格方面，Gemini 2.5 Flash-Lite 展现出了超高的性价比。它比 Gemini 2.5 Flash 便宜 30%-60%，输入价格仅为 0.1 美元（折合人民币约 0.7 元）/ 百万 tokens，输出价格为 0.4 美元（折合人民币约 2.9 元）/ 百万 tokens 。

目前，Gemini 2.5 Flash-Lite 预览版已在谷歌 AI Studio 和 Vertex AI 中上线，开发者们可以第一时间体验它的强大功能。

同时，Gemini 2.5 Flash 和 Pro 稳定版也已全面可用，并且谷歌还为谷歌搜索功能引入了 2.5 Flash-Lite 和 Flash 的定制版本，让广大用户在日常搜索中也能感受到 AI 技术带来的高效与便捷。

Gemini2.5系列的发布，标志着谷歌在推理速度和经济性方面取得了新的突破。

大家怎么看？欢迎在评论区留言讨论~

©著作权归作者所有，如需转载，请注明出处，否则将追究法律责任

标签

租算力，到算家云

赞

收藏

回复

举报

回复

相关推荐

谷歌重磅发布Gemini 1.5 Pro：能自动写影评，理解视频！

Aceryt • 5650浏览 • 0回复
FlashRAG：5大组件、12种RAG技术、32个数据集的开源框架，比LangChain轻量！

PaperAgent • 1.1w浏览 • 0回复
谷歌发布Gemini模型重大更新，OpenAI、Anthropic反击，竞争仍在继续

Syrupup • 3852浏览 • 0回复
微调谷歌开源Gemini Flash模型实现PII脱敏实战

51CTO内容精选 • 3938浏览 • 0回复
DeepSeek-R1-Lite预览版上线

kede96 • 3906浏览 • 0回复
DeepSeek AI发布DeepSeek-V2.5-1210：DeepSeek-V2.5的更新版本，模型性能显着提升

Halo咯咯 • 1.7w浏览 • 0回复
谷歌AI发布Gemini 2.0 Flash：比Gemini 1.5 Pro快2倍的新AI模型

Halo咯咯 • 7320浏览 • 0回复
对标DeepSeek，Gemini 2.0轻量模型开卷“极致性价比”！谷歌守住多模态阵地应用们都要开始做推理了！

51CTO技术栈 • 2497浏览 • 0回复
Google AI发布Gemini 2.0 Flash Thinking 模型

Halo咯咯 • 3509浏览 • 0回复
Gemini 2.0 Flash Thinking：谷歌放大招！能"直播思考"的AI来了，推理能力吊打OpenAI？

Halo咯咯 • 5878浏览 • 0回复
DeepSeek如何选满血版vs蒸馏版哪个一体机性价比更高

数智飞轮 • 8741浏览 • 0回复
AI 大模型：从产业阵痛到轻量高效的未来之路

AI算力补给站 • 3208浏览 • 0回复
数值怪物VS编码之王：Gemini 2.5与DeepSeek双雄争霸！

探索AGI • 5937浏览 • 0回复
Google Gemini 2.5 Pro：AI界的“全能王”来了！

Halo咯咯 • 2719浏览 • 0回复
Agno框架介绍：用于构建多模态智能体的轻量库

51CTO内容精选 • 2917浏览 • 0回复
GPT-4o(多模态版)、Claude3.7、Gemini2.5最新系统提示词！

云中江树 • 2703浏览 • 0回复
最强AI编程模型来了！Gemini 2.5 Pro（I/O版）提前炸场，全面碾压Claude 3.7

算家计算 • 3275浏览 • 0回复
新发布模型堪称性价比之王！性能优于 Llama 4，成本降低8倍！更大的开源模型即将发布

51CTO技术栈 • 1431浏览 • 0回复
谷歌Gemini 2.5家族全面升级：Pro、Flash与Flash-Lite正式发布，AI推理能力再进化

AI博物院 • 8289浏览 • 0回复

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

最近发布

热门推荐

即梦图片4.0来了！文生图修图组图一键搞定，小白也能秒变设计师 0回复

DeepSeek深夜发布新模型，但不是R2 0回复

DeepSeek被曝年底推出AI智能体，下一代人机交互时代要来了？ 0回复

AI一天，人间一年：这些行业正迎来黄金发展期！ 0回复

阿里深夜开源图像编辑神器Qwen-Image-Edit，PS地位不保了？ 0回复

上一篇： 28岁华裔天才身价百亿，却呼吁抵制中国AI

下一篇：国产视频大模型霸榜全球！海螺02特效炸裂，好莱坞级大片10秒生成

社区精华内容

目录

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载