51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
信创认证
公众号矩阵
移动端
视频课
免费课
排行榜
短视频
直播课
软考学堂
全部课程
软考
信创认证
华为认证
厂商认证
IT技术
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
#码力全开·技术π对#Gemini API 的多模态能力(文本、图像、视频)如何支持开发者构建跨领域的AI应用?
Ai
key_3_feng
6天前
浏览
提问
帖子
粉丝
关注
赞
收藏 0
回答 0
分享
微博
QQ
微信
举报
待解决
微信扫码分享
删除提问
发布
相关问题
#
码
力
全开
·
技术
π
对
#
多
模态
模型
如何
实现
跨
模态
(
文本
/
图像
/
视频
)
的
语义对齐?
1299浏览
• 0回复
待解决
#
码
力
全开
·
技术
π
对
#
如何
在
Gemini
2.5 等
多
模态
模型中实现
文本
、
图像
、
视频
、代码
的
语义对齐,同时提升复
2375浏览
• 0回复
待解决
#
码
力
全开
·
技术
π
对
#Google Lens等产品
如何
实现
跨
模态
(
文本
/
图像
/
视频
)
的
语义对齐?
267浏览
• 1回复
待解决
#
码
力
全开
·
技术
π
对
#
Gemini
2.5 Pro
的
多
模态
能力
如何
优化搜索体验?
1015浏览
• 2回复
待解决
#
码
力
全开
·
技术
π
对
#
如何
结合Google Vision
API
与OpenAI CLIP模型实现
跨
模态
(
图像
+
文本
)检索?
266浏览
• 2回复
待解决
#
码
力
全开
·
技术
π
对
#Google
Gemini
大模型在
多
模态
任务中,
文本
与
图像
特征融合
的
底层注意
力
机制是
如何
优化
1033浏览
• 3回复
待解决
#
码
力
全开
·
技术
π
对
#Google 推出
的
Agentspace 平台及配套
的
Agent Development Kit(ADK)能为
开发者
带来
907浏览
• 2回复
待解决
#
码
力
全开
·
技术
π
对
#
开发者
如何
通过Jetpack库实现多任务分屏
的
兼容性适配?
747浏览
• 1回复
待解决
#
码
力
全开
·
技术
π
对
#Android 13中
的
权限管理有哪些变化?
开发者
需要做哪些适配?
466浏览
• 1回复
待解决
#
码
力
全开
·
技术
π
对
#
如何
结合Google Dialogflow
构建
多
轮对话
能力
更强
的
聊天机器人?
612浏览
• 1回复
待解决
#
码
力
全开
·
技术
π
对
#
如何
利用Google
AI
的
Agent Development Kit(ADK)
构建
多
代理协作系统?
3725浏览
• 1回复
待解决
#
码
力
全开
·
技术
π
对
#
如何
使用LMEval框架
对
Gemini
2.5模型进行
多
模态
性能评估?
418浏览
• 1回复
待解决
#
码
力
全开
·
技术
π
对
#
Gemini
模型
多
模态
输入处理出现张量形状不匹配
如何
解决?
596浏览
• 1回复
已解决
#
码
力
全开
·
技术
π
对
#
如何
使用 Google Cloud
的
Vertex
AI
Search for Commerce
构建
支持
语义理解与个性化
70浏览
• 2回复
待解决
#
码
力
全开
·
技术
π
对
#Chrome浏览器
如何
利用
Gemini
模型
的
能力
?
471浏览
• 1回复
待解决
#
码
力
全开
·
技术
π
对
#在使用 GCV
AI
训练自定义视觉模型时,
如何
优化
多
标签
图像
分类
的
混淆矩阵表现?
498浏览
• 1回复
待解决
#
码
力
全开
·
技术
π
对
#Bazel
的
Skyframe 架构是
如何
支持
增量
构建
的
?它与 Make、Gradle
的
构建
模型有何不同
369浏览
• 2回复
待解决
#
码
力
全开
·
技术
π
对
#Flutter 3.0
的
macOS桌面
应用
支持
中,
如何
通过Metal图形
API
实现原生性能
的
UI渲染?
2779浏览
• 0回复
待解决
#
码
力
全开
·
技术
π
对
#若要基于 Google
的
Teachable Machine
开发
简易
的
图像
分类
应用
,怎样优化训练数据
的
采
1081浏览
• 0回复
待解决
#
码
力
全开
·
技术
π
对
#:
如何
用Gemma 3n模型优化移动端
的
多
模态
任务
262浏览
• 1回复
待解决
#
码
力
全开
·
技术
π
对
#湖仓架构
如何
支持
低延迟
的
AI
推理(如 Vertex
AI
集成)?是否采用流式计算优化?
986浏览
• 0回复
待解决
#
码
力
全开
·
技术
π
对
#
如何
在 Web
应用
中使用 Web Share
API
与 Google
的
ShareTarget 实现
跨
平台内容分享
46浏览
• 0回复
待解决
当在 Google Maps
API
基础上
开发
应用
时,
如何
优化地图数据
的
加载与渲染机制
1116浏览
• 0回复
待解决
#
码
力
全开
·
技术
π
对
#TensorFlow
如何
通过联合嵌入(Joint Embedding)提升图文
多
模态
模型
的
推理效率?
4169浏览
• 0回复
待解决
#
码
力
全开
·
技术
π
对
#
如何
利用
AI
Mode重构Google搜索
的
多
轮对话体验?
288浏览
• 1回复
待解决
提问