51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
信创认证
公众号矩阵
移动端
视频课
免费课
排行榜
短视频
直播课
软考学堂
全部课程
软考
信创认证
华为认证
厂商认证
IT技术
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
#码力全开·技术π对#MoR架构依赖递归参数共享,如何解决梯度消失/爆炸问题?是否引入了新型优化器或梯度裁
MoR架构依赖递归参数共享,如何解决梯度消失/爆炸问题?是否引入了新型优化器或梯度裁剪策略?
MoR
mb6536464c40f61
2天前
浏览
提问
帖子
粉丝
关注
赞
收藏 0
回答 0
分享
微博
QQ
微信
举报
待解决
微信扫码分享
删除提问
发布
相关问题
#
码
力
全开
·
技术
π
对
#JAX分布式训练中
如何解决
多TPU节点间的
梯度
同步延迟?
354浏览
• 1回复
待解决
#
码
力
全开
·
技术
π
对
# 在TensorFlow 3.0中,
如何
有效
优化
分布式训练时出现的
梯度
同步延迟
问题
?
187浏览
• 6回复
待解决
#
码
力
全开
·
技术
π
对
#
MoR
的推理速度提升
是否
依赖
于特定硬件(如TPUv5)的
优化
?在消费级GPU上的表现
如何
?
204浏览
• 0回复
待解决
#
码
力
全开
·
技术
π
对
#MediaPipe手势识别的延迟为何低于100ms?其
优化
是否
依赖
GPU加速
或
Vulkan API?
349浏览
• 1回复
待解决
#
码
力
全开
·
技术
π
对
#Bazel构建Flutter项目时出现
依赖
冲突
如何解决
?
662浏览
• 2回复
待解决
#
码
力
全开
·
技术
π
对
#Chrome 浏览
器
引入
的“增强隐私模式”
是否
会增加硬件性能负担
571浏览
• 1回复
待解决
#
码
力
全开
·
技术
π
对
#
如何解决
MySQL 中的死锁
问题
?
355浏览
• 1回复
待解决
#
码
力
全开
·
技术
π
对
#Hilt
依赖
注入在动态功能模块中失效
如何解决
195浏览
• 1回复
待解决
#
码
力
全开
·
技术
π
对
#Android 16 Beta 4
引入了
哪些关键更新
331浏览
• 2回复
待解决
#
码
力
全开
·
技术
π
对
#
如何解决
Google Cloud Run冷启动延迟
问题
?
272浏览
• 1回复
已解决
#
码
力
全开
·
技术
π
对
#
如何解决
大语言模型(如Gemini)的幻觉
问题
?
395浏览
• 0回复
待解决
#
码
力
全开
·
技术
π
对
#Flutter开发:
如何解决
Flutter中TextField输入法遮挡
问题
?
186浏览
• 2回复
待解决
#
码
力
全开
·
技术
π
对
#Google的Mixture-of-Recursions(
MoR
)
架构
相比MoE(Mixture-of-Experts)在KV内存
优化
222浏览
• 0回复
待解决
#
码
力
全开
·
技术
π
对
#无服务
器
架构
的冷启动与成本
优化
1468浏览
• 0回复
待解决
#
码
力
全开
·
技术
π
对
#Android的Project Mainline模块化更新
如何解决
碎片化
问题
?
3006浏览
• 1回复
待解决
#
码
力
全开
·
技术
π
对
#OpenXLA StableHLO兼容性检查失败
如何解决
跨框架模型移植
问题
?
255浏览
• 1回复
待解决
#
码
力
全开
·
技术
π
对
#Android开发:
如何解决
Android后台服务被系统杀死后的保活
问题
?
3245浏览
• 3回复
待解决
#
码
力
全开
·
技术
π
对
#Gemini 2.5 Pro的“推理过程可视化”功能
如何解决
AI“黑箱”
问题
?
2891浏览
• 0回复
待解决
TFX 流水线在 Kubeflow 上运行时ModelValidator组件频繁 gRPC 超时,调参无效,
架构
或
环境
如何
优化
?
279浏览
• 1回复
待解决
#
码
力
全开
·
技术
π
对
#Gemini 能否
解决
更抽象的数学
问题
(如黎曼猜想)?
是否
需要新的训练范式?
66浏览
• 0回复
待解决
#
码
力
全开
·
技术
π
对
#当机器人执行失败(如抓取物体失误),系统
如何
动态调整LLM生成的技能序列?
是否
引入
强
203浏览
• 0回复
待解决
#
码
力
全开
·
技术
π
对
#在跨数据中心场景下,
如何解决
分布式事务中的网络分区
问题
?
3103浏览
• 5回复
待解决
#
码
力
全开
·
技术
π
对
#Google
是否
在研发比Gato更通用的“视觉-语言-动作”模型?
如何解决
Sim2Real(模拟到现
21浏览
• 0回复
待解决
#
码
力
全开
·
技术
π
对
#Kotlin多平台开发中,
如何解决
与Java遗留代码库的互操作性及性能损耗
问题
?
3892浏览
• 0回复
待解决
#
码
力
全开
·
技术
π
对
#湖仓
架构
如何
支持低延迟的 AI 推理(如 Vertex AI 集成)?
是否
采用流式计算
优化
?
84浏览
• 0回复
待解决
提问