#码力全开·技术π对#如何通过模型压缩和动态调度,在资源

如何通过模型压缩(如 Quantization)和动态调度(如 TensorFlow Lite 优化),在资源受限的边缘设备(如 Android XR 眼镜)上实现 Gemini 2.5 Flash 的实时响应,并平衡延迟与精度​?

平衡延迟
蘑菇爱吃苦
7天前
浏览
收藏 0
回答 0
待解决
发布
相关问题
提问