
AI 辅助学习如何选大模型?兼初步测试 Llama 4
在这个教材知识爆炸的时代,如何高效地帮助孩子掌握知识、培养学习兴趣,成为了许多家长的共同课题。而以大语言模型为代表的人工智能技术的出现,为解决这一难题提供了一种全新的可能。
利用 AI,不仅能帮助我们家长快速掌握孩子正在学习的内容,从而便于与他们进行更有效的沟通,增进「亲子关系」;同时,AI 还能拓展我们的思路,为孩子提供更多启发和灵感,让他们的学习过程更加丰富多彩。
大模型海选
首先,我们需要选择一个你比较满意的 AI 大模型来提供辅助。考虑到很多题目中包含图片,这种情况下,我们应该优先选择具备强大多模态能力(即能处理文本和图像)的模型,以确保更全面、准确的支持。
你可以准备一些题目,初步测试候选大模型的能力。在这里,我们通过一道初中科学题来进行实际操作示范,供大家参考。
我从网上找到了一道初中科学题,这道题的卷面上还有一些笔迹和划痕。我想借此测试 AI 在实际应用中的表现,特别是这些卷面上的划痕是否会干扰它的识别能力。
此题的正确答案为 D。
卷面留有错误答案,顺便看看会不会干扰到大模型。
我们先看国内大模型,从中选出一个比较能打的,再对比下国外最新的大模型。
¸kimi + 长思考
成功被干扰到了,而且分析得也不够详细,尽管长思考了很久。
¸夸克
¸通义 Qwen2.5-max
¸智谱清言
¸MiniMax
¸DeepSeek-R1
¸豆包
结论
“
这么国产多大模型中,通过此题考验的只有豆包。
”
下面我们就以豆包为例,继续就这道题目进行深入解读。
1、分析一下在实际题目中,一般是如何考查学生对这些知识点的理解和应用。
2、这道题错选 C 的话,你觉得反映出学生在知识点的理解上哪方面出了问题呢?
3、请用 Mermaid 代码展示这些知识点及其关系。
Mermaid 代码如下,
graph TD
A[光敏电阻特性] --> B[串联电路规律]
A --> C[电磁继电器原理]
B --> D[实际控制逻辑]
C --> D
A -->|光照增强→阻值减小| E[电阻变化]
B -->|I=U/R总| F[电流变化]
B -->|U与R成正比| G[电压分配]
C -->|电流→磁性→触点动作| H[继电器控制]
D -->|路灯亮灭逻辑| I[应用场景]
subgraph 核心知识点
A[光敏电阻特性]
B[串联电路规律]
C[电磁继电器原理]
end
subgraph 关键关系
E --> F
F --> G
G --> H
H --> I
end
4、根据这些知识点,重新出几道不同难度的题目。
5、帮忙找一找讲解这些知识点的相关视频。
这里体现出字节跳动的优势,会关联抖音视频。
点开其中一个视频瞅一瞅,
怎么样,感觉豆包能不能助你一臂之力呢?
下面我们对比一下国外大模型。
¸ChatGPT
此题 ChatGPT 没搞定,不过这里只测试了默认的 GPT-4o。
¸Claude 3.7
这个我试了好几个地方的版本,包括 https://lmarena.ai
上的 Thinking 版本,发现答案都没弄对,但下面这个版本出来的知识导图还可以。
¸Llama 4
Meta ai 刚刚发布的开源大模型,迫不及待地看看能力如何。
发现在这个问题上表现一般,等待推理型版本,以及后期大家的改进。
¸Gemini 2.5 Pro
就此题而言,最新版的 Gemini 给出的解读还是非常到位,知识点也很详细。
知识脉络图画出来是这样滴,
根据这些知识点,重新出几道不同难度的题目。
视频推荐,
测试结果显示,对于海外用户来说,Gemini 是一个不错的选择;而国内用户则可以使用豆包,也很香,其短视频内容更加丰富。期待其他大模型的继续努力。
本文转载自机器学习与数学,作者:大师兄
