社区编辑申请
注册/登录
如何用初中知识理解机器学习到底在干什么事情
人工智能 机器学习
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

前言

百度百科搜索“机器学习”,映入眼帘的是我无法企及的高度:

  • 机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

让我在怀疑自己智商的同时也在思考:这段话除了阐述了机器学习很牛X,能够模拟人类学习行为以外,好像并没有让我明白这四个词的含义,反而加重了我的思想负担,带着我越加沉重的大脑继续往下看,找到了我认为本词条最为重要的定义:

 

如何用初中知识理解机器学习到底在干什么事情

然而并卵!!!

就像是看着笑傲江湖里的《葵花宝典》,由于没有自宫,看了再怎么高深的剑法招式,也只是流于片面,除了牛批,还是牛批。至此我终于明白,原来是打开方式不对,从一开始就错了(要自宫)!

所以,需要换个方式,这一次我们用初中数学打开:

从一次函数说起

在初中的数学中,我们常常遇到类似这样题目:

  • 给定平面内的三个点坐标(x,y): A(1,3)、B(2,5)、C(3,7)求x=5时,y的值。

面对如此问题,我们可以先把三个点放到坐标轴上看看,如图:

 

如何用初中知识理解机器学习到底在干什么事情

可以发现三个点在一条直线上,符合一次函数的性质,那我们只需要求出这条直线的方程式,将x=5代入方程式,就可以求出此时y的值。

此时,问题就变成了:

  • 已知A(1,3)、B(2,5)、C(3,7)三个点,横坐标和纵坐标的关系符合一次函数

 

如何用初中知识理解机器学习到底在干什么事情

求x=5时,y的值。

问题到此就进入了我初中知识水平的层面,只需要将A、B、C三个点代入y=kx+b得到关于k和b的一个方程组,求解可得:

 

如何用初中知识理解机器学习到底在干什么事情

那么x=5时,y等于2*5+1=11(放着我来,这个我会算)。

问题思考

机器学习无非就是类似于上面的一个过程,在给定一定量的输入(x)和输出(y)数据的前提下,找出一个函数来表示这些x和y之间的关系,根据这个函数,我们可以在知道x的条件下轻松求出y,例如我们在网购之后输入评论,系统就能自动识别出是好评还是差评。

上述案例的这个函数我们可以称之为模型,x称之为特征,y就是机器学习要预测的结果,而已知的x和y的组合称之为训练数据,训练的过程也就是找出x和y的关系的过程(而不是用皮鞭抽的过程)。

然而真实的机器学习案例中往往没这么简单,只有一个特征x的函数怎么满足更为复杂的业务需求呢?

“一个不行就两个,两个不行就三个,三个不行还可以加呀,只要给钱,不好意思,扯远了!”

当特征数量为多个,我们依旧可以基于上面的一次函数基础,进行模型假设

 

如何用初中知识理解机器学习到底在干什么事情

那么问题也可以得到解决,这就是机器学习里面较为基础的线性回归。

如果你觉得这些函数都只能求出一个值,没啥意思,能否帮我识别出评论区里哪些是好评,哪些是差评呢?

“当然是没问题的!只需要把y的结果映射到0-1之间,然后对y进行判断,y>=0.5表示好评,y<0.5表示差评就行,然后这个映射函数我们称之为激活函数,怎么实现的先不管,理解为主”

 

如何用初中知识理解机器学习到底在干什么事情

这样就实现了机器学习中分类任务逻辑回归。

如果你觉得一个特征对应一个权重有点low,而且很多事情都并非是线性相关,如何解决这个问题呢?

“一层权重不够,那就加呗,如果再不够,那就再加!”

 

如何用初中知识理解机器学习到底在干什么事情
你还要吗?我再加点

上面的过程跑得有点远,一不小心已经到了深度学习的层面,路漫漫其修远兮,我的智商有点跟不上...(所以用省略号代替)

总结

以上案例仅仅是机器学习中监督学习的过程,真正的机器学习往往比这个复杂得多,还分为非监督学习,半监督学习,在此不做多余赘述,有机会再写,再见!

 

责任编辑:未丽燕 来源: 今日头条
相关推荐

2022-03-28 13:14:19

机器学习深度学习

2022-07-10 14:59:57

机器学习人工智能预测模型

2022-05-19 10:27:34

机器学习人工智能

2022-05-17 11:05:16

机器学习人工智能

2022-02-16 07:44:48

2022-04-06 11:55:12

模型机器学习训练

2014-06-17 09:55:24

2021-03-15 11:35:28

人工智能机器学习

2021-04-12 10:46:15

人工智能机器学习

2017-09-21 12:15:36

机器学习概率学习

2021-02-17 00:30:41

机器学习深度学习人工智能

2020-12-07 08:15:11

机器学习人工智能AI

2017-04-10 08:40:14

机器学习模型应用模型评估

2014-05-14 10:13:50

程序员机器学习

2021-12-30 20:20:46

2021-04-26 13:22:55

人工智能机器学习

2020-06-17 10:35:16

机器学习AI人工智能

2016-06-02 11:02:02

2017-05-18 13:23:06

机器学习强化学习分类问题

2017-08-17 13:26:34

机器学习监督学习强化学习

同话题下的热门内容

专访字节跳动王明轩:机器翻译和人工翻译实质是两个赛道 | T前线人工智能(AI)、机器学习(ML)和深度学习(DL):有什么区别?合成数据:机器学习的未来机器学习必备:如何防止过拟合?​用 PySpark ML 构建机器学习模型一文综述「联邦图机器学习」,概念、技术、应用全都有Wandb不可缺少的机器学习分析工具机器学习中必学的四种交叉验证技术

编辑推荐

90%的码农即将失业,谷歌AI写的机器学习代码竟完爆程序员!使用TensorFlow构建LSTM模型详细教程深度学习和普通机器学习之间有何区别?一文读懂深度学习与机器学习的差异2018年值得关注的10种机器学习工具
我收藏的内容
点赞
收藏

51CTO技术栈公众号