9 大主题!机器学习算法理论面试题大汇总

新闻 机器学习 算法
机器学习是一门理论性和实战性都比较强的技术学科。在应聘机器学习相关工作岗位时,我们常常会遇到各种各样的机器学习问题和知识点。

 [[342976]]

机器学习是一门理论性和实战性都比较强的技术学科。在应聘机器学习相关工作岗位时,我们常常会遇到各种各样的机器学习问题和知识点。

算法理论基础不仅包含基本概念、数学基础,也包含了机器学习、深度学习相关。今天给大家推荐一个不错的算法理论基础面试题汇总资源,已开源~

首先放上这份开源面试题汇总的地址:

https://github.com/sladesha/Reflection_Summary

其作者是 SladeSal 和 tcandzq,来自 2020 届校招面试各类算法问题及个人理解的汇总。目前已经收获 900+ 的赞了~

资源目录:

  • 基础概念
  • 数学
  • 数据预处理
  • 机器学习
  • 深度学习
  • 自然语言处理
  • 推荐
  • 风控
  • 评价指标

 

 

下面来看一下详细内容,一睹为快!

1. 基础概念

基础概念部分包含了 5 个主题,分别是:方差和偏差、生成与判别模型、先验概率和后验概率、频率概率、AutoML。每个主题都包含若干常见、高频出现的面试题。

例如“如何解释偏差、方差,模型训练为什么要引入偏差和方差?”

 

 

问题的解释都来自面试题的精炼总结,不罗嗦,简单易懂。

2. 数学

数学部分包含了 12 个主题,分别是:数据质量、最大公约数问题、牛顿法、拟牛顿法、概率密度分布、平面曲线的切线和法线、导数、微分中值定理、泰勒公式、欧拉公式、矩阵、概率论。

例如,看下关于泰勒公式的讲解:

泰勒公式一句话描述:就是用多项式函数去逼近光滑函数。常见的泰勒公式有:

 

 

3. 数据预处理

数据预处理部分包含了 5 个主题,分别是数据平衡、异常点处理、缺失值处理、特征选择、特征提取。数据预处理是机器学习算法的重要组成部分。

例如“为什么需要对数据进行变换?”,“归一化和标准化之间的关系?”

 

 

这部分作者总结得很详细,后面还有展开!关于连续特征的常用方法,作者引入一张图进行总结归纳:

 

 

4. 机器学习

机器学习部分包含了 9 个主题,分别是:聚类、线性回归、逻辑回归、决策树、贝叶斯、随机森林、集成学习、FM/FFM、SVM。这部分内容详实,核心面试题也总结得很好。

例如 SVM 面试题非常丰富,涵盖得比较全面。众所周知,支持向量机(Support Vector Machine, SVM)是一类按监督学习方式对数据进行二元分类的广义线性分类器,其决策边界是对学习样本求解的最大边距超平面。

关于KKT限制条件,KKT条件有哪些、引入拉格朗日的优化方法后的损失函数解释、核函数的作用是啥、核函数的种类和应用场景作者都有详细解释。

 

 

5. 深度学习

深度学习部分包含了 8 个主题,分别是:dropout、batch_normalization、bp过程、embedding、softmax、梯度消失/爆炸、残差网络、Attention。

例如“残差网络为什么能解决梯度消失的问题?”

 

 

6. 自然语言处理

自然语言处理部分包含了 8 个主题,分别是:GloVe、WordsVec、CRF、LDA、LSTM、GRU、Bert、文本相似度计算。

例如“word2vec和glove区别?”

 

 

7. 推荐

推荐部分包含 8 个主题,分别是:DIN、DeepFM、YoutubeNet、Wide&Deep、MLR、Neural Network全家桶、XDeepFM、Recall。

8. 风控

风控部分包含了 2 个主题,分别是:孤立森林和评分卡。

9. 评价指标

评价指标包含了 5 个主题,分别是:二分类、多分类、回归指标、聚类指标、排序指标。

总的来说,这是一份不错的算法理论基础面试资源,作者对常见的大厂面试题做了较好的归纳和总结。帮助大家对这些知识点进行梳理和理解,以便能够更好地应对机器学习笔试包括面试。

目前该项目应该还在补充完善。

最后,再次放上该资源的 GitHub 开源地址:

https:// github.com/sladesha/Ref lection_Summary

 

责任编辑:张燕妮 来源: 知乎
相关推荐

2009-06-16 14:03:16

Hibernate面试Hibernate面试

2019-03-20 07:50:47

机器学习算法线性回归

2013-11-28 09:55:22

算法面试

2009-06-02 15:11:11

Hibernate面试题查询

2010-08-30 20:51:15

名企面试题

2022-05-11 15:20:31

机器学习算法预测

2017-08-29 14:12:16

Java面试题

2018-08-28 15:54:51

2016-12-01 07:41:37

机器学习常用算法

2022-08-26 14:46:31

机器学习算法线性回归

2010-08-31 23:15:42

2023-12-01 16:27:05

机器学习无监督学习

2013-05-10 14:59:16

2019-01-23 11:45:47

机器学习人工智能机器人

2020-03-23 15:08:44

DNS域名系统

2021-01-22 07:17:14

嵌入式笔试面试

2019-02-18 11:20:59

shell面试题命令

2022-09-04 19:38:11

机器学习算法

2016-08-28 14:44:42

算法TSP生物智能

2019-02-21 14:12:26

前端面试题Vue
点赞
收藏

51CTO技术栈公众号