Skip to content

机器学习/深度学习/Python/Go语言面试题笔试题(Machine learning Deep Learning Python and Golang Interview Questions)

Notifications You must be signed in to change notification settings

geektutu/interview-questions

Folders and files

NameName
Last commit message
Last commit date

Latest commit

08564a3 · Jun 12, 2021

History

18 Commits
Aug 1, 2019
Oct 16, 2020
Jun 12, 2021
Sep 5, 2020
May 8, 2018
Oct 10, 2020
Sep 5, 2020

Repository files navigation

机器学习&编程面试笔试题

序言

持续整理、更新Python、机器学习(Machine Learning)、深度学习(Deep Learning)领域的面试笔试题(interview questions)。

声明:所有习题系博主花费大量精力整理,请尊重劳动成果,未经许可,禁止原文转载。

目录

机器学习

Go 语言

相关链接

选择题示例

使用决策树分类时,如果输入的某个特征的值是连续的,通常使用二分法对连续属性离散化,即根据是否大于/小于某个阈值进行划分。如果采用多路划分,每个出现的值都划分为一个分支,这种方式的最大问题是:

  • A 计算量太大
  • B 训练集和测试集表现都很差
  • C 训练集表现良好,测试集表现差
  • D 训练集表现差,测试集表现良好
答案

C 连续值通常采用二分法,离散特征通常采用多路划分的方法,但分支数不宜过多。 连续特征每个值都划分为一个分支,容易过拟合,泛化能力差,导致训练集表现好,测试集表现差。

对神经网络(neural network)而言,哪一项对过拟合(overfitting)和欠拟合(underfitting)影响最大。

  • A 隐藏层节点(hidden nodes)数量
  • B 学习速率(learning rate)
  • C 初始权重
  • D 每一次训练的输入个数固定
答案

A 过拟合和欠拟合与神经网络的复杂程度有关,模型越大越容易过拟合。隐藏层节点数量直接决定了模型的大小与复杂程度。

问答题示例

经验误差(empirical error)与泛化误差(generalization error)分别指?

答案
经验误差: 也叫训练误差(training error),模型在训练集上的误差。 泛化误差: 模型在新样本集(测试集)上的误差。

简述 K折交叉验证(k-fold crossValidation)。

答案
- 数据集大小为N,分成K份,则每份含有样本N/K个。每次选择其中1份作为测试集,另外K-1份作为训练集,共K种情况。 - 在每种情况中,训练集训练模型,用测试集测试模型,计算模型的泛化误差。 - 将K种情况下,模型的泛化误差取均值,得到模型最终的泛化误差。

附:题目主要来源

About

机器学习/深度学习/Python/Go语言面试题笔试题(Machine learning Deep Learning Python and Golang Interview Questions)

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published