尔雅机器学习初步(李侃)课后答案(学习通2023课后作业答案)

分类: 生物答案发布于:2024-06-02 13:36:12ė11686次浏览687条评论

尔雅机器学习初步(李侃)课后答案(学习通2023课后作业答案)

第一章 绪论

绪论

1、尔雅下列哪位是机器人工智能之父?
A、Marniv Lee Minsky
B、学习学习HerbertA.Simon
C、初步Allen Newell
D、李侃John Clifford Shaw

2、课后根据王珏的答案理解,下列不属于对问题空间W的通课统计描述是
A、一致性假设
B、后作划分
C、业答泛化能力
D、尔雅学习能力

3、机器下列描述无监督学习错误的学习学习是
A、无标签
B、初步核心是李侃聚类
C、不需要降维
D、具有很好的解释性

4、下列描述有监督学习错误的是
A、有标签
B、核心是分类
C、所有数据都相互独立分布
D、分类原因不透明

5、下列哪种归纳学习采用符号表示方式?
A、经验归纳学习
B、遗传算法
C、联接学习
D、强化学习

6、混淆矩阵的假正是指
A、模型预测为正的正样本
B、模型预测为正的负样本
C、模型预测为负的正样本
D、模型预测为负的负样本

7、混淆矩阵的真负率公式是为
A、TP/(TP+FN)
B、FP/(FP+TN)
C、FN/(TP+FN)
D、TN/(TN+FP)

8、混淆矩阵中的TP=16,FP=12,FN=8,TN=4,准确率是
A、1/4
B、1/2
C、4/7
D、4/6

9、混淆矩阵中的TP=16,FP=12,FN=8,TN=4,精确率是
A、1/4
B、1/2
C、4/7
D、2/3

10、混淆矩阵中的TP=16,FP=12,FN=8,TN=4,召回率是
A、1/4
B、1/2
C、4/7
D、2/3

11、混淆矩阵中的TP=16,FP=12,FN=8,TN=4,F1-score是
A、4/13
B、8/13
C、4/7
D、2/3

第二章 期望最大化算法

期望最大化算法

1、EM算法的E和M指什么?
A、Expectation-Maximum
B、Expect-Maximum
C、Extra-Maximum
D、Extra-Max

2、EM算法的核心思想是?
A、通过不断地求取目标函数的下界的最优值,从而实现最优化的目标。
B、列出优化目标函数,通过方法计算出最优值。
C、列出优化目标函数,通过数值优化方法计算出最优值。
D、列出优化目标函数,通过坐标下降的优化方法计算出最优值。

3、关于EM算法的收敛性,EM算法理论上不能够保证收敛。

4、关于EM算法的用途,EM算法只适用不完全数据的情形。

5、Jessen不等式等号成立的条件是:变量为常数

6、Jessen不等式E(f(x)) >= f(E(x)), 左边部分大于等于右边部分的条件是函数f是凸函数,如果f是凹函数,左边部分应该是小于等于右边部分。

7、EM算法因为是理论可以保证收敛的,所以肯定能够取得最优解。

8、EM算法首先猜测每个数据来自哪个高斯分布,然后求取每个高斯的参数,之后再去重新猜测每个数据来自哪个高斯分布,类推进一步迭代,直到收敛,从而得到最后的参数估计值。

9、EM算法,具有通用的求解形式,因此对任何问题,其求解过程都是一样,都能很容易求得结果。

10、EM算法通常不需要设置步长,而且收敛速度一般很快。

第三章 主题建模

主题建模

1、LDA模型的隐变量Z是
A、每个词对应的主题
B、每篇文档对应的主题
C、每段话对应的主题
D、每个词组对应的主题

2、LDA模型中的一个主题指:
A、词集合上的一个概率分布
B、词组集合上的一个概率分布
C、整个文档上的一个概率分布
D、整个文档集合上的一个概率分布

3、LDA模型在做参数估计时,最常用的方法是
A、Gibbs采样方法
B、变分推断
C、梯度下降
D、Beam search

4、吉布斯采样是一种通用的采样方法,对于任何概率分布都可以采样出对应的样本。

5、LDA模型的核心假设是:假设每个文档首先由主题分布表示,然后主题由词概率分布表示,形成文档-主题-词的三级层次。

6、Gibbs采样是一类通用的采样方法,和M-H采样方法没有任何关系。

7、关于LDA模型中的K,K的指定,必须考虑数据集合的特点,选择一个较为优化的数值。

8、LDA模型是一种生成式模型

9、主题建模的关键是确定数据集合的主题个数。

10、主题建模本质上是: 一种新的文档表示方法,主要是通过主题的分布来表示一个文档。 一种数据压缩方法,将文档压缩在更小的空间中。

第四章 支持向量机

支持向量机

1、SVM算法的性能取决于:
A、核函数的选择
B、软间隔参数
C、核函数的参数
D、以上所有

2、SVM中的代价参数C表示什么?
A、交叉验证的次数
B、用到的核函数
C、在分类准确性和模型复杂度之间的权衡
D、以上都不对

3、下列有关支持向量机说法不正确的是:
A、采用结构风险最小化原理
B、具有很好的推广能力
C、是凸二次优化问题
D、得到的是局部最优解

4、下列有关核函数不正确的是:
A、极大地提高了学习机器的非线性处理能力
B、函数与非线性映射并不是一一对应的关系
C、满足Mercer条件的函数不一定能作为支持向量机的核函数
D、可以采用cross-va1idalion方法选择最佳核函数

5、一对一法分类器,k个类别需要多少个SVM:
A、k
B、k!
C、k(k-1)/2
D、k(k-1)

6、SVM中的泛化误差代表SVM对新数据的预测准确度

7、若参数C(cost parameter)被设为无穷,只要最佳分类超平面存在,它就能将所有数据全部正确分类

8、“硬间隔”是指SVM允许分类时出现一定范围的误差

9、支持向量是最靠近决策表面的数据点

10、数据有噪声,有重复值,不会导致SVM算法性能下降

第五章 聚类分析

聚类分析

1、有关聚类分析说法错误的是:
A、无须有标记的样本
B、可以用于提取一些基本特征
C、可以解释观察数据的一些内部结构和规律
D、聚类分析一个簇中的数据之间具有高差异性

2、两个n维向量 和 之间的欧式距离(euclidean distance)为:
A、
B、
C、
D、

3、闵可夫斯基距离表示为曼哈顿距离时p为:
A、1
B、2
C、3
D、4

4、关于K-means说法不正确的是:
A、算法可能终止于局部最优解
B、簇的数目k必须事先给定
C、对噪声和离群点数据敏感
D、适合发现非凸形状的簇

5、k中心点算法每次迭代的计算复杂度是多少?
A、
B、
C、
D、

6、下面是矩阵的特征值为:
A、3
B、2
C、-1
D、0

7、分裂层次聚类采用的策略是自底向上

8、DBSCAN对参数不敏感

9、EM聚类属于软分聚类方法

10、k-means算法、EM算法是建立在凸球形的样本空间上的聚类方法

第六章 概率无向图模型

概率无向图模型

1、下图中有多少个团?
A、4
B、5
C、6
D、7

2、下图中有多少个最大团?
A、0
B、1
C、2
D、3

3、下图中的联合概率分布的吉布斯表示为:
A、
B、
C、
D、

4、假设某事件发生的概率为p,则此事件发生的几率为:
A、p
B、1-p
C、p/(1-p)
D、(1-p)/p

5、以下关于逻辑斯蒂回归模型的描述正确的是
A、针对分类的可能性进行建模,不仅能预测出类别,还可以得到属于该类别的概率。
B、直接对分类的可能性进行建模,无需事先假设数据分布,这样就避免了假设分布不准确所带来的问题。
C、模型本质仍然是一个线性模型,实现相对简单。
D、逻辑斯蒂回归模型是线性回归模型

6、条件随机场需要解决的关键问题有:
A、特征函数的选择
B、参数估计
C、约束条件
D、模型推断

7、逻辑斯蒂回归模型是一种回归算法。

8、熵最大时,表示随机变量最不确定,也就是随机变量最随机,对其行为做准确预测最困难。

9、从最大熵思想出发得出的最大熵模型,采用最大化求解就是在求P(y|x)的对数似然最大化。

10、GIS算法的收敛速度由计算更新值的步长确定。C值越大,步长越大,收敛速度就越快。

第七章 概率有向图模型

概率有向图模型

1、下图中使用概率的乘积规则将联合概率展开式为:
A、
B、
C、
D、

2、贝叶斯网络起源于贝叶斯统计学,是以_____为基础的有向图模型,它为处理不确定知识提供了有效的方法。
A、线性代数
B、逻辑学
C、概率论
D、信息论

3、基于搜索评分的方法,关键点在于
A、确定合适的搜索策略
B、确定搜索优先级
C、确定评分函数
D、确定选择策略

4、基于约束的方法通过统计独立性测试来学习结点间的
A、独立性
B、依赖性
C、完备性
D、相关性

5、在数据不完备时,贝叶斯网络的参数学习方法有:
A、高斯逼近
B、最大似然估计方法
C、蒙特卡洛方法
D、拉普拉斯近似

6、隐马尔可夫模型的三个基本问题是:
A、估值问题
B、状态更新
C、寻找状态序列
D、学习模型参数

7、下图是全连接图。

8、贝叶斯网络具有的条件独立性是结点与其后代结点条件独立

9、最大似然估计方法是实例数据不完备情况下的学习方法。

10、隐马尔可夫模型是一种统计模型,经常用来描述一个含有隐含未知参数的马尔可夫过程。

第八章 神经网络

神经网络

1、下列哪项说法不正确
A、人工智能是对人类智能的模拟
B、人工神经元是对生物神经元的模拟
C、生物神经信号由树突传递给轴突
D、人工神经元的激活函数可以有多种设计

2、下列哪项说法正确
A、异或问题中能找到一条直线正确划分所有点
B、随着自变量数目的增多,所有二值函数中线性可分函数的比例逐渐增大
C、如果一个神经网络结构里面有多个神经元,就一定能解决异或问题
D、通常一个神经元包括线性和非线性两种运算

3、通用近似定理说明
A、多层感知机可以做为函数近似器逼近任意函数
B、只需一个隐藏层的多层感知机就能作为通用函数近似器,因此没必要设计深层网络
C、给定隐藏层神经元,三层感知机可以近似任意从一个有限维空间到另一个有限维空间的Borel 可测函数
D、以上全不对

4、通常有哪几种训练神经网络的优化方法?
A、梯度下降法
B、随机梯度下降法
C、小批量随机梯度下降法
D、集成法

5、为什么循环神经网络可以用来实现自动问答,比如对一句自然语言问句给出自然语言回答?
A、因为自动问答可以看成是一种序列到序列的转换
B、因为循环神经网要比卷积神经网更强大
C、因为循环神经网络能够处理变长输入
D、因为卷积神经网络不能处理字符输入

6、LSTM和GRU网络因为引入了门控单元,可以缓解梯度消失问题

7、循环神经网络按时间展开后就可以通过反向传播算法训练了

8、卷积神经网络通常比全连接神经网络参数少,因此能力更差

9、训练算法的目的就是要让模型拟合训练数据

10、反向传播算法中需要先计算靠近输入层参数的梯度,再计算靠近输出层参数的梯度

第九章 强化学习

强化学习

1、强化学习基本要素有哪些?
A、状态、动作、奖励
B、状态、动作、折扣因子
C、动作、折扣因子、奖励
D、状态、奖励、探索策略

2、不需要建模环境,等待真实反馈再进行接下来的动作,这是哪种强化学习算法
A、Model-free方法
B、Model-based 方法
C、Policy-based 方法
D、Value-based 方法

3、Q-learning属于哪种算法
A、On-policy算法
B、Off-policy 算法
C、Model-based 算法
D、Value-based 算法

4、马尔科夫决策过程由哪几个元素来表示
A、状态、动作、转移概率、策略、折扣因子
B、状态、动作、转移概率、折扣因子、回报函数
C、状态、动作、输入、输出、回报函数
D、状态、动作、值、策略、回报函数

5、状态值函数的贝尔曼方程为
A、
B、
C、
D、

6、以下哪种算法是TD-learning的方法
A、
B、
C、
D、

7、关于episode说法错误的是
A、一个episode就是一个从起始状态到结束的经历
B、蒙特卡洛方法需要很少的episode就可以得到准确结果
C、TD方法每次更新不需要使用完整的episode
D、蒙特卡洛的方法需要等到整个episode结束才能更新

8、如果我们的机器(或智能体)每次训练更新的损耗会比较大,我们更倾向于选择哪种算法
A、Sarsa
B、Q-learning
C、两者都可以
D、两者都不行

9、关于策略梯度的方法说法正确的是
A、只适用于离散动作空间
B、适用于连续动作空间
C、策略梯度的方法与DQN中的目标函数一致
D、策略梯度的方法通过Q值挑选动作

10、以下关于蒙特卡洛方法描述正确的是
A、蒙特卡洛方法计算值函数可以采用First-visit方法
B、蒙特卡洛方法方差很大
C、蒙特卡洛方法计算值函数可以采用Every-visit 方法
D、蒙特卡洛方法偏差很大

11、在Q-learning中,以下说法正确的是
A、在状态时计算的,对应的动作并没有真正执行,只是用来更新当前Q值
B、在状态时计算的,同时也执行了动作
C、更新中,Q的真实值为
D、更新中,Q的真实值为

12、Sarsa与Q-learning的区别是?
A、Sarsa是off-policy,而Q-learning是on-policy
B、Sarsa是on-policy,而Q-learning是off-policy
C、Q-learning在算法更新时,对应的下一个动作并没有执行,而sarsa的下一个动作在这次更新时已经确定了
D、Q-learning是一种保守的算法,sarsa是一种贪婪勇敢的算法

13、Q-learning与Sarsa相同的地方是
A、都使用了等策略进行探索
B、都用q-table存储状态动作对
C、更新公式相同
D、两者都可以找到最优的策略

14、关于经验池(experience replay)叙述正确的是
A、为了缩小样本量,可以让样本输入到神经网络中
B、打破样本之间的连续性
C、每次更新时在经验池中按顺序采样样本
D、每次更新时随机采样样本

15、关于DQN说法正确的是
A、网络最开始使用卷积神经网络或全连接网络,目的是为了提取图像特征信息
B、对于atari游戏中,一般将连续4帧图像放在一起作为一个state送到神经网络中
C、网络的输出是动作
D、网络的输出是Q值

16、关于Double DQN说法正确的是
A、Q值的目标值中的max操作会产生过估计,从而影响找到最佳策略
B、Double DQN可以减小偏差
C、Double DQN的目标函数与DQN的完全相同
D、Double DQN引入了优势函数(advantage function)

17、以下哪种算法属于策略梯度算法
A、Dueling DQN
B、TRPO
C、REINFORCE
D、PPO

18、关于A3C算法说法正确的是
A、使用了多个线程,每个线程对应了不同的探索方式
B、需要使用经验池存储样本
C、A3C是off-policy的算法
D、A3C是on-policy的算法

19、以下属于Actor-Critic算法的是
A、DDPG
B、Double DQN
C、A3C
D、Noisy DQN

20、对于Actor-Critic算法,说法错误的是
A、Actor-Critic算法结合了policy-based和value-based的方法
B、Critic网络是用来输出动作的
C、Actor网络是用来输出动作的
D、Actor网络是用来评价Critic网络所选动作的好坏的

考试一

线性回归

1、线性回归

考试二

线性回归

1、线性回归

考试三

梯度下降

1、梯度下降

考试四

支持向量机

1、支持向量机

考试五

聚类

1、聚类

考试六

综合实验

1、综合实验提交

学习通机器学习初步(李侃)

机器学习是人工智能领域的重要分支,也是目前最热门的技术之一。学习通机器学习初步课程由李侃老师讲授,内容涵盖机器学习的基本概念、常用算法、实战案例等方面,对初学者来说是一门非常好的入门课程。

课程大纲

学习通机器学习初步课程共分为12个章节,具体内容如下:

  1. 课程概述
  2. 机器学习的基本概念
  3. 线性回归
  4. 逻辑回归
  5. 决策树
  6. 朴素贝叶斯
  7. 支持向量机
  8. 聚类算法
  9. 降维算法
  10. 集成学习
  11. 深度学习基础
  12. 实战案例

学习体验

学习通机器学习初步课程采用视频+文本相结合的方式进行授课,老师讲解清晰、简洁易懂,而且课程中穿插了大量实例,方便学生理解和掌握。此外,课程还设置了练习题和作业,可以帮助学生加深对知识点的理解和掌握程度。

收获与感想

通过学习通机器学习初步课程,我对机器学习有了更深入的认识,并且掌握了常见的机器学习算法。在实战案例中,我不仅学会了如何使用Python进行数据预处理和模型训练,还学会了如何对模型进行评估和优化。这些知识不仅能够应用于工作中,也可以帮助我更好地理解和应用人工智能技术。

总结

学习通机器学习初步课程是一门非常实用的课程,无论是对于初学者还是进阶者都是一门值得学习的课程。通过此课程的学习,可以让我们对机器学习有更深入的了解,并掌握常见的机器学习算法和实战技能,是一门非常值得推荐的课程。


图示减压回路中,单向阀在回路中起( )作用。

A.在CAD中多线可以直接倒角或倒圆。
B.设计可分为两类,当与现存作品关联,称为();当带来革\n命性的突破,称为()。
C.在验收测试中,应该( )。
D.关于公共艺术的描述,说法有误的是()。


cddb8298bce0454cb3736422d2d08e77.png

A.构建个人竞争力的优势“四力和一素质”主要是
B.人民内部矛盾不包括( )。
C.下面选项中属于词汇教学原则的是()
D.采用重置成本法评估二手车时,一般使用的是( )。


考古学对象是特定的,运河是不能作为考古学对象的()

A.下列选项中不符合萎缩特点的是
B.蒙古族民歌的旋律线条经常呈直线型。()
C.以下哪些路由表项要由网络管理员手动配置( )。
D.对多硫化物的性质不正确的叙述是( )


“spider”在搜索引擎中发挥什么功能

A.唯物史观认为,()是历史的创造者
B.电流互感器是可以使用小量程的电流表测量大电流的仪器。
C.Will Sue eat out with the man tonight
D.在总需求不变时,短期总供给的增加会使国民收入增加,价格水平下降。( )


下列哪个体内过程不需要转运体参与

A.雷竹的笋芽分化期主要在8-9月。
B.()是UFO与许冠文合作的喜剧。
C.以下选项中,企业上市的优势是()。
D.李自成于()年攻占北京。


演讲的( )能有效避免其成为空洞的说教,缺乏魅力。

A.不宜做青霉素过敏试验的是( )
B.角频率、频率和周期的关系是:/ananas/latex/p/377998
C.Mppl是以下哪一项指数
D.“天时地利人和”体现了自然规律和社会规律的相互联系。()


下面主视图,不正确的是( )。

A.有主次梁的楼板施工缝应留设在次梁跨度中间的1/3范围内。
B.9d7cbc75370b44fea9e0b5d559053df8.png
C.多高层钢结构抗震计算时,在水平地震作用下,则应考虑P–△效应。
D.税务审查是非组织监督管理的一个内容。()


母亲型领导方式可能减少对方对人情

A.凯恩斯的主要观点是不要干预市场。()
B.人体内O2、CO2和NH3进出细胞膜是通过
C.运动终板神经末稍释放的神经递质为( )
D.清明节习俗不包括( )。


对同一幅地图而言,矢量结构与栅格结构相比()。

A.查询结果集ResultSet对象是以统一的行列形式组织数据的,执行
B.汽车品牌进行事件策划的过程中要秉持哪些原则
C.被保险人在疾病或意外事故所致伤害时发生的费用或损失获得补偿的人身保险是
D.查阅资料,进一步理解include指令和jsp:include动作的区别。


风向是指风的去向,即由北吹向南的风则为南风。

A.对《大学》中“虑而后能得”中的“得”理解正确的是()。
B.gAAAABJRU5ErkJggg==
C.在 if-else if多分支结构中,有( )个分支语句被执行。
D.下列哪些选项属于文学风格( )


属于木本果树的树种有( )

A.良好的人际关系是心理健康的重要表现
B.发电机-变压器单元接线,变压器高压侧母线上短路时,短路电流冲击系数应取( )。
C.视觉隐喻是一种镜头修辞手法。
D.2.乡村人才振兴确保后继有人的几个途径( )。


戏剧的仪式性主要指的是舞台上演员的表演,与观众的观看没有直接的关系。

A.CSS是什么的缩写( )
B.亲密关系的发展依次分为( )阶段。
C.根据喷灌系统各组成部分可移动的程度,分成固定式、 和半固定式三种。
D.三叶虫在寒武纪海洋里处于食物链顶端。


在虚拟账户支付模式下,互联网支付服务商承担了收单、转接和发卡的全部功能。

A.下列出自《毛诗故训传》的观点是:
B.采用甲基橙指示剂进行酸度检查的方法属于
C.英式下午茶三层点心塔的食用顺序是()
D.夺取人民解放战争胜利的基本条件是:


天然珍珠贝(蚌)珍珠:珍珠光泽( )、形状不规则、颗粒细小、产量稀少。

A.由于有了自动化系统,他很快收集了很多信息。
B.二过一是属于进攻战术中的()
C.在一定条件下,某化学试剂杀死50%试验动物或微生物的剂量为( )。
D.采用ABC法对存货进行控制时,应当重点控制的是( )。



Ɣ回顶部