0.0887

五煦查题

快速找到你需要的那道考题与答案

超星机器学习与数据挖掘章节答案(学习通2023完整答案)

17 min read

超星机器学习与数据挖掘章节答案(学习通2023完整答案)

【第一周】数据分析之表示

单元测验

1、超星扩展库numpy中的机器arange()函数功能和内置函数range()类似,只能生成包含整数的学习学习数组,无法创建包含浮点数的数据数组。( )

2、挖掘表达式np.empty((3,章节整答5)).sum()的值一定为0。( )

3、答案扩展库numpy中的通完isclose()函数和allclose()函数用来测试两个数组是否严格相等。( )

4、超星扩展库numpy中的机器isclose()函数返回包含若干True/False值的数组,而allclose()函数返回True或False值。学习学习( )

5、数据扩展库numpy中的挖掘append()函数和insert()函数是在原数组的基础上追加或插入元素,没有返回值。章节整答( )

6、答案已知x是一个足够大的numpy二维数组,那么语句x[0,2]=4的作用是把行下标为0、列下标为2的元素值改为4。( )

7、已知x.shape的值为(3,5),那么语句x[:,3]=2的作用是把数组x所有行中列下标为3的元素值都改为2。( )

8、两个不等长的数组不能相加。( )

9、已知x和y是两个等长的一维数组,那么表达式x.dot(y)和sum(x*y)的值相等。( )

10、已知x=np.arange(30).reshape(5,6),那么语句x[[0,3],:]=0的功能为把数组x中行下标为0和3的所有元素值都修改为0。( )

11、数组的reshape()方法不能修改元素个数,resize()方法可以。( )

12、扩展库numpy中的corrcoef()函数用来计算相关系数矩阵。( )

13、扩展库numpy中的cov()函数可以用来计算协方差,std()函数用来计算标准差。( )

14、扩展库numpy的线性代数子模块linalg中提供了用来计算特征值与特征向量的eig()函数。( )

15、扩展库numpy的线性代数子模块linalg中提供了用来计算逆矩阵的inv()函数。( )

16、扩展库numpy的线性代数子模块linalg中提供了求解线性方程组的solve()函数和求解线性方程组最小二乘解的lstsq()函数。( )

17、扩展库numpy的线性代数子模块linalg中提供了用来计算不同范数的norm()函数。( )

18、扩展库numpy的线性代数子模块linalg中提供了计算奇异值分解的svd()函数。( )

19、使用pip命令在线安装扩展库numpy的完整命令是______。

20、使用np.arange(8)生成的数组中最后一个元素的值为______。

21、使用np.zeros((3,4))生成的数组中元素个数为______。

22、表达式np.ones((3,4)).sum()的值为______。

23、表达式len(np.random.randint(0,50,5))的值为______。

24、表达式all(np.random.rand(20000)<1)的值为______。

25、表达式np.diag((1,2,3,4)).shape的值为______。

26、表达式np.diag((1,2,3,4)).size的值为______。

27、表达式np.random.randn(3).shape的值为______。

28、表达式np.random.randn(3,4).shape的值为______。

29、已知x=np.array((1,2,3,4,5)),那么表达式(x*2).sum()的值为______。

30、已知x=np.array((1,2,3,4,5)),那么表达式(x**2).max()的值为______。

31、已知x=np.array((1,2,3,4,5)),那么表达式(2**x).max()的值为______。

32、已知x=np.array((1,2,3,4,5)),那么表达式(x//5).sum()的值为______。

33、已知x=np.array((1,2,3,4,5)),那么表达式sum(x*x)的值为______。

34、已知x=np.array([1,2,3])和y=np.array([[3],[4],[5]]),那么表达式(x*y).sum()的值为______。

35、已知x=np.array([3,5,1,9,6,3]),那么表达式np.argmax(x)的值为______。

36、已知x=np.random.randint(0,100,(3,5)),那么表达式np.ceil(abs(np.sin(x))).sum()的值为______。

37、已知x=np.array([3,5,1,9,6,3]),那么表达式x[x>5].sum()的值为______。

38、已知x=np.array([3,5,1,9,6,3]),那么表达式x[(x%2==0)&(x>5)][0]的值为_____。

39、已知x=np.array([3,5,1,9,6,3]),那么表达式np.where(x>5,1,0).sum()的值为______。

40、已知x=np.matrix([[1,2,3],[4,5,6]]),那么表达式x.mean(axis=0)的值为______。

41、已知x=np.matrix([1,2,3,4,5]),那么表达式x*x.T的值为______。

【第三周】数据分析之展示

单元测验

1、扩展库matplotlib.pylot中的什么函数是用来绘制折线图的()
A、plot()
B、scatter()
C、bar()
D、pie()

2、扩展库matplotlib.pylot中的什么函数是用来绘制散点图的()
A、polar()
B、scatter()
C、bar()
D、pie()

3、扩展库matplotlib.pylot中的什么函数是用来绘直方图的()
A、scatter()
B、polar()
C、bar()
D、pie()

4、扩展库matplotlib.pylot中的什么函数是用来绘制雷达图的()
A、pie()
B、scatter()
C、bar()
D、polar()

5、你想将折线图的颜色设定为黑色,需要设定plot()函数的中的参数为()
A、color = “b”
B、marker = “b”
C、color = “black”
D、visbile = “black”

6、你想将折线图的线形为点划线,需要设定plot()函数的中的参数为()
A、lw = “.-”
B、lw = “-.”
C、ls = “.-”
D、ls =“-.”

7、你想将线形为点划线的折线图中的点设定为三角形,你需要输入的程序为()
A、plt.plot(x,y,”-.D”)
B、plt.plot(x,y,”.-D”)
C、plt.plot(x,y,”-.v”)
D、plt.plot(x,y,”.-v”)

8、你想对坐标轴x轴进行标签文本设定,你需要设定()
A、plt.xlabel()
B、plt.ylabel()
C、plt.xtitle()
D、plt.ytitle()

9、你想绘制一个半透明的散点图,需要对scatter()函数中的什么参数进行设定()
A、marker
B、s
C、alpha
D、lw

10、你想绘制一个三点形状为三角形的散点图,需要对scatter()函数中的什么参数进行设定()
A、marker
B、s
C、alpha
D、lw

11、你想绘制一个直方图,要求每个柱的宽度为0.6,你需要设定的参数为()
A、hatch
B、color
C、linewideth
D、width

12、你想绘制一个直方图,要求每个柱上填充条纹,你需要设定的参数为()
A、hatch
B、color
C、linewideth
D、width

13、你想绘制一个饼状图,要求每个扇形以不同的程度偏离圆心,需要设定pie()函数中的参数()
A、autopct
B、radius
C、explode
D、color

14、你想要对一块绘图区域进行切分,需要使用的函数为()
A、splot()
B、subplot()
C、split()
D、splitplot()

15、你在绘制一张图之后,想要加入图例对你所绘制的符号和颜色进行说明,需要使用的函数为()
A、subplot()
B、legend()
C、figure()
D、gca()

16、你想对一张雷达图的角度标签进行设定,你需要使用函数()
A、plt.legend()
B、plt.thetagrids()
C、plt.xlable()
D、plt.ylable()

17、你想绘制一张三维曲面,你可以使用函数()
A、plot_surface()
B、bar3d
C、scatter()
D、plot()

18、你想绘制一张三维柱状图,你可以使用函数()
A、plot_surface()
B、bar3d
C、scatter()
D、bar()

19、你想绘制一张三维散点图,你可以使用函数()
A、plot_surface()
B、bar3d
C、scatter()
D、bar()

20、你绘制了一张折线图,相对某个点进行文本标注,需要使用函数()
A、plt.annotate()
B、plt.legend()
C、plt.title()
D、plt.ylable()

21、Python扩展库matplotlib主要包括pylab、pyplot等绘图模块以及大量用于字体、颜色、图例等图形元素的管理与控制的模块。

22、使用pylab或pyplot绘图的一般过程为:首先读入数据,然后根据实际需要绘制折线图、散点图、柱状图、饼状图、雷达图或三维曲线和曲面,接下来设置坐标轴标签、坐标轴刻度、图例、标题等图形属性,最后显示或保存绘图结果。

23、扩展库matplotlib.pyplot中的函数plot()用来绘制折线图,可以通过参数指定折线图上点的位置、标记符号以及线条的颜色、线型,然后使用指定的格式把给定的点依次进行连接。如果给定的点足够密集,可以形成光滑曲线的效果。

24、扩展库matplotlib.pyplot中的函数scatter()不能根据指定的数据绘制散点图。

25、扩展库matplotlib.pyplot中的函数bar()可以用来根据指定的数据绘制柱状图。

26、扩展库matplotlib.pyplot中的pie()函数可以用来根据指定的数据绘制饼状图。

27、扩展库matplotlib.pyplot中的polar()函数可以用来根据指定的数据绘制雷达图。

28、在默认情况下,matplotlib会使用整个绘图区域进行图形绘制,绘制的多个图形会叠加并使用同一套坐标系统。但有时会需要把整个绘图区域切分成多个子区域(或轴域),在不同的子区域中绘制不同的图形,每个子区域使用独立的坐标系统。扩展库matplotlib.pyplot的函数subplot()可以用来切分绘图区域和创建子图。

29、如果要绘制三维图形,首先需要使用语句from mpl_toolkits.mplot3dimportAxes3D导入相应的对象,然后使用ax=fig.gca(projection='3d')或ax=plt.subplot(111,projection='3d')声明要创建三维子图,接下来就可以使用ax的plot()方法绘制三维曲线、plot_surface()方法绘制三维曲面、scatter()方法绘制三维散点图,但不能使用bar3d()方法绘制三维柱状图了。

30、扩展库matplotlib.pyplot的函数legend()用于设置当前子图的图例样式并在当前子图中显示图例,如果有多个子图的话可以使用gca()函数首先选择子图,或者使用子图对象直接调用legend()函数。

31、如果需要对特定的键盘或鼠标进行响应和处理,需要首先定义事件处理函数,然后使用画布对象(canvas)的mpl_connect(s,func)方法创建事件与事件处理函数之间的对应关系,其中参数s表示事件处理函数,func表示事件。

32、扩展库matplotlib.pyplot的函数fill()可以用来绘制填充的多边形,函数plt.fill_and()可以用来填充两条曲线之间的多边形区域。

33、如果需要把matplotlib.pyplot绘制的图形保存为图片文件,可以调用matplotlib.pyplot.show()函数显示图片之后点击按钮保存,也可以在程序中直接调用matplotlib.pyplot.savefig()函数。

34、雷达图也称作极坐标图、星图、蜘蛛网图,常用于企业经营状况的分析,可以直观地表达企业经营状况全貌,便于企业管理者及时发现薄弱环节进行改进,也可以用于发现异常值。

35、在绘制三维图形时,至少需要指定x、y、z3个坐标轴的数据,然后再根据不同的图形类型指定额外的参数设置图形的属性。

【第二周】数据分析之概要

单元测验

1、Series是pandas提供的一维数组,由索引和值两部分组成,可以包含不同类型的值,如果在创建时没有明确指定索引,则会自动使用从1开始的正整数作为索引。

2、时间序列对象主要使用pandas的date_range()函数生成,可以指定日期时间的起始和结束范围、时间间隔和数据数量等参数。

3、DataFrame是pandas最常用的数据结构之一,每个DataFrame对象可以看作一个二维表格,由索引(index)、列名(columns)和值(values)三部分组成。

4、在分析数据时,有时需要查看数据的数量、平均值、标准差、最大值、最小值、四分位数等特征,DataFrame结构对于这些操作并不支持。

5、DataFrame结构支持sort_index_()方法沿某个方向按标签进行排序。

6、DataFrame结构不支持sort_values_()方法根据值进行排序。

7、DataFrame结构支持使用groupby()方法根据指定的一列或多列的值进行分组,得到一个GroupBy对象。该GroupBy对象支持大量方法对列数据进行求和、求均值和其他操作,并自动忽略非数值列,在数据分析时经常使用。

8、DataFrame结构支持使用agg()方法对指定列进行聚合,但不允许不同列使用不同的聚合函数。

9、DataFrame结构支持使用dropna()方法丢弃带有缺失值的数据行,或者使用fillna()方法对缺失值进行批量替换,但是不可以使用loc()、iloc()方法直接对符合条件的数据进行替换。

10、DataFrame结构的duplicated()方法可以用来检测哪些行是重复的,drop_duplicates()方法用来删除重复的数据。

11、DataFrame结构的diff()方法支持数据差分算法,返回新的DataFrame。

12、如果DataFrame结构中索引是日期时间数据,或者包含日期时间数据列,可以使用resample()方法进行重采样。

13、DataFrame结构的std()方法可以计算标准差,cov()方法可以计算协方差。

14、DataFrame结构的plot()方法并不能直接绘制折线图、柱状图、饼状图等各种形状的图形来展示数据,也无法自动调用扩展库matplotlib的功能。

15、DataFrame结构的memory_usage()方法可以查看内存占用情况,返回一个Series对象。

16、导入一个名为df 的数据框(DataFrame)后,计算每个不同种类animal的age的平均数的指令为df.groupby('animal')['age'].mean()

17、扩展库pandas支持使用不同的方式创建DataFrame结构,也支持使用read_csv()、read_excel()、read_json()、read_hdf()、read_html()、read_gbq()、read_pickle()、read_sql_table()、read_sql_query()等函数从不同的数据源读取数据创建DataFrame结构,同时也提供对应的to_excel()、to_csv()等系列方法将数据写入不同类型的文件。

18、透视表通过聚合一个或多个键,把数据分散到对应的行和列上,是数据分析常用的技术之一。DataFrame结构提供了pivot()方法和pivot_table()方法来实现透视表所需要的功能,返回新的DataFrame。

19、交叉表是一种特殊的透视表,往往用来统计频次,也可以使用参数aggfunc指定聚合函数从而实现其他功能。扩展库pandas提供了crosstab()函数用来生成交叉表,返回新的DataFrame。

20、指令df['priority'] = df['priority'].map({ 'yes': True, 'no': False})可以将一个名为df 的数据框中priority列中的yes, no替换为布尔值True, False

21、导入 Pandas 库并简写为 pd的完整命令是______

22、导入Pandas为pd后从字典d创建名为df的 Series的完整命令是____

23、导入一个名为df 的数据框(DataFrame)后,对其进行描述性统计的指令为________

24、导入一个名为df 的数据框(DataFrame)后,展示df的前几行的指令为________

25、导入一个名为df 的数据框(DataFrame)后,展示df的后几行的指令为________

26、时间序列对象一般使用pandas的__________函数生成

27、导入一个名为df 的数据框(DataFrame)后,删除其缺失值的指令_________

28、导入一个名为df 的数据框(DataFrame)后,删除其重复值的指令______

29、导入一个名为df 的数据框(DataFrame)后,计算其协方差的指令 ______

30、导入一个名为df 的数据框(DataFrame)后,计算其标准差的指令________

31、导入一个名为df 的数据框(DataFrame)后,取出age值大于3的行的指令______

32、导入一个名为df 的数据框(DataFrame)后,取出age在2,4间的行(不含第2,4行)的指令为_____

33、导入一个名为df 的数据框(DataFrame)后,计算df中每个种类animal的数量的指令_______

34、导入一个名为df 的数据框(DataFrame)后,按age降序排列______