0.078

五煦查题

快速找到你需要的那道考题与答案

moocR语言数据分析实践(佟强)章节答案(mooc2023课后作业答案)

68 min read

moocR语言数据分析实践(佟强)章节答案(mooc2023课后作业答案)

第2讲 初识向量

第2讲 初识向量

1、语言数业答下列哪个运算符是据分践佟节答求余数的运算符?
A、%
B、析实%%
C、强章%/%
D、案m案%in%

2、后作已知向量 height <- c(162,语言数业答180,170,168),any(height>180)的据分践佟节答结果是?
A、TRUE
B、析实FALSE
C、强章FALSE FALSE FALSE FALSE
D、案m案FALSE TRUE FALSE FALSE

3、后作rep(11:13,语言数业答times=2:4)的结果是?
A、11 12 13 11 12 13
B、据分践佟节答11 11 12 12 13 13
C、析实11 11 12 12 12 13 13 13 13
D、11 11 11 11 12 12 12 13 13

4、score.tony可以作为R语言中的合法的对象名。

5、length("Shanghai")的结果是8,表示字符串由8个字符构成。

第3讲 向量索引与常用函数

第3讲 向量索引与常用函数

1、已知字符串向量: stu <- c("张三;李四;赵二;王一","Tony,Lisa,Mary") 下个哪个语句可以将字符串向量中的全部姓名分开?
A、strsplit(stu,split=";")
B、strsplit(stu,split=",")
C、strsplit(stu,split=c(";", ","))
D、strsplit(stu,split=c(",", ";"))

2、已知数值型向量: data <- c(82,75,96,68,80),下列哪个表达式填入问号位置可以得到降序排列的数据? data[?]
A、sort(data)
B、sort(data, decreasing=T)
C、order(data, decreasing=T)
D、rev(data)

3、在R语言中,通常有NA参与运算时结果还是NA,例如NA & FALSE和NA | TRUE的结果都是NA。

4、R语言支持复数运算,例如sqrt(16+12i)和sqrt(-49)的结果就是有效的复数。

5、辅导员想从5位报名当志愿者的同学中选出2位同学,第1位同学的编号是1,第2位同学的编号是2,..., 第5位同学的编号是5,可以使用语句【 】列出全部可能,结果中显示各个同学的编号。

第4讲 矩阵

第4讲 矩阵

1、已知矩阵 A <- matrix(1:16,nrow=4),哪个选项可以得到如下矩阵? 1 0 0 0 0 6 0 0 0 0 11 0 0 0 0 16
A、diag(A)
B、diag(A) <- c(1,6,11,16)
C、diag(diag(A))
D、A[lower.tri(A)] <- 0

2、构建矩阵person的代码如下: height <- sample(155:185,20,replace=T) #身高 weight <- sample(45:90,20,replace=T) #体重 sex <- sample(0:1,20,replace=T) #0表示女 1表示男 person <- cbind(ID=1:20,height,weight,sex) 下列哪个语句可以将身高大于180(包含)的男生选取出来?
A、person[person[,"sex"]==1 & person[,"height"]>180, ]
B、person[person[,"sex"]==1 & person[,"height"]>=180, ]
C、person[person[,"sex"]==1 && person[,"height"]>=180, ]
D、person[person[,"sex"]==0 & person[,"height"]>=180,]

3、下列哪个语句是在计算向量x和向量y的內积?
A、crossprod(x,y)
B、tcrossprod(x,y)
C、x %o% y
D、x * y

4、dim()函数用于获得对象的维度,例如dim(11:20)的结果是10。

5、rbind()函数返回的对象的类(class)可能是matrix,也可能是data.frame。

第5讲 数据结构

第5讲 数据结构

1、A是一个3层4行5列的三维数组,下列那个表达式可以获取数组中第2层第3行第4列的元素?
A、A[2,3,4]
B、A[1,2,3]
C、A[3,4,2]
D、A[2][3][4]

2、下列那个表达式可以获得数据框x中的前5行数据?
A、x[, 1:5]
B、head(x)
C、head(x,n=5)
D、nrow(x)

3、关于以下语句产生的结果,描述正确的是? with(mtcars,{ boxplot(mpg~cyl,col=rainbow(3)) })
A、绘制一个柱形图,反应不同气缸数的汽车一加仑汽油行驶的平均里程。
B、绘制箱体图,4缸、6缸、8缸分别绘制一个箱体,每个箱体中包含对应气缸数的汽车一加仑汽油行驶里程数的最小值、下四分位数、中位数、上四分位数和最大值。
C、绘制一个箱体图,反映了全部汽车一加仑汽油行驶里程数的最小值、下四分位数、中位数、上四分位数和最大值。
D、运行错误,提示mpg和cyl是找不到的对象。

4、R语言中的数组(Array)可以是一维的。

5、x是一个列表(list),x[3]可获取列表中的第3个组件,得到的是一个向量。

第2-5讲综合练习

1、判断题(共12题,每题5分): 1. R语言中的对象名称不区分大小写。 2. 超赋值运算符<<-与一般赋值运算符<-作用是相同的,可以互相替代。 3. 使用nchar(a)可以获得字符串向量a的长度。 4. 若n<-10,则1:n-1=1:9。 5. 函数paste0(a,b)与paste(a,b,sep="")具有一样的效果。 6. 向量索引函数若传递的逻辑型向量长度小于原向量,将进行循环补齐。 7. 向量索引函数与subset函数在效果上没有区别。 8. 集合函数setequal(c(1,2,3),c(1,2,1,3))返回值是TRUE。 9. 缺失值NA与任何值作运算都会得到返回值NA。 10. 函数nrow()和NROW()在效果上没有区别。 11. 在对数据框增加行的时候,可以将新的行组织成数据框或者列表进行传递。 12. 使用unlist()将包含数值型和字符型组件的列表转换成向量,返回值为数值型。 (注:判断正确(T)或错误(F),请写出题号和对应的判断(T/F)。)

2、单项选择题(共8题,每题5分): 1. 对于一个字符串型的变量,如果赋值内容中包含双引号,即赋值为"xxx",应该使用如下哪种赋值? A. "xxx"; B. "\'xxx\'"; C. '"xxx"'; D. ""xxx"" 2. 假设a <- c(1,2,3),则以下哪个运算不能获得向量a的长度? A. sqrt(a*a); B. sqrt(a%*%a); C. norm(a,type="2"); D. sqrt(sum(a^2)) 3. 下列哪个操作能够实现对向量x中元素的降序排列? A. sort(x); B. rev(sort(x)); C. x[order(x)]; D. sort(x[order(x,decreasing=T)]) 4. 对向量x而言,以下哪个论断是正确的? A. rbind()把参数变量按列拼成一个大矩阵,两个数组(或向量)的行数必须相等; B. cbind()把参数变量按行拼成一个大矩阵,两个数组(或向量)的列数必须相等; C. x[x>=2 & x<=7]实现了对x的第2到第7共6个元素的索引; D. 对于一个(n+1)维向量x来说,x[n+1]和x[-(1:n)]均能实现对x的第(n+1)个元素的索引。 5. 在R4.0.0以前的版本中,创建数据框函数会将字符型变量自动转换成因子型。数据框c由两个字符型变量a和b构成,如果希望在生成的数据框中,a保持字符型,b改为因子型,如下哪个创建命令是不正确的? A. c<-data.frame(a,b); c$a<-as.character(c$a); B. c<-data.frame(a,b,stringsAsFactor=F); c$b<-as.factor(c$b); C. c<-data.frame(a,b,stringsAsFactor=F); c$b<-factor(c$b); D. c<-data.frame(a,b,stringsAsFactor=F) 6. 在对数据框x的索引中,如果想要索引第3列(名称为price),下列哪个操作是错误的? A. x[[3]]; B. x[3,]; C. x[,3]; D. x$price 7. 以下哪个命令可以得到由列表x的第2和第3个组件构成的列表? A. x[c(2,3)]; B. x[2,3]; C. x[[c(2,3)]]; D. c(x[[2]],x[[3]]) 8. 若想要将两个列表a和b合并成一个向量,下面哪个操作是不正确的? A. c(a,b, recursive=T); B. unlist(c(a,b)); C. c(unlist(a),unlist(b)); D. c(a,b); (注:每题有且仅有一个正确选项,请写出题号和对应的答案(A/B/C/D)。)

第6讲 R编程基础

第6讲 R编程基础

1、已知数值向量向量x和y,求x[i]和y[i]中较大的,得到向量z,下列哪个语句不能实现? x<-c(5,2,9,7,1) y<-c(6,3,4,8,0)
A、z <- pmax(x,y)
B、z <- ifelse(x>y,x,y)
C、z <- if(x>y) x else y
D、z<-y; z[x>y]<-x[x>y]

2、下面R代码的运行结果是? i<-1 while(i<=10){ if(i%%2==0) next cat(i," ") i<-i+1 }
A、1 2 3 4 5 6 7 8 9 10
B、1 3 5 7 9
C、2 4 6 8 10
D、输出1后陷入死循环

3、关于R语言的函数,下列描述错误的是?
A、R语言的函数主体可以没有花括号
B、return语句的作用是从函数返回,return 0执行时函数的返回值是0
C、默认函数最后执行的一个表达式的结果为函数的返回值
D、调用R函数时,参数传递的顺序可以和函数参数表的顺序不同

4、continue语句用于结束循环的当前迭代开始下一轮迭代。

5、在R语言中,函数也是对象,用户定义的函数是使用function()函数创建的对象。

编程基础作业1

1、恺撒密码是古罗撒大帝用来对军事情报进行加解密的算法,它采用了替换方法对信息中的每一个英文字符循环替换为字母表序列中该字符后面的第三个字符,即,字母表的对应关系如下:???????????????????????????????????????????????? 原文:A B C D E F G H I J K L M N O P Q R S T U V W X Y Z???????????????????????????????????????????????? 密文:D E F G H I J K L M N O P Q R S T U V W X Y Z A B C???????????????????????????????????????????????? 对于原文字符P,其密文字符C满足如下条件:C=(P+3) mod 26???????????????????????????????????????????????? 上述是凯撒密码的加密方法,解密方法反之,即:P=(C-3) mod 26???????????????????????????????????????????????? 假设用户可能使用的输入包含大小写字母a~z、A~Z、空格和特殊符号,请编写一个程序,对输入字符串分别实现恺撒密码加密和解密,直接输出结果,其中空格和特殊符号均不用进行加密处理。使用input()获得输入。 请将你的脚本文件作为附件上传提交。

第7-8讲 apply函数族与相关函数

apply函数族作业

1、判断题(直接在答题区写答案,例如:TFTFTF) 1. cat函数只能连接数值型对象。 2. c(T,T,F) && c(T,F,T)的运行结果是c(T,F,F)。 3. if语句只能处理对标量的逻辑判断。 4. R语言中的next语句用来跳过当前循环,break语句用来结束整个循环。 5. apply函数中传递自定义的函数必须要有函数名。 6. tapply在应用length函数时与直接使用table函数的效果有所区别。

2、请编写R语言代码实现如下操作,将脚本文件压缩成.zip文件作为附件上传: 1. 随机从正态分布N(x|175, 10)中生成一组10个男生的身高,随机从均匀分布Unif(158,172)中生成一组15个女生的身高,并对身高四舍五入取整。 2. 将得到的男女生身高数据随机混合成一个身高向量,将对应的性别也相应地随机混合成一个向量。 3. 在所得到的新向量的基础上,根据不同性别,分别使用tapply函数rowsum函数求平均身高。 4. 按照性别不同,将男女生的身高向量作为不同的组件,构成列表,并在该列表上使用lapply函数得到不同性别的平均身高,并将结果转换成向量。 5. 使用vapply函数,采用匿名函数的方式,实现与4中要求相同的数据操作,并四舍五入所得数据,使得输出向量的数据类型为整数。

第10讲 读写文件

第十一讲 综合练习题

1、阴影面积计算

词频统计练习题

1、作业要求见附件。

模拟考试2

数据分析

1、数据分析题:词频统计,请按照附件中数据分析要求和对应的数据集作答,在本机上R编译环境中完成代码,可以在源代码中添加适当文字注释,答题完成后,将源代码复制粘贴到答题文本框中提交。

模拟考试

单选题

1、R语言中创建矩阵的函数是:
A、matrix( )
B、array( )
C、array( ) 和 matrix( )
D、data.frame( )

2、下面命令中的哪个或哪些可以从工作空间中移除R对象或变量"santa"?
A、remove(santa)
B、rm(santa)
C、都可以
D、都不对

3、下列哪一命令能帮助我们将下列数据中所有Delhi换成Delhi_NCR ? C<-c("Delhi is","a great city.","Delhi is also","the capital of India.")
A、gsub("Delhi","Delhi_NCR",C)
B、sub("Delhi","Delhi_NCR",C)
C、都可以
D、都不对

4、V1 V2 1 121.5 461 2 516 1351 3 451 6918 4 613 112 5 112.36 230 6 25.23 1456 7 12 457 dataframe R语言中已读取了一个数据集并存储在变量"dataframe"中。下列哪行代码可以实现整个数据集的总结(平均数、中位数、众数)?
A、summary(dataframe)
B、stats(dataframe)
C、summarize(dataframe)
D、都不对

5、Column 1 Column 2 Column 3 Row 1 15.5 14.12 69.5 Row 2 18.6 56.23 52.4 Row 3 21.4 47.02 63.21 Row 4 36.1 56.63 36.12 File Name - Dataframe.csv 下列哪行代码将只读取csv文件中的前两行?
A、read.csv('Dataframe.csv',header=TRUE,row.names=1,sep=',',nrows=2)
B、read.csv2('Dataframe.csv',row.names=1,nrows=2)
C、read.delim2('Dataframe.csv',header=T,row.names=1,sep=',',nrows=2)
D、read.dataframe('Dataframe.csv',header=TRUE,row.names=1,sep=',',skip.last=2)

简答题与数据分析

1、简答题:使用for循环输出1至100之间的能够被3或5整除的数,并求和。

2、简答题:什么是置换函数?请举例说明。

3、数据分析题:成绩统计,请按照附件中数据分析要求和对应的数据集作答,在本机上R编译环境中完成代码,可以在源代码中添加适当文字注释,答题完成后,将源代码复制粘贴到答题文本框中提交。

4、数据分析题:词频统计,请按照附件中数据分析要求和对应的数据集作答,在本机上R编译环境中完成代码,可以在源代码中添加适当文字注释,答题完成后,将源代码复制粘贴到答题文本框中提交。

期末考试

R语言期末考试

1、下列哪行代码将不能给出每一列的缺失值? dataframe A 10 Sam B NA Peter C 30 Harry D 40 NA E 50 Mark
A、colSums(is.na(dataframe))
B、apply(is.na(dataframe),2,sum)
C、sapply(dataframe,function(x) sum(is.na(x))
D、table(is.na(dataframe))

2、一个数据集包含两列,如果希望知道其中一列的哪些元素不存在于另一列中。这在R中使用setdiff命令很容易实现。 Column1 Column2 Column3 Column4 Column5 Column6 Name1 Alpha 12 24 54 0 Zion Name2 Beta 16 32 51 1 Beta Name3 Alpha 52 104 32 0 Gamma Name4 Beta 36 72 84 1 Delta Name5 Beta 45 90 32 0 Phi Name6 Alpha 12 24 12 0 Zeta Name7 Beta 32 64 64 1 Sigma Name8 Alpha 42 84 54 0 Mu Name9 Alpha 56 112 31 1 Eta Dataframe 下列命令的输出结果是: setdiff(dataframe$Column1,dataframe$Column6)==setdiff(dataframe$Column6,dataframe$Column1)
A、TRUE
B、FALSE
C、FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
D、Alpha

3、A 10 Sam B 20 Peter C 30 Harry D ! ? E 50 Mark File Name - Dataframe.csv 上述csv文件中缺失的值被感叹号("!")和问号("?")所代替。 下列哪行代表可以正确将上述csv文件读取进R语言?
A、read.csv('Dataframe.csv')
B、read.csv('Dataframe.csv',header=FALSE, sep=',',na.strings=c('?'))
C、read.csv2('Dataframe.csv',header=FALSE,sep=',',na.strings=c('?','!'))
D、read.dataframe('Dataframe.csv')

4、上述数据集已经加载进了R运行空间中,变量名为"dataframe",第一行代表列名称。 以下哪个代码将仅选择参数为Alpha的行? dataframe Parameter State Value Dependents Alpha Active 50 2 Beta Active 45 5 Beta Passive 25 0 Alpha Passive 21 0 Alpha Passive 26 1 Beta Active 30 2 Beta Passive 18 0
A、subset(dataframe, Parameter='Alpha')
B、subset(dataframe, Parameter=='Alpha')
C、filter(dataframe,Parameter=='Alpha')
D、filter(dataframe,Parameter='Alpha')

5、下列哪个语句能将"because"都替换成"since"? A<-c("I can use because thrice in a sentence because because is a special word.")
A、gsub("because","since",A)
B、sub("because","since",A)
C、regexec("because","since",A)
D、都不对

6、 下列哪个函数能够用于创建上文所示的图?
A、xyplot()
B、stripplot()
C、barchart()
D、barplot()

7、假设有2个数据框"A"和"B"。A有34行,B有46行。运行以下命令后,所得数据框的行数是多少? merge(A,B,all.x=TRUE)
A、46
B、12
C、34
D、1564

8、命令paste(1:3,c("x","y","z"),sep ="")的输出是什么?
A、[1 2 3x y z]
B、[1:3x y z]
C、[1x 2y 3z]
D、都不对

9、下面命令行的输出是 A<-paste("alpha","beta","gamma",sep=" " ) B<-paste("phi","theta","zeta",sep="") parts<-strsplit(c(A,B),split=" ") parts[[1]][2]
A、alpha
B、beta
C、gamma
D、theta

10、下列哪个命令能将数据框"table"的第二列名称由alpha改成beta
A、colnames(table)[2]='beta'
B、colnames(table)[which(colnames=='alpha')]='beta'
C、setnames(table,'alpha','beta')
D、其它选项都可以

简答与数据分析

1、简答题: 现有6名患者的身高和体重,检验体重除以身高的平方的值,并输出这些值. 编号 1 2 3 4 5 6 身高m 1.75 1.80 1.65 1.90 1.74 1.91 体重kg 60 72 57 90 95 72 将源代码复制粘贴到答题文本框中提交。

2、简答题: 使用for循环输出1至100之间的能够被3或5整除的数,并求和。 将源代码复制粘贴到答题文本框中提交。

3、简答题: 找出100次产生的长度为100,mean=1,sd=1的正态分布随机向量的最小值与出现位置的关系(用plot( )函数作图)。 将源代码复制粘贴到答题文本框中提交。

4、简答题: 什么是置换函数?请举例说明 将源代码复制粘贴到答题文本框中提交。

5、数据分析题: 成绩分析,请按照附件中数据分析要求和对应的数据集作答,在本机上R编译环境中完成代码,可以在源代码中添加适当文字注释,答题完成后,将源代码复制粘贴到答题文本框中提交。

6、数据分析题: 航班信息分析,请按照附件中数据分析要求和对应的数据集作答,在本机上R编译环境中完成代码,可以在源代码中添加适当文字注释,答题完成后,将源代码复制粘贴到答题文本框中提交。

7、数据分析题: 波士顿房价分析,请按照附件中数据分析要求和对应的数据集作答,在本机上R编译环境中完成代码,可以在源代码中添加适当文字注释,答题完成后,将源代码复制粘贴到答题文本框中提交。

8、数据分析题: 文本分析,请按照附件中数据分析要求和对应的数据集作答,在本机上R编译环境中完成代码,可以在源代码中添加适当文字注释,答题完成后,将源代码复制粘贴到答题文本框中提交。

模拟考试2

数据分析

1、数据分析题:词频统计,请按照附件中数据分析要求和对应的数据集作答,在本机上R编译环境中完成代码,可以在源代码中添加适当文字注释,答题完成后,将源代码复制粘贴到答题文本框中提交。

模拟考试

单选题

1、R语言中创建矩阵的函数是:
A、matrix( )
B、array( )
C、array( ) 和 matrix( )
D、data.frame( )

2、下面命令中的哪个或哪些可以从工作空间中移除R对象或变量"santa"?
A、remove(santa)
B、rm(santa)
C、都可以
D、都不对

3、下列哪一命令能帮助我们将下列数据中所有Delhi换成Delhi_NCR ? C<-c("Delhi is","a great city.","Delhi is also","the capital of India.")
A、gsub("Delhi","Delhi_NCR",C)
B、sub("Delhi","Delhi_NCR",C)
C、都可以
D、都不对

4、V1 V2 1 121.5 461 2 516 1351 3 451 6918 4 613 112 5 112.36 230 6 25.23 1456 7 12 457 dataframe R语言中已读取了一个数据集并存储在变量"dataframe"中。下列哪行代码可以实现整个数据集的总结(平均数、中位数、众数)?
A、summary(dataframe)
B、stats(dataframe)
C、summarize(dataframe)
D、都不对

5、Column 1 Column 2 Column 3 Row 1 15.5 14.12 69.5 Row 2 18.6 56.23 52.4 Row 3 21.4 47.02 63.21 Row 4 36.1 56.63 36.12 File Name - Dataframe.csv 下列哪行代码将只读取csv文件中的前两行?
A、read.csv('Dataframe.csv',header=TRUE,row.names=1,sep=',',nrows=2)
B、read.csv2('Dataframe.csv',row.names=1,nrows=2)
C、read.delim2('Dataframe.csv',header=T,row.names=1,sep=',',nrows=2)
D、read.dataframe('Dataframe.csv',header=TRUE,row.names=1,sep=',',skip.last=2)

简答题与数据分析

1、简答题:使用for循环输出1至100之间的能够被3或5整除的数,并求和。

2、简答题:什么是置换函数?请举例说明。

3、数据分析题:成绩统计,请按照附件中数据分析要求和对应的数据集作答,在本机上R编译环境中完成代码,可以在源代码中添加适当文字注释,答题完成后,将源代码复制粘贴到答题文本框中提交。

4、数据分析题:词频统计,请按照附件中数据分析要求和对应的数据集作答,在本机上R编译环境中完成代码,可以在源代码中添加适当文字注释,答题完成后,将源代码复制粘贴到答题文本框中提交。

期末考试

R语言期末考试

1、下列哪行代码将不能给出每一列的缺失值? dataframe A 10 Sam B NA Peter C 30 Harry D 40 NA E 50 Mark
A、colSums(is.na(dataframe))
B、apply(is.na(dataframe),2,sum)
C、sapply(dataframe,function(x) sum(is.na(x))
D、table(is.na(dataframe))

2、一个数据集包含两列,如果希望知道其中一列的哪些元素不存在于另一列中。这在R中使用setdiff命令很容易实现。 Column1 Column2 Column3 Column4 Column5 Column6 Name1 Alpha 12 24 54 0 Zion Name2 Beta 16 32 51 1 Beta Name3 Alpha 52 104 32 0 Gamma Name4 Beta 36 72 84 1 Delta Name5 Beta 45 90 32 0 Phi Name6 Alpha 12 24 12 0 Zeta Name7 Beta 32 64 64 1 Sigma Name8 Alpha 42 84 54 0 Mu Name9 Alpha 56 112 31 1 Eta Dataframe 下列命令的输出结果是: setdiff(dataframe$Column1,dataframe$Column6)==setdiff(dataframe$Column6,dataframe$Column1)
A、TRUE
B、FALSE
C、FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
D、Alpha

3、A 10 Sam B 20 Peter C 30 Harry D ! ? E 50 Mark File Name - Dataframe.csv 上述csv文件中缺失的值被感叹号("!")和问号("?")所代替。 下列哪行代表可以正确将上述csv文件读取进R语言?
A、read.csv('Dataframe.csv')
B、read.csv('Dataframe.csv',header=FALSE, sep=',',na.strings=c('?'))
C、read.csv2('Dataframe.csv',header=FALSE,sep=',',na.strings=c('?','!'))
D、read.dataframe('Dataframe.csv')

4、上述数据集已经加载进了R运行空间中,变量名为"dataframe",第一行代表列名称。 以下哪个代码将仅选择参数为Alpha的行? dataframe Parameter State Value Dependents Alpha Active 50 2 Beta Active 45 5 Beta Passive 25 0 Alpha Passive 21 0 Alpha Passive 26 1 Beta Active 30 2 Beta Passive 18 0
A、subset(dataframe, Parameter='Alpha')
B、subset(dataframe, Parameter=='Alpha')
C、filter(dataframe,Parameter=='Alpha')
D、filter(dataframe,Parameter='Alpha')

5、下列哪个语句能将"because"都替换成"since"? A<-c("I can use because thrice in a sentence because because is a special word.")
A、gsub("because","since",A)
B、sub("because","since",A)
C、regexec("because","since",A)
D、都不对

6、 下列哪个函数能够用于创建上文所示的图?
A、xyplot()
B、stripplot()
C、barchart()
D、barplot()

7、假设有2个数据框"A"和"B"。A有34行,B有46行。运行以下命令后,所得数据框的行数是多少? merge(A,B,all.x=TRUE)
A、46
B、12
C、34
D、1564

8、命令paste(1:3,c("x","y","z"),sep ="")的输出是什么?
A、[1 2 3x y z]
B、[1:3x y z]
C、[1x 2y 3z]
D、都不对

9、下面命令行的输出是 A<-paste("alpha","beta","gamma",sep=" " ) B<-paste("phi","theta","zeta",sep="") parts<-strsplit(c(A,B),split=" ") parts[[1]][2]
A、alpha
B、beta
C、gamma
D、theta

10、下列哪个命令能将数据框"table"的第二列名称由alpha改成beta
A、colnames(table)[2]='beta'
B、colnames(table)[which(colnames=='alpha')]='beta'
C、setnames(table,'alpha','beta')
D、其它选项都可以

简答与数据分析

1、简答题: 现有6名患者的身高和体重,检验体重除以身高的平方的值,并输出这些值. 编号 1 2 3 4 5 6 身高m 1.75 1.80 1.65 1.90 1.74 1.91 体重kg 60 72 57 90 95 72 将源代码复制粘贴到答题文本框中提交。

2、简答题: 使用for循环输出1至100之间的能够被3或5整除的数,并求和。 将源代码复制粘贴到答题文本框中提交。

3、简答题: 找出100次产生的长度为100,mean=1,sd=1的正态分布随机向量的最小值与出现位置的关系(用plot( )函数作图)。 将源代码复制粘贴到答题文本框中提交。

4、简答题: 什么是置换函数?请举例说明 将源代码复制粘贴到答题文本框中提交。

5、数据分析题: 成绩分析,请按照附件中数据分析要求和对应的数据集作答,在本机上R编译环境中完成代码,可以在源代码中添加适当文字注释,答题完成后,将源代码复制粘贴到答题文本框中提交。

6、数据分析题: 航班信息分析,请按照附件中数据分析要求和对应的数据集作答,在本机上R编译环境中完成代码,可以在源代码中添加适当文字注释,答题完成后,将源代码复制粘贴到答题文本框中提交。

7、数据分析题: 波士顿房价分析,请按照附件中数据分析要求和对应的数据集作答,在本机上R编译环境中完成代码,可以在源代码中添加适当文字注释,答题完成后,将源代码复制粘贴到答题文本框中提交。

8、数据分析题: 文本分析,请按照附件中数据分析要求和对应的数据集作答,在本机上R编译环境中完成代码,可以在源代码中添加适当文字注释,答题完成后,将源代码复制粘贴到答题文本框中提交。

学习通R语言数据分析实践(佟强)

今天介绍的是学习通上的R语言数据分析实践课程。这门课程由佟强老师讲授,共有14个章节,主要介绍R语言的基本操作、数据处理、可视化、统计分析等内容。

1. R语言基础

第一章是R语言基础,主要介绍R语言的安装、RStudio的使用、变量、数据类型、基本运算符等内容。这一章对于初学者来说非常重要,因为它奠定了后续学习的基础。

2. 数据结构

第二章是数据结构。R语言中常见的数据结构有向量、矩阵、数组、列表和数据框。这一章介绍了这些数据结构的定义、创建和操作。

3. 数据输入输出

第三章是数据输入输出。R语言中常用的数据格式有CSV、Excel、文本等。这一章介绍了如何使用R语言读取和写入这些数据格式。

4. 数据清洗

第四章是数据清洗。在实际数据分析中,数据质量往往不尽如人意,需要进行清洗。这一章介绍了如何处理缺失值、重复值、异常值等问题。

5. 数据合并

第五章是数据合并。在实际数据分析中,我们往往需要将多个数据集合并起来,这一章介绍了R语言中如何进行数据合并。

6. 数据变换

第六章是数据变换。在实际数据分析中,我们往往需要对数据进行变换,比如对数变换、归一化等。这一章介绍了R语言中如何进行数据变换。

7. 数据可视化

第七章是数据可视化。数据可视化是数据分析中非常重要的环节,它可以让我们更直观地认识数据。这一章介绍了R语言中常用的数据可视化方法。

8. 统计分析基础

第八章是统计分析基础。统计分析是数据分析中的核心环节,这一章介绍了R语言中常用的统计分析方法。

9. 统计分析高级

第九章是统计分析高级。这一章介绍了R语言中比较高级的统计分析方法,比如多元回归、时间序列分析等。

10. 机器学习基础

第十章是机器学习基础。机器学习是数据分析中比较热门的话题,这一章介绍了R语言中常用的机器学习方法。

11. 机器学习进阶

第十一章是机器学习进阶。这一章介绍了R语言中比较高级的机器学习方法,比如神经网络、集成学习等。

12. 时间序列分析

第十二章是时间序列分析。时间序列分析是非常重要的领域,这一章介绍了R语言中的时间序列分析方法。

13. 空间数据分析

第十三章是空间数据分析。空间数据分析是地理信息系统中的重要领域,这一章介绍了R语言中常用的空间数据分析方法。

14. 数据挖掘

第十四章是数据挖掘。数据挖掘是数据分析中的重要领域,这一章介绍了R语言中常用的数据挖掘方法。

总结

以上就是学习通R语言数据分析实践课程的全部内容。这门课程从入门到进阶都有涉及,适合于初学者和进阶者。通过这门课程的学习,我们可以掌握R语言中常用的数据处理、可视化、统计分析、机器学习等方法,为我们进行实际数据分析提供了非常有力的工具。

中国大学R语言数据分析实践(佟强)

引言

R语言作为一种统计分析语言,在数据分析领域越来越受到关注。在中国大学中,也开始有越来越多的课程开始教授R语言的基本使用和数据分析实践。本文将介绍佟强老师在中国大学R语言数据分析实践课程中所教授的内容。

课程内容

该课程主要内容包括:

  • 数据预处理
  • 数据可视化
  • 统计分析

数据预处理

在数据分析前,我们需要对数据进行预处理。数据预处理是数据分析的重要步骤,包括数据清洗、缺失值处理、异常值处理、数据标准化等。

数据清洗是指对数据中错误、不完整、不一致的部分进行处理。在R语言中,我们可以使用如下代码进行:

library(tidyr) # 导入tidyr包data %>% gather(key = \variable\ value = \value\ -id) %>% # 将数据变成长格式 drop_na(value) # 删除有缺失值的行

缺失值处理是指对数据中缺失部分进行处理。R语言中有很多方法可以处理缺失值,如用平均值填充、删除有缺失值的行等。例如:

data %>% mutate(value = ifelse(is.na(value), mean(value, na.rm = TRUE), value)) # 用平均值填充缺失值

数据可视化

数据可视化是指将数据转化为图形或图像,便于我们更好地了解数据的特征和规律。在R语言中,我们可以使用ggplot2包进行数据可视化。

下面是一个简单的数据可视化示例:

library(ggplot2) # 导入ggplot2包ggplot(data, aes(x = weight, y = height)) + # 绘制散点图 geom_point()

统计分析

在R语言中,我们可以进行各种统计分析,如方差分析、回归分析、聚类分析等。

下面是一个简单的回归分析示例:

model <- lm(height ~ weight, data = data) # 建立线性回归模型summary(model) # 输出回归分析结果

结论

本文介绍了中国大学R语言数据分析实践课程中所教授的内容,包括数据预处理、数据可视化和统计分析。通过学习和实践,我们可以更好地了解R语言的基本使用和数据分析流程,对于我们在日后的数据分析工作中也会有很大的帮助。