【R语言】:基本数据管理(1)
操纵日期和缺失值
熟悉数据类型的转换
变量的创建和重编码
数据集和排序,合并与取子集
选入和丢弃变量
参考书籍:《R语言实战(第2版)》第四章
本文代码运行环境为Windows版RStudio
创建新变量
无论是创建新变量或者对现有的变量进行变换,都可以通过表达式给给新变量赋值,表达式可以包含多种运算符和函数,可用来创建公式。R语言中的常用运算符有加(+)、减(-)、乘(*)、除(/)、求幂(^或**)、取余运算(x %% y)、整数除法(x %/% y),详见下图。
下面举例说明如何将两个新变量整合到原有数据框中。目前有一个名称为mydata 的数据框,其中的变量为向量x1和向量x2,现在创建一个新变量sumx存储向量x1和向量x2两个变量的和,并创建另外一个新变量meanx存储向量x1和向量x2两个变量的平均值。
总共有三种方法可以实现,具体代码如下,代码中$符号的用法——即如何确定数据框中某一变量的方法详见【R语言】:数据结构入门(2),代码中的注释详细说明了每一种方法。
#创建数据框mydata,x1和x2是mydata的两个列向量
mydata <- data.frame(x1 = c(2, 2, 6, 4), x2 = c(3, 4, 2, 8))
#方法一,用符号$确定数据框中的变量x1和x2,并且赋值给两个新变量sumx和meanx并添加至数据框
mydata$sumx <- mydata$x1 + mydata$x2
mydata$meanx <- (mydata$x1 + mydata$x2)/2
#方法二,利用函数 attach() 数据框mydata添加到搜索路径,这时将在数据框mydata中确定变量x1和x2,后利用函数detach()从搜索路径移除
attach(mydata)
mydata$sumx <- x1 + x2
mydata$meanx <- (x1 + x2)/2
detach(mydata)
#方法三,利用transform函数对数据框mydata增加两个变量(列向量)sumx和meanx,并把结果存储在数据框mydata中
mydata <- transform(mydata, sumx = x1 + x2, meanx = (x1 + x2)/2)
相关文章