R base的数据清洗挑选操作,基本数据管理

2023-02-27 00:00:00 数据 变量 筛选 替换 男性

R语言 基于系统自带的base进行数据框的一些操作

不加载library(tidyverse)

#对变量进行排序
#找变量位置
#对数据库某个变量的标签进行替换(数值)
#。。。。。。。。。。。。。替换(字符)
#筛选男性数据
#筛选老年男性数据

data <- data[order(data$Var), ]   #对变量进行排序
which(names(data)=='age') #找变量位置
data$Var[data$var == 1] <- 2 #对数据库某个变量的标签进行替换(数值)
data$sex[data$sex == "male"] <- "female" #。。。。。。。替换(字符)
data2<- data[data$sex == "male",] #筛选男性数据
data3<- data[data$sex == "male"&data$age>60,] #筛选老年男性数据+年龄大于60
data3<- data[data$sex == "male"| data$age>60,] #筛选老年男性数据或年龄大于60
data[data$language%in% c('Chinese','Japanese')] #筛选包含字符的行
#数据特殊函数运算 不像 +-*/一样,要用apply函数。
data <- as.data.frame(data_n2_k200)
data$mean <- apply(data_n2_k200[1:200,1:2],1,mean)
data$sd <- apply(data_n2_k200[1:200,1:2],1,sd)
data$t <- (data_n2_k200$mean-0)/(data_n2_k200$sd/sqrt(2)) #标准误
#删除某某一列
data <-data[ ,names(data) !='nq101'] #删除某一列
#分组统计
tapply(mtcars$mpg, list(mtcars$cyl, mtcars$gear), mean)



本文来源:https://blog.csdn.net/weixin_46623488/article/details/122606103

相关文章