R语言实战-第三讲实践
1.朝阳医院销售数据
首先过一遍猴哥第三讲的实践案例,大体分为两个部分:数据预处理和数据分析。
1).数据预处理:列名重命名、删除缺失数据的观测、处理日期格式、数据类型转换、数据排序。代码如下:
library("stringr")
library("openxlsx")
readfilePath<-"C:/Users/21/Desktop/朝阳医院2016年销售数据.xlsx"
excelData<-read.xlsx(readfilePath,"Sheet1")
excelData<-na.omit(excelData)
names(excelData)<-c("time","cardno","drugID","drugName","saleNumber",
"virtualMoney","actualMoney")
timeSplit<-str_split_fixed(excelData$time," ",n=2)
excelData$time<-timeSplit[,1]
class(excelData$time)
excelData$time<-as.Date(excelData$time,"%Y-%m-%d")
class(excelData$time)
excelData$saleNumber<-as.numeric(excelData$saleNumber)
excelData$virtualMoney<-as.numeric(excelData$virtualMoney)
excelData$actualMoney<-as.numeric(excelData$actualMoney)
excelData<-excelData[order(excelData$time),]
相关文章