【R语言】tidyverse之一:读写数据

2020-06-17 00:00:00 数据 文件 导入 数据类型 读入

一. 相关包简介

(1) tibble包

R 数据框的更先进的替代,不将字符串转化为因子型,不重命名列,输出内容更智能,选择 tibble 子集仍是 tibble(Base R 中,1列返回向量)

  • 查看数据框:glimpse()
  • 创建数据框:tibble()和 tribble() (智能行tibble)
  • 强制转化为数据框:as_tibble()和enframe()
  • 操作行名:rownames_to_column()和column_to_rownames()

(2) readr包

读写纯文本文件,包括带分隔符的文本文件,如 csv和 tsv. 也能读写序列化的 R 对象 rds,若想保存数据集后续再加载回来,rds将保存元数据和该对象的状态,如分组和数据类型。

  • 读入数据到数据框:read_csv()和read_tsv()
  • 读入欧式格式数据(“;”为字段分隔符,“,”为小数位):read_csv2() 和 read_tsv2()
  • 读写rds:read_rds()和write_rds()
  • 写入电子表格:write_csv(), write_tsv(), write_csv2(), write_tsv2()
  • 转化数据类型:parse_number(), parse_logical(), parse_factor()等

(3) readxl包

专门读取 Excel 文件,包括同一个工作簿中的不同工作表。

  • read_excel(): 自动检测文件扩展名
  • read_xls()
  • read_xlsx()

(4) writexl包

  • write_xlsx():写入Excel文件

(5) haven包

读写 SPSS, Stata, SAS 数据文件。

  • 读:read_spss(), read_stata(), read_sas()
  • 写:write_spss(), write_stata(), write_sas()

(6) readtext包

读取全部文本文件的内容到数据框,每个文件变成一行,通常用于语言分析或数据收集。

  • readtext()

二. 导入数据

下面以导入 csv 文件为例,演示从一个文件或多个文件读入数据,其它类型文件换成对应读入函数即可。

1. 导入一个csv文件

trap_ins <- read_csv("data/light_trap/1992.csv")
glimpse(trap_ins)

相关文章