【R语言】tidyverse之一:读写数据
一. 相关包简介
(1) tibble包
R 数据框的更先进的替代,不将字符串转化为因子型,不重命名列,输出内容更智能,选择 tibble 子集仍是 tibble(Base R 中,1列返回向量)
- 查看数据框:glimpse()
- 创建数据框:tibble()和 tribble() (智能行tibble)
- 强制转化为数据框:as_tibble()和enframe()
- 操作行名:rownames_to_column()和column_to_rownames()
(2) readr包
读写纯文本文件,包括带分隔符的文本文件,如 csv和 tsv. 也能读写序列化的 R 对象 rds,若想保存数据集后续再加载回来,rds将保存元数据和该对象的状态,如分组和数据类型。
- 读入数据到数据框:read_csv()和read_tsv()
- 读入欧式格式数据(“;”为字段分隔符,“,”为小数位):read_csv2() 和 read_tsv2()
- 读写rds:read_rds()和write_rds()
- 写入电子表格:write_csv(), write_tsv(), write_csv2(), write_tsv2()
- 转化数据类型:parse_number(), parse_logical(), parse_factor()等
(3) readxl包
专门读取 Excel 文件,包括同一个工作簿中的不同工作表。
- read_excel(): 自动检测文件扩展名
- read_xls()
- read_xlsx()
(4) writexl包
- write_xlsx():写入Excel文件
(5) haven包
读写 SPSS, Stata, SAS 数据文件。
- 读:read_spss(), read_stata(), read_sas()
- 写:write_spss(), write_stata(), write_sas()
(6) readtext包
读取全部文本文件的内容到数据框,每个文件变成一行,通常用于语言分析或数据收集。
- readtext()
二. 导入数据
下面以导入 csv 文件为例,演示从一个文件或多个文件读入数据,其它类型文件换成对应读入函数即可。
1. 导入一个csv文件
trap_ins <- read_csv("data/light_trap/1992.csv")
glimpse(trap_ins)
相关文章