tidyfst的benchmark来了

2020-07-11 00:00:00 数据 函数 用户 专区 慢慢

作者:黄天元,复旦大学博士在读,热爱数据科学与开源工具(R),致力于利用数据科学迅速积累行业经验优势和科学知识发现,涉猎内容包括但不限于信息计量、机器学习、数据可视化、应用统计建模、知识图谱等,著有《R语言高效数据处理指南》(《R语言数据高效处理指南》(黄天元)【摘要 书评 试读】- 京东图书)。知乎专栏:R语言数据挖掘。邮箱:huang.tian-yuan@qq.com.欢迎合作交流。

关于之前写的包tidyfst(cran.r-project.org/web/;Tidy Verbs for Fast Data Manipulation),已经做了新一轮的优化,不出意外会在7月份或者8月份放出新的版本。这次投稿Journal of Open Source Software,提了很多好的建议,让走向成熟的tidyfst更上一层楼。这次意见中,就有要做benchmark这一条,于是我参考data.table的来提供了tidyfst的性能测试,参考链接如下:

https://hope-data-science.github.io/tidyfst/articles/benchmark.htmlhope-data-science.github.io

相关文章