R语言自然语言处理:word2vec
作者:黄天元,复旦大学博士在读,热爱数据科学与开源工具(R),致力于利用数据科学迅速积累行业经验优势和科学知识发现,涉猎内容包括但不限于信息计量、机器学习、数据可视化、应用统计建模、知识图谱等,著有《R语言高效数据处理指南》(《R语言数据高效处理指南》(黄天元)【摘要 书评 试读】- 京东图书)。知乎专栏:R语言数据挖掘。邮箱:huang.tian-yuan@qq.com.欢迎合作交流。
R在深度学习这一块目前很多工具都依赖Python,导致很多工具因为环境配置的难度就把R用户拒之门外。今天看到word2vec包已经在CRAN,非常高兴。它只依赖于Rcpp,也就是完全不用安装Python就能够使用。以前就在GitHub看到这个项目,今年6月上CRAN,以后有需要的时候随时取用。
这个包可以求得不同词向量之间的相似度,获得的模型还可以以二进制文件进行存取,非常方便。参考链接如下:
https://github.com/bnosac/word2vec相关文章