我在R中使用tm和Snowball包进行文本挖掘。我初在装有8 GB内存的Windows 7笔记本电脑上运行它。后来我在带有64 GB内存的Linux(Ubuntu)机器上尝试了相同的操作。这两台机器都是64位,我也使用64位版本的R。但是,Windows具有R 3.0.0,而Linux具有R 2.14在Linux中,tm和Snowball包命令速度较慢
与Windows相比,某些命令在Linux中速度非常慢。
语料库命令
在窗口
d
ds
t1
dsc
print(Sys.time() - t1)
Time difference of 46.86169 secs
这发生在Windows机器上只有47秒
在Linux
t1
dsc
print(Sys.time() - t1)
Time difference of 3.674376 mins
这周围220秒了Linux机器
雪球词干
在窗口
t1
dsc
print(Sys.time() - t1)
Time difference of 12.05321 secs
这仅用了12秒在Windows机器上
在Linux
t1
dsc
print(Sys.time() - t1)
Time difference of 4.832964 mins
这前后花了290秒 Linux机器
有没有一种方法,以加快Linux机器上这些命令吗? R版本会有如此大的差异。谢谢。
拉维
2014-02-12
Ravi
+0
这是可能的R版本可以有所作为。由于Tim Hesterberg的工作成果,R在v2.15.1中处理数据帧的方式有了很大的性能改进。请参阅http://blog.revolutionanalytics.com/2012/06/r-2151-dataframe-package.html –