在Linux中,tm和Snowball包命令速度较慢

2022-04-27 00:00:00 专区 订阅 命令 我在 机器上

我在R中使用tm和Snowball包进行文本挖掘。我初在装有8 GB内存的Windows 7笔记本电脑上运行它。后来我在带有64 GB内存的Linux(Ubuntu)机器上尝试了相同的操作。这两台机器都是64位,我也使用64位版本的R。但是,Windows具有R 3.0.0,而Linux具有R 2.14在Linux中,tm和Snowball包命令速度较慢

与Windows相比,某些命令在Linux中速度非常慢。

语料库命令

在窗口

d

ds

t1

dsc

print(Sys.time() - t1)

Time difference of 46.86169 secs

这发生在Windows机器上只有47秒

在Linux

t1

dsc

print(Sys.time() - t1)

Time difference of 3.674376 mins

这周围220秒了Linux机器

雪球词干

在窗口

t1

dsc

print(Sys.time() - t1)

Time difference of 12.05321 secs

这仅用了12秒在Windows机器上

在Linux

t1

dsc

print(Sys.time() - t1)

Time difference of 4.832964 mins

这前后花了290秒 Linux机器

有没有一种方法,以加快Linux机器上这些命令吗? R版本会有如此大的差异。谢谢。

拉维

2014-02-12

Ravi

+0

这是可能的R版本可以有所作为。由于Tim Hesterberg的工作成果,R在v2.15.1中处理数据帧的方式有了很大的性能改进。请参阅http://blog.revolutionanalytics.com/2012/06/r-2151-dataframe-package.html –

相关文章