R&39;Sum()和Armadillo Accu()之间的差异

2022-04-10 00:00:00 r precision c++ rcpp armadillo
当给定相同的输入时,R的sum()函数和RcppArmadillo的accu()函数的结果略有不同。例如,以下代码:

R:

vec <- runif(100, 0, 0.00001)
accu(vec)
sum(vec)

C++:

// [[Rcpp::depends("RcppArmadillo")]]
// [[Rcpp::export]]
double accu(arma::vec& obj)
{
    return arma::accu(obj);
}

给出结果:

0.00047941851844312633(C++)

0.00047941851844312628(R)

根据http://keisan.casio.com/calculator,正确答案是:

4.79418518443126270948E-4

这些微小的差异累积在我的算法中,并显著影响它的执行方式。有没有一种方法可以在C++中更准确地求出向量?或者至少获得与R相同的结果,而不必调用R代码?


解决方案

我的发现:

我成功地编写了一个能够模拟R的SUM函数的函数。似乎R使用更高精度的变量来存储每个加法运算的结果。

我写的:

// [[Rcpp::depends("RcppArmadillo")]]
// [[Rcpp::export]]
double accu2(arma::vec& obj)
{
    long double result = 0;
    for (auto iter = obj.begin(); iter != obj.end(); ++iter)
    {
        result += *iter;
    }
    return result;
}

速度对比:

set.seed(123)
vec <- runif(50000, 0, 0.000001)
microbenchmark(
  sum(vec),
  accu(vec),
  accu2(vec)
)


       expr    min     lq     mean  median      uq    max neval
   sum(vec) 72.155 72.351 72.61018 72.6755 72.7485 75.068   100
  accu(vec) 48.275 48.545 48.84046 48.7675 48.9975 52.128   100
 accu2(vec) 69.087 69.409 70.80095 69.6275 69.8275 182.955  100

所以,我的C++解决方案仍然比R的求和快,但比Aradillo的accu()慢得多

相关文章