浮点算术:加法顺序为什么重要?

2022-07-15 00:00:00 floating-point precision c++

我知道不可能用有限的位数来表示任意精度的所有数字,而且浮点数的天真比较也是不可取的。但我预计,如果我将许多数字相加在一起,我将它们相加的**顺序**并不重要。

为了测试这个预测,我创建了一个随机数向量并计算它们的和,然后对向量进行排序并再次计算和。通常情况下,这两个数字不匹配!这是我的代码(包括在下面)的问题,还是浮点算术的普遍缺陷,或者可能通过切换编译器等来解决的问题?

#include <algorithm>
#include <cstdio>
#include <cstdlib>
#include <random>
#include <vector>

double check_sum_depends_on_order(int seed)
{
    // fill a vector with random numbers
    std::vector<long double> v;
    std::uniform_real_distribution<long double> unif(-1.,1.);
    std::mt19937 rng(seed);
    for (size_t i = 0; i < 1000; ++i)
    {
        v.push_back(unif(rng));
    }

    // copy this vector and then shuffle it
    std::vector<long double> v2 = v;
    std::sort(v2.begin(), v2.end());


    // tot is running total for vector v, unsorted
    // tot2 is running total for vector v2, sorted
    long double tot = 0.0, tot2 = 0.0;
    for (size_t i = 0; i < v.size(); ++i)
    {
        tot += v[i];
        tot2 += v2[i];
    }

    // display result
    // you can comment this if you do not want verbose output
    printf("v tot	= %.64Lf
", tot);
    printf("v2 tot	= %.64Lf
", tot2);
    printf("Do the sums match (0/1)? %d

", tot==tot2);

    // return 1.0 if the sums match, and 0.0 if they do not match
    return double(tot==tot2);
}

int main()
{
    // number of trials
    size_t N = 1000;

    // running total of number of matches
    double match = 0.;
    for (size_t i = 0; i < N; ++i)
    {
        // seed for random number generation
        int seed = time(NULL)*i;
        match += check_sum_depends_on_order(seed);
    }

    printf("%f percent of random samples have matching sums after sorting.", match/double(N)*100.);
    return 0;
}

解决方案

假设您有一个精度为三位数的小数浮点类型。不太现实,但这是一个更简单的例子。

假设您有三个变量,abc。假设a1000bc均为14

a + b将为1014,向下舍入为1010。(a + b) + c将为1024,向下舍入为1020。

b + c将是28岁。a + (b + c)将为1028,向上舍入为1030。

相关文章