在WEKA中,监督和非监督重采样有什么不同?

我想知道weka.filters.supervised.instance.Resampleweka.filters.unsupervised.instance.Resample有什么区别? 在哪些情况下,我们应该分别使用它们?


解决方案

监督和非监督重采样的文档都相同,但 监督重采样的文档有以下附加语句:

可以使过滤器保持子样本中的类分布, 或使班级分布偏向均匀分布。

监督重采样还有额外的参数:

-B <num>
Bias factor towards uniform class distribution.
0 = distribution in input data  
1 = uniform distribution.
(default 0)
因此,仅当存在类变量时,监督重采样才适用。当完全偏向输入分布(B=0)时,每个子样本复制整个数据集的类分布。B=1等同于无监督重采样,即从整个总体均匀抽取点,而不考虑类别。

相关文章