在WEKA中,监督和非监督重采样有什么不同?
我想知道
weka.filters.supervised.instance.Resample
和weka.filters.unsupervised.instance.Resample
有什么区别?
在哪些情况下,我们应该分别使用它们?
解决方案
监督和非监督重采样的文档都相同,但 监督重采样的文档有以下附加语句:
可以使过滤器保持子样本中的类分布, 或使班级分布偏向均匀分布。
监督重采样还有额外的参数:
-B <num>
Bias factor towards uniform class distribution.
0 = distribution in input data
1 = uniform distribution.
(default 0)
因此,仅当存在类变量时,监督重采样才适用。当完全偏向输入分布(B=0)时,每个子样本复制整个数据集的类分布。B=1等同于无监督重采样,即从整个总体均匀抽取点,而不考虑类别。
相关文章