logo

面向混合特征数据的粒子群填补方法

计算机科学与技术

面向混合特征数据的粒子群填补方法

庚松
奇斌
小广
国防科技大学学报第46卷, 第6期pp.107-112纸质出版 2024-12-28在线发表 2024-12-02
600

针对传统数据填补方法难以有效利用标签信息和缺失数据的随机信息的不足,提出面向混合型特征的粒子群优化填补算法。将连续型特征取值建模为高斯分布,均值和标准差作为优化参数。将离散型特征的取值概率作为参数进行优化。使用分类正确率作为优化目标,充分利用标签信息和缺失数据的随机信息。采用4种基于统计的方法和2种基于演化算法的填补方法作为对比,在6个典型的分类数据集上进行实验。结果表明,提出的方法在分类正确率指标上显著优于其他对比算法,同时具有较优的时间开销,能够有效解决混合特征数据缺失的问题。

缺失数据数据填补粒子群优化混合特征分类