摘要:在數(shù)據(jù)挖掘中,由于數(shù)據(jù)集中含有大量的冗余和不相關(guān)的特征,因此特征選擇是一個(gè)重要的預(yù)處理過程。提出了一個(gè)基于混合互信息和粒子群算法的過濾式-封裝式的多目標(biāo)特征選擇方法(HMIPSO)。根據(jù)粒子的pbest距離上次更新的迭代次數(shù),提出了自適應(yīng)突變策略去擾動(dòng)種群,避免種群陷入局部最優(yōu)。同時(shí)基于帕累托前沿面和外部文檔提出了一個(gè)新的集合概念。結(jié)合互信息和新的集合知識(shí)提出了一個(gè)局部搜索策略,使得帕累托前沿面中的粒子可以刪除不相關(guān)和冗余的特征,然后通過精英策略更新學(xué)習(xí)前和學(xué)習(xí)后的帕累托前沿面。最后將提出的算法和另外4種多目標(biāo)算法在15個(gè)UCI數(shù)據(jù)集上進(jìn)行了測試,實(shí)驗(yàn)結(jié)果表明提出的算法能夠更好地降低特征個(gè)數(shù)和分類錯(cuò)誤率。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社