摘要:針對傳統(tǒng)線性支持向量機在訓練數(shù)據(jù)集時均等對待每一維輸入特征,以及在原始空間直接分類造成預測準確率低的問題,提出低階多項式數(shù)據(jù)映射和特征加權相結合的方法,來提高線性支持向量機的分類性能。該方法首先將每個樣本映射到多項式核對應的2-階顯式特征空間,從而增加樣本的隱性信息,然后使用模糊熵特征加權算法計算每一維特征的權重,通過權重衡量特征對分類結果的貢獻大小。從不同數(shù)據(jù)庫選取7個數(shù)據(jù)集進行測試,在訓練時間和預測準確率2個方面將該方法與核支持向量機、線性支持向量機的其他改進算法進行比較。結果顯示,隨著數(shù)據(jù)集規(guī)模的擴大,訓練時間降低一個數(shù)量級,預測準確率在一些數(shù)據(jù)集上取得與核支持向量機相接近的效果。結果表明:所提方法可以有效提高線性支持向量機的整體性能。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社