摘要:隨著移動(dòng)終端設(shè)備的蓬勃發(fā)展,移動(dòng)應(yīng)用種類的日益增加,移動(dòng)應(yīng)用類型識(shí)別成為網(wǎng)絡(luò)管理、市場(chǎng)營(yíng)銷以及網(wǎng)絡(luò)攻擊防范等領(lǐng)域中一種具有重要意義的技術(shù)手段。在實(shí)際應(yīng)用中,幾乎所有的移動(dòng)應(yīng)用程序都采用SSL/TLS(Secure Sockets Layer/Transport Layer Security)協(xié)議進(jìn)行數(shù)據(jù)加密,因此使移動(dòng)應(yīng)用類型識(shí)別工作更具挑戰(zhàn)。提出了一種新穎的加密環(huán)境下Android移動(dòng)應(yīng)用類型識(shí)別技術(shù)。該技術(shù)利用信息熵對(duì)DBSCAN(Density-Based Spatial Clustering of Applications with Noise)聚類算法生成的聚類簇進(jìn)行純度分析,通過實(shí)驗(yàn)合理設(shè)置熵閾值對(duì)數(shù)據(jù)集中的干擾樣本進(jìn)行過濾,最后利用隨機(jī)森林算法對(duì)過濾后的數(shù)據(jù)集進(jìn)行建模,實(shí)現(xiàn)了移動(dòng)應(yīng)用程序類型的識(shí)別。由于僅通過捕捉加密數(shù)據(jù)流傳輸模式實(shí)現(xiàn)應(yīng)用識(shí)別,對(duì)于加密和非加密流量均有效。實(shí)驗(yàn)表明所述方法緩解了干擾樣本的誤判問題,有效地提高了數(shù)據(jù)集利用率,具有更高的識(shí)別準(zhǔn)確率和召回率。
注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社