摘要:機(jī)器學(xué)習(xí)在當(dāng)今的諸多領(lǐng)域已經(jīng)取得了巨大的成功.尤其是提升算法.提升算法適應(yīng)各種場景的能力較強(qiáng)、準(zhǔn)確率較高,已經(jīng)在多個領(lǐng)域發(fā)揮巨大的作用.但是提升算法在天文學(xué)中的應(yīng)用卻極為少見.為解決斯隆數(shù)字巡天(Sloan Digital Sky Survey,SDSS)數(shù)據(jù)中恒星/星系暗源集分類正確率低的問題,引入了機(jī)器學(xué)習(xí)中較新的研究成果–XGBoost (eXtreme Gradient Boosting).從SDSS-DR7 (SDSS Data Release 7)中獲取完整的測光數(shù)據(jù)集,并根據(jù)星等值劃分為亮源集和暗源集.首先,分別對亮源集和暗源集使用十折交叉驗(yàn)證法,同時運(yùn)用XGBoost算法建立恒星/星系分類模型;然后,運(yùn)用柵格搜索等方法調(diào)優(yōu)XGBoost參數(shù);最后,基于星系的分類正確率等指標(biāo),與功能樹(Function Tree, FT)、Adaboost (Adaptive boosting)、隨機(jī)森林(Random Forest, RF)、梯度提升決策樹(Gradient Boosting Decision Tree, GBDT)、堆疊降噪自編碼(Stacked Denoising AutoEncoders, SDAE)、深度置信網(wǎng)絡(luò)(Deep Belief Network, DBN)等模型進(jìn)行對比并分析結(jié)果.實(shí)驗(yàn)結(jié)果表明:XGBoost在暗源分類中要比功能樹算法的星系分類正確率提高了將近10%,在暗源集的最暗星等中比功能樹提高了將近5%.同其他傳統(tǒng)的機(jī)器學(xué)習(xí)算法和深度神經(jīng)網(wǎng)絡(luò)相比, XGBoost也有不同程度的提升.
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社