摘要:研究針對(duì)中醫(yī)臨床癥狀詞描述的差異與分歧,以Word2vec和FastText為工具,基于現(xiàn)有中醫(yī)藥語(yǔ)料庫(kù),進(jìn)行中醫(yī)癥狀相似度研究,發(fā)現(xiàn)了一些較為晦澀、生僻的癥狀同義詞及近義詞,擴(kuò)充了中醫(yī)癥狀詞的詞表,并通過(guò)對(duì)Pearson、Spearman系數(shù),以及召回率的比較,認(rèn)為FastText在這一任務(wù)上有更好的表現(xiàn)。但是由于中文分詞,特別是中醫(yī)古籍分詞的先天劣勢(shì),以及現(xiàn)有語(yǔ)料不夠豐富,導(dǎo)致召回率和準(zhǔn)確率還有很大的提升空間,未來(lái)值得進(jìn)一步研究。
注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢雜志社