摘要:目的當前生物文獻挖掘工作的重心是改進各挖掘模塊性能,以提升挖掘結果的可信度,但有很大比例的挖掘結果其文獻證據(jù)很少,為此本文提出一個利用Bing搜索引擎從海量Web數(shù)據(jù)中為文獻挖掘得到的生物實體關聯(lián)對提供補充證據(jù)的工具系統(tǒng)。方法利用現(xiàn)有文本挖掘技術從PubMed文獻中挖掘一批生物實體關聯(lián)對,引入BingWeb搜索模塊,以生物實體名作為關鍵詞從Web中利用Bing開放搜索API得到一批搜索結果,將這些結果整理成新的數(shù)據(jù)源,最終從該新的數(shù)據(jù)源中挖掘得到一批來自Web的補充證據(jù)。結果本系統(tǒng)(bioinfo.ustc.edu.cn/NetRD)對文獻證據(jù)較少的生物實體關聯(lián)對提供了有效的補充證據(jù)支持,豐富了文獻挖掘結果最終的證據(jù)集。結論以Web數(shù)據(jù)作為補充數(shù)據(jù)源,能夠有效地為文獻證據(jù)很少的生物實體對提供證據(jù)補充,為相關研究者確認兩個生物實體之間的關聯(lián)提供重要參考。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社