摘要:事件抽取可以幫助人們從海量的文本中快速、準(zhǔn)確地獲取感興趣的事件知識(shí)。然而,目前事件抽取的研究主要集中在從單一句子中抽取事件,由于事件構(gòu)成的復(fù)雜性和語言表述的多樣性,多數(shù)情況下多句才能完整地描述一個(gè)事件。因此,從篇章中抽取出完整的結(jié)構(gòu)化事件信息,顯得更有價(jià)值和意義。該文首先利用基于注意力機(jī)制的序列標(biāo)注模型聯(lián)合抽取句子級(jí)事件的觸發(fā)詞和實(shí)體,與獨(dú)立進(jìn)行實(shí)體抽取和事件識(shí)別相比,聯(lián)合標(biāo)注的方法在F值上提升了1個(gè)百分點(diǎn)。然后利用多層感知機(jī)判斷實(shí)體在事件中扮演的角色。最后,在句子級(jí)事件抽取的基礎(chǔ)上,利用整數(shù)線性規(guī)劃的方法進(jìn)行全局推理,融合句子級(jí)事件信息,實(shí)現(xiàn)篇章級(jí)事件抽取,與基線模型相比,這種基于全局推理的篇章級(jí)事件抽取在F值上提升了3個(gè)百分點(diǎn)。
注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社