在线观看日产精品_成人性生交大片免费看中文网站_神马影院午夜我不卡_亚洲国产精品久久久久久

中英文核心期刊咨詢網(wǎng)提供中英文核心期刊目錄大全,最新2023中文核心期刊目錄查詢,英文論文發(fā)表期刊咨詢服務(wù)。
中文核心期刊咨詢網(wǎng)

中醫(yī)藥知識圖譜智能問答

作者: 中文核心期刊2019-10-30閱讀:文章來源:中文核心期刊咨詢網(wǎng)

  將知識圖譜與知識卡片相結(jié)合,使得用戶既可以閱讀文字以獲取詳細解釋,又可以通過視覺的圖形來感知知識本體之間的相關(guān)性,文字與圖形相輔相成,配合得當(dāng)。本智能問答系統(tǒng)是將無序的用戶語料信息,進行科學(xué)有序的整理,通過CRF分詞技術(shù)處理、提取自然語言關(guān)鍵詞信息,并基于知識圖譜基本原理獲得反饋給用戶的最終答案。作為用藥的輔助推薦信息,以知識圖譜和屬性列表同時呈現(xiàn)。

中醫(yī)藥知識圖譜智能問答

  【關(guān)鍵詞】知識圖譜智能問答中醫(yī)藥

  1引言

  在現(xiàn)有的自然語言處理技術(shù)、知識圖譜構(gòu)建相關(guān)研究的基礎(chǔ)上,結(jié)合各種方式的優(yōu)勢,同時利用盡可能豐富的數(shù)據(jù)源,專門針對中醫(yī)藥的查詢提出了較為適合的用于本系統(tǒng)的句式分析規(guī)則;同時,提供了知識圖譜與知識卡片相結(jié)合的方式更清晰地展示一種中藥實體的具體信息。將知識圖譜與知識卡片相結(jié)合,用戶既可以閱讀文字以獲取詳細解釋,又可以通過視覺的圖形來感知知識本體之間的相關(guān)性。文字與圖形相輔相成,豐富了系統(tǒng)內(nèi)涵,使得系統(tǒng)為用戶提供的資源不再單調(diào),提高了系統(tǒng)的感知性。

  2總體設(shè)計

  2.1設(shè)計重點2.1.1中醫(yī)藥知識庫的構(gòu)建本系統(tǒng)采用自頂向下的策略,依次經(jīng)過模式圖定義、知識抽取、知識融合三個步驟完成基礎(chǔ)知識庫的構(gòu)建。模式圖包含知識庫擁有的概念、概念的屬性,以及概念之間的層次關(guān)系。知識抽取主要包括現(xiàn)有醫(yī)學(xué)文獻、醫(yī)療健康網(wǎng)站、中醫(yī)藥百科站點的知識抽取中醫(yī)藥相關(guān)的實體、實體類型、同義詞關(guān)系和“屬性-值”關(guān)系。知識庫的模式圖常用中醫(yī)藥知識庫主要包括中藥材、中醫(yī)證候、中醫(yī)疾病等上層概念及概念的屬性,構(gòu)建模式圖;陔p向LSTM-CRF模型的中醫(yī)藥實體識別方法。常用中醫(yī)藥知識庫構(gòu)建中,需要從專業(yè)中醫(yī)藥文獻文本中識別藥品相關(guān)實體。采用基于特征模板的方法,利用大規(guī)模語料學(xué)習(xí)出標(biāo)注模型,進而對語句進行標(biāo)注,特征模板通常是人工定義的一些二值特征函數(shù),挖掘命名實體內(nèi)部以及上下文的構(gòu)成特點。采用基于雙向LSTM-CRF模型的中文實體識別方法來識別專業(yè)醫(yī)學(xué)典籍文檔中的中醫(yī)藥等實體。與傳統(tǒng)LSTM不同,雙向LSTM同時考慮了過去的特征和未來的特征,結(jié)果更具準(zhǔn)確性。2.1.2基于自然語言處理技術(shù)的中醫(yī)藥智能問答自然語言的處理通常采用自然語言技術(shù)(如命名實體識別等)對問題進行深層次的分割、理解。智能問答系統(tǒng)按照對數(shù)據(jù)的處理方式可以分為多種,盡管不同類型的問系統(tǒng)對于系統(tǒng)整體模塊的分工和實現(xiàn)存在一定差異,在一般情況下,依據(jù)Q&A系統(tǒng)的數(shù)據(jù)流程處理過程中,處理問題的框架都包括了問題理解、信息搜索和答案生成三個功能模塊。2.1.3基于KK算法和節(jié)點生成算法的中醫(yī)藥知識圖譜可視化知識圖譜是一種以"語義網(wǎng)絡(luò)"為骨架而搭建起來的巨型網(wǎng)絡(luò)知識系統(tǒng)。它能夠能捕獲并展現(xiàn)領(lǐng)域概念之間的語義關(guān)系,使得各種知識資源中零碎、松散的知識本體互相聯(lián)系。將數(shù)據(jù)圖形化是生成知識圖譜的核心之一。作為一個可視化系統(tǒng),界面必須清晰易懂,因此需要過濾部分次要信息,提取主要信息,并對結(jié)果隨機排序。KK算法作為力導(dǎo)引圖布局算法,由一個雙層循環(huán)構(gòu)成。外層循環(huán)改變當(dāng)前正在選擇最佳位置的節(jié)點,內(nèi)層循環(huán)控制此節(jié)點可改變位置的次數(shù)。實則就是在微小移動一個節(jié)點的同時,固定其他所有節(jié)點。KK算法將迭代次數(shù)的限制致力于內(nèi)循環(huán)上。控制所有節(jié)點的移動次數(shù)上限,保證了即便無法達到最完美布局,但整體效果依然呈現(xiàn)出平衡、穩(wěn)定的效果。2.2設(shè)計難點(1)中文語言與其他的語言最大的不同的地方在中文的詞匯之間沒有空格使其分隔開,這加大了語言處理算法對語句分割、語義理解的難度。(2)由于本系統(tǒng)是以中醫(yī)藥為核心,必須格外注意源數(shù)據(jù)的權(quán)威性。同時在建立中醫(yī)藥知識庫的構(gòu)建過程中,會存在詞典需求特殊的問題,需要進行特別的詞性標(biāo)注。(3)在帶有歧義詞語的句子中,經(jīng)常會出現(xiàn)非期望的結(jié)果。在對用戶輸入的自然語言進行處理時,需要通過調(diào)用HanLP的相應(yīng)方法來實現(xiàn)對分詞進行整合。但是,在帶有歧義詞語的句子中,仍會不可避免地出現(xiàn)非期望的結(jié)果。(4)可視化的知識圖譜布局平衡問題。需要使用相應(yīng)算法來實現(xiàn)知識圖譜布局的美觀和易讀性。否則圖譜節(jié)點連線會出現(xiàn)互相交叉的現(xiàn)象,降低圖譜的閱讀性。

  3功能實現(xiàn)

  3.1分詞實現(xiàn)基于對用戶自然語言處理接受的需要,必須對用戶輸入的自然語言進行處理。處理的方法采用了CRF++技術(shù)對用戶輸入進行基本分割,并根據(jù)基本名詞短語識別(BaseNP)的4tag模式。通過對已經(jīng)標(biāo)注好的每個單字,根據(jù)它的BaseNP標(biāo)記進行整合。這一部分通過調(diào)用HanLP的相應(yīng)方法來實現(xiàn)。經(jīng)過多次實踐發(fā)現(xiàn),CRF對于陌生的詞匯具有較高的識別率,但也不可避免地出現(xiàn)少數(shù)非期望的結(jié)果,特別是在帶有歧義詞語的句子中。此時需要調(diào)用其他的分詞器來進行校正。3.2詞典實現(xiàn)通過CRF獲得分詞結(jié)果之后,需要對結(jié)果進行整理,并標(biāo)注詞性。采用了人民日報2014年詞性標(biāo)注庫進行詞性標(biāo)注。針對該系統(tǒng)的特殊需求,新增了中藥、疾病、信號詞、疑問詞等詞性的特殊詞性標(biāo)注,方便了該系統(tǒng)通過此行來過濾關(guān)鍵詞、信息詞的提取。由于用戶時常不能準(zhǔn)確定位所需檢索的問題的關(guān)鍵詞信息,所以有必要進行同義詞匹配的處理。本系統(tǒng)所采用的詞典是根據(jù)哈工大信息檢索研究中心的《同義詞詞林(擴展版)》而修訂的同義詞詞典。其為原詞典的簡化版,并且加入了很多專用于中藥特性的詞語,以更好地進行同義詞匹配。3.3用藥推薦當(dāng)用戶輸入的詞語是疾病或者是癥狀類型詞時,系統(tǒng)將對應(yīng)的癥狀與數(shù)據(jù)庫進行匹配,檢索出與之相關(guān)的中醫(yī)藥品類,按照相關(guān)程度給出適合該癥狀或疾病的中醫(yī)藥列表作為用藥的輔助依據(jù)。

  4小結(jié)

  本系統(tǒng)實現(xiàn)了依照用戶輸入的書面或者口語化語言,進行漢語言標(biāo)注;根據(jù)信號詞進行句式模板匹配,根據(jù)一定的匹配原則,產(chǎn)生相應(yīng)的查詢語句,在已有的中醫(yī)藥知識庫中檢索需要提供給用戶的信息,并通過知識卡片、可視化圖譜、用藥推薦的方式呈現(xiàn)出來。

  作者:鄭懿鳴 翟潔 胡曉龍 施軼劼 劉浩

相關(guān)論文

主站蜘蛛池模板: 阿勒泰市| 石林| 怀集县| 得荣县| 赣榆县| 曲沃县| 丹巴县| 谢通门县| 曲周县| 察隅县| 朝阳区| 涞源县| 舒城县| 集安市| 临沭县| 博乐市| 新疆| 博爱县| 长海县| 菏泽市| 山阳县| 新化县| 万山特区| 长治县| 柯坪县| 新田县| 诏安县| 新安县| 皋兰县| 邵武市| 云霄县| 大厂| 大石桥市| 泾源县| 平乡县| 九寨沟县| 武定县| 金山区| 天津市| 城市| 衡山县|