在线观看日产精品_成人性生交大片免费看中文网站_神马影院午夜我不卡_亚洲国产精品久久久久久

中文核心期刊咨詢網(wǎng)權(quán)威的中英文核心期刊目錄大全,最新2023中文核心期刊目錄查詢,英文論文期刊發(fā)表學(xué)術(shù)咨詢服務(wù)。
中文核心期刊咨詢網(wǎng)

圖書館建設(shè)瀕危語言數(shù)據(jù)庫

作者: 中文核心期刊2020-04-27閱讀:文章來源:中文核心期刊咨詢網(wǎng)

  圖書館作為人類文化遺產(chǎn)長期保存的文獻(xiàn)機(jī)構(gòu),當(dāng)面臨人類語言瀕危消亡的時候,理應(yīng)承擔(dān)搶救和保存的責(zé)任和義務(wù)。經(jīng)過長期的文獻(xiàn)資源建設(shè)的積累,我國圖書館大都收藏了一些瀕危語言方面的紙質(zhì)文獻(xiàn),有些圖書館也收藏了瀕危語言的音像文獻(xiàn)。但是,絕大部分圖書館在面對所在區(qū)域的瀕危語言搶救與保護(hù),更多的是側(cè)重于文獻(xiàn)收集,對于建設(shè)原始態(tài)的語音語料數(shù)據(jù)庫則是重視不夠。

圖書館建設(shè)瀕危語言數(shù)據(jù)庫

  1建設(shè)瀕危語言數(shù)據(jù)庫的難點(diǎn)

  由于土家語缺乏書寫系統(tǒng),導(dǎo)致沒有文字系統(tǒng)的土家語在進(jìn)行語料的采集和數(shù)字化方面困難重重,因此,對土家人的語音語料收集是唯一能長期保存土家語原始素材最為有效的方法。然而,對所搜集的語音語料要達(dá)到面向研究者、學(xué)習(xí)者開放,就必須建設(shè)語言數(shù)據(jù)庫。縱觀國內(nèi)建設(shè)土家語語音語料數(shù)據(jù)庫,發(fā)現(xiàn)有如下難點(diǎn)。

  1.1懂土漢雙語的人才少

  根據(jù)筆者對湘西七縣一市實(shí)地調(diào)研發(fā)現(xiàn),會流利講土家語的原生居民非常少,且大都為70至80歲的老人。據(jù)田荊貴、葉德書、鄧佑玲、李敬中等兩代土家語專家深入走訪統(tǒng)計(jì),湘西地區(qū)會操用土家語的人數(shù)從20世紀(jì)50年代的50萬人,到80年代的42萬人,到21世紀(jì)初不足10萬人。鄧佑玲通過調(diào)查發(fā)現(xiàn),20世紀(jì)80年代還有土家語單語人,到20世紀(jì)末單語人基本消失。2011年楊再彪通過對土家語北部方言和南部方言使用人口調(diào)查,認(rèn)為在湖南西部地區(qū)土家語使用總?cè)丝诖蟾旁?.5萬人左右,統(tǒng)計(jì)時把只會講少量土家語,只能對付簡單日常用語的人群計(jì)算在內(nèi),事實(shí)上流利的土家語使用者遠(yuǎn)遠(yuǎn)小于上述統(tǒng)計(jì)數(shù)據(jù)[1]。湘西土家族苗族自治州民族事務(wù)局2010年對土家語主要縣市進(jìn)行調(diào)查,發(fā)現(xiàn)會操用土家語的總?cè)丝诓蛔?萬人,分布在龍山、永順、古丈、保靖偏僻村寨,其中九成以上為土漢雙語兼用人。《湘西土家族苗族自治州人民政府辦公室關(guān)于認(rèn)真做好土家語苗語搶救保護(hù)傳承工作的若干意見》文件中聲稱,截止2008年底,常用土家語交際只有2.6萬人(其中1.5萬人集中在龍山縣靛房鎮(zhèn)、他砂鄉(xiāng)),占全州土家族人口的2.01%。

  1.2語音語料收集難度大

  圖書館對土家語言材料的收集主要來自3個方面:①收集前期研究者開展課題研究所收藏的早期音像材料,這些材料主要為磁介質(zhì)或光介質(zhì)文獻(xiàn),大都沒有經(jīng)過保護(hù)措施,存在霉變、消磁、氧化問題,一般很難地進(jìn)行數(shù)字化處理,并且由于是私人收藏,收集難度大;②收集民族地區(qū)區(qū)域內(nèi)民委等相關(guān)機(jī)構(gòu)存檔的音像材料,相關(guān)機(jī)構(gòu)存檔的土家語言資料大多為紙質(zhì)文獻(xiàn),數(shù)字化的數(shù)據(jù)庫、有聲資料庫等有聲語料庫建設(shè)還處于試行、摸索和初步架構(gòu)的階段,且存在音視頻數(shù)據(jù)容量大、涉及知識產(chǎn)權(quán)等問題,收藏機(jī)構(gòu)擔(dān)心資料外傳,給收集也帶來了很大的困難;③深入土家語村寨進(jìn)行原始的語音語料的收集,由于土家語的深度瀕危的生態(tài)環(huán)境,能夠自如運(yùn)用土家語進(jìn)行交流的土家族人越來越少,在語音數(shù)據(jù)庫建設(shè)中,發(fā)音人的選擇至關(guān)重要。一般原則是挑選口齒清晰、語速適中、熟練使用本族語且愿意主動配合調(diào)查的母語發(fā)音人。土家語發(fā)音人大多年逾古稀,受漢語影響語言結(jié)構(gòu)不穩(wěn)定,變讀現(xiàn)象較多,聲調(diào)很不穩(wěn)定,音質(zhì)和發(fā)音很難達(dá)到理想要求[2]。

  1.3記音、標(biāo)音難度大

  對土家語的記音、標(biāo)音需要具備熟練掌握國際音標(biāo),有很強(qiáng)的聽音、審音能力,并且熟悉電腦操作,這樣素質(zhì)俱全的人很難找到,圖書館館內(nèi)幾乎沒有樣的人才,需要借助熟悉土家語語言的研究者。在語音標(biāo)注時,實(shí)際發(fā)音的IPA標(biāo)注、正則發(fā)音的IPA標(biāo)注、漢語直譯等標(biāo)注信息要一一層級對應(yīng)。另外土家語瀕危語言數(shù)據(jù)庫除了面向?qū)I(yè)研究人員外,還要面向?qū)W習(xí)土家語者,因此必須解決專用標(biāo)記和通用標(biāo)記之間的轉(zhuǎn)換問題。語音數(shù)據(jù)庫的語音標(biāo)記用的是Praat軟件中Sampa符號,在實(shí)際查詢和使用過程中需要對Sampa符號、IPA符號進(jìn)行轉(zhuǎn)換[3]。因此,建設(shè)大規(guī)模語音數(shù)據(jù)庫需要專業(yè)人士記音、標(biāo)音及他們長期穩(wěn)定的工作狀態(tài),以便于存儲發(fā)音人屬性素材,發(fā)音人文本素材,實(shí)際語音素材及聲學(xué)分析數(shù)據(jù)。

  2建設(shè)土家語數(shù)據(jù)庫的對策

  筆者通過國家圖書館與吉首大學(xué)圖書館的館藏目錄檢索,以“土家語”作為題名或主題詞進(jìn)行檢索,發(fā)現(xiàn)國家圖書館收藏土家語方面的文獻(xiàn)有49種,其中專著37種,博碩學(xué)位論文12種;吉首大學(xué)圖書館收藏土家語方面的圖書有35種。通過比較發(fā)現(xiàn)吉首大學(xué)圖書館收藏土家語方面的文獻(xiàn)相對齊全,在土家語文獻(xiàn)收藏方面僅次于國家圖書館,并且學(xué)校有彭秀模、葉德書、楊再彪、魯美艷等一批本地籍的研究土家語的專家和學(xué)者。但是,針對瀕危土家語,如果只用文字記錄土家語是不夠的,還必須通過用語音、國際音標(biāo)、錄像等形式進(jìn)行記錄。

  2.1收集土家族原生態(tài)的土家語歌舞素材

  土家語不僅是土家族的日常生活交際語言,也是土家族文化的重要載體,如土家族原生態(tài)的“梯瑪神歌”、“擺手歌”、“茅古斯”、“哭嫁歌”等必須用土家語才能表演出來。在神話傳說方面,收集用土家語講述《開天辟地》、《洪水的故事》、《補(bǔ)所與雍尼兄妹成親的故事》等音視頻資料;在人物歷史方面,收集用土家語講述的《八部大王的故事》、《向老官人》、《彭公爵主》、《斯蘭卡普》等音視頻資料;在生活故事方面,收集用土家語講述的《咚咚喹的故事》、《虱子和跳蚤的故事》、《稻草人的故事》、《鳥的故事》等。收集到的這些數(shù)據(jù)庫原始素材貼近土家族人文化生活,有利于今后對土家族文化得到更好的保護(hù)和推廣。

  2.2收集土家語教學(xué)視頻素材

  戴慶夏認(rèn)為語言傳承主要依賴家庭傳承和社交傳承兩種途徑[4],但在這兩種途徑傳承的空間和范圍受限的情況下,通過學(xué)校和網(wǎng)絡(luò)傳承也不失為一種保護(hù)民族瀕危語言的方法,但這種方法需要相應(yīng)的教材和網(wǎng)絡(luò)課件。2008年,湘西土家族苗族自治州政府在政策上,財(cái)力上支持土家語教學(xué),如在土家語保存較好的龍山、永順兩縣的土家語保存相對較好的靛房鎮(zhèn)坡腳小學(xué)、靛房鎮(zhèn)中學(xué)、靛房鎮(zhèn)中心完小、他砂鄉(xiāng)中心完小、對山鄉(xiāng)初級中學(xué)(永順縣)實(shí)施“土漢雙語雙文教學(xué)試點(diǎn)”。為此,根據(jù)《土家語拼音方案》組織編寫了《土家語課本》、《土家·漢雙語讀本》、《土家·漢雙語雙文讀本》、《土家語常用口語半月通》教材,并錄制了《土家語課本》(1-4冊)光盤的遠(yuǎn)程教學(xué)視頻課件。因此,通過盡可能收集更多的土家語課本及土家語教學(xué)視頻,充實(shí)數(shù)據(jù)庫教學(xué)資源是建設(shè)土家語語言數(shù)據(jù)庫非常有效的途徑。

  2.3借鑒其他語料庫技術(shù)成功經(jīng)驗(yàn)

  國家語委正式上線的語料庫網(wǎng)站有《現(xiàn)代漢語語料庫》、《古代漢語語料庫》,前者為大規(guī)模的語料庫,收錄語料樣本9487個,總字符數(shù)近2千萬個(含漢字、字母、數(shù)字、標(biāo)點(diǎn)等),總詞語數(shù)1200萬個(含單字詞、多字詞、字母詞、外文詞、數(shù)字串、標(biāo)點(diǎn)符號等),總分詞數(shù)15萬個(含漢字的詞語個數(shù),不包括外文詞、標(biāo)點(diǎn)、數(shù)字串等)。后者收錄7000萬字,語料庫未經(jīng)標(biāo)注,支持全文檢索、模糊檢索,支持語料出處。兩種數(shù)據(jù)庫均為文本語料,可實(shí)現(xiàn)在線語料分詞、詞性標(biāo)注、漢語拼音自動標(biāo)注、語料字詞頻率統(tǒng)計(jì)等功能。借鑒國家語委建設(shè)的語料數(shù)據(jù)庫,我們可以將土家語建立語檔數(shù)據(jù)庫,首先搜集土家語語言語料的錄音材料,收集到的音頻視頻語料需經(jīng)過編輯、轉(zhuǎn)寫和標(biāo)注才能立檔保存。轉(zhuǎn)寫是對錄音語用文字或書面符號同步記錄,成為可閱讀文本。土家語由于沒有文字,除了用漢字轉(zhuǎn)寫外,用國際音標(biāo)或拼音方案對錄音進(jìn)行標(biāo)音,形成同步標(biāo)音文本記錄話語是必不可少的環(huán)節(jié)。當(dāng)然如果是土家語標(biāo)音文本材料,則只需要將其進(jìn)行漢字標(biāo)注。

  2.4加大投入力度整合各方資源

  少數(shù)民族語言語料庫建設(shè)是一個長期的過程,如“蒙古語語料庫”建設(shè)工程于2005啟動,由內(nèi)蒙古自治區(qū)政府批準(zhǔn)立項(xiàng)建設(shè),計(jì)劃20年時間建成2億詞級的大型綜合性語料庫[5]。圖書館要建設(shè)好語料庫,需要加大投入,調(diào)集、整合各方資源。在文獻(xiàn)資料方面,除了利用館藏土家語文獻(xiàn)外,還要多方征集口語文獻(xiàn)資料;在人員配備方面,除了圖書館館員外,建庫隊(duì)伍還要配備土家語語言學(xué)專家,特別是精通語料庫工具軟件、數(shù)據(jù)庫建庫軟件、全文檢索軟件多學(xué)科的語言學(xué)專家;在建設(shè)資金方面,由于建庫是需要人力物力投入,并且持續(xù)性時間長,如果僅靠圖書館資金投入是不夠的,需要積極爭取政府投入資金。

  [參考文獻(xiàn)]

  [1]楊再彪.湖南西部四種瀕危語言調(diào)查[M].北京:民族出版社,2011:123~126.

  [2]鄧海龍.贛南客家方言語音語料庫建設(shè)的必要性分析[J].語言文學(xué)研究,2016,(21):32~33:62.

  [3]劉巖.關(guān)于中國少數(shù)民族瀕危語言語音語料庫的設(shè)計(jì)[J].中央民族大學(xué)學(xué)報(bào),2006,(4):133~136.

  [4]段金菊.信息技術(shù)在土家文化傳承中的應(yīng)用研究———以湘西“土家-漢雙語雙文教學(xué)試點(diǎn)”為例[J].貴州民族學(xué)院學(xué)報(bào)(哲學(xué)社會科學(xué)版),2011,(2):194~198.

  [5]龍梅.基于蒙古語標(biāo)注語料庫的檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].呼和浩特:內(nèi)蒙古大學(xué),2014:23~26.

  作者:劉喜球 單位:吉首大學(xué)

相關(guān)論文

主站蜘蛛池模板: 肇东市| 施甸县| 泸定县| 汽车| 黎川县| 吕梁市| 邓州市| 乾安县| 南投市| 长垣县| 南昌县| 墨江| 绥芬河市| 曲阜市| 凤凰县| 博野县| 梁河县| 开远市| 宁国市| 太谷县| 郸城县| 康平县| 黄陵县| 宁陵县| 晋城| 桓台县| 合阳县| 凌源市| 贵溪市| 寻甸| 龙陵县| 武宁县| 肥东县| 江津市| 北海市| 黄山市| 大竹县| 中牟县| 闵行区| 建始县| 乐平市|