信息科技論文發(fā)表期刊推薦《通信學(xué)報(bào)》是由中國(guó)通信學(xué)會(huì)主辦的一級(jí)學(xué)術(shù)性刊物,創(chuàng)刊于1980年,面向國(guó)內(nèi)外公開發(fā)行。其辦刊宗旨是及時(shí)反映中國(guó)通信科學(xué)技術(shù)發(fā)展水平,交流國(guó)內(nèi)外通信科技新成果,促進(jìn)學(xué)術(shù)進(jìn)步和人才成長(zhǎng),探索新理論、新技術(shù)。主要讀者對(duì)象為信息通信領(lǐng)域的研究人員、大專院校通信及相關(guān)專業(yè)的教師和研究生。
摘要:在當(dāng)今社會(huì)的網(wǎng)絡(luò)信息存儲(chǔ)中,圖像方面的信息占據(jù)了越來越重的比例,根據(jù)之前的調(diào)查表明,互聯(lián)網(wǎng)上有80%的信息都來源于圖像,網(wǎng)民們對(duì)于圖像的搜索需求越來越高。就目前的技術(shù)來看,圖像的搜索技術(shù)主要是基于文本和基于圖像內(nèi)容兩種方法。在這兩種技術(shù)方法中,基于文本的網(wǎng)絡(luò)圖像搜索技術(shù)的不斷發(fā)展,更加符合絕大多數(shù)人的搜索習(xí)慣,對(duì)于關(guān)鍵字的描述也相對(duì)準(zhǔn)確。
關(guān)鍵詞:文本,網(wǎng)絡(luò)圖像,搜索,電子商務(wù)雜志網(wǎng)站
基于文本的網(wǎng)絡(luò)圖像信息搜索技術(shù)
1 基于文本的圖像檢索技術(shù)
1.1 什么是基于文本的圖像搜索技術(shù)
基于文本的圖像搜索,就是指在收集圖像的時(shí)候,把這個(gè)圖像周圍的文本也一同收集了起來,或是在搜索過程中,圖像中存在的文本被識(shí)別出來,作為對(duì)于該圖像的定量描述。基于文本的圖像檢索也就是通過關(guān)鍵字來進(jìn)行圖像檢索,非常地簡(jiǎn)便并且易于實(shí)現(xiàn)。
1.2 基于文本的圖像檢索技術(shù)索引數(shù)據(jù)庫(kù)的建立
在基于文本的圖像搜索技術(shù)中,最關(guān)鍵要素就是索引數(shù)據(jù)庫(kù)的建立。建立起這個(gè)索引數(shù)據(jù)庫(kù),首先就要提取出跟圖像的所有有關(guān)的信息,比如圖像的格式、名稱和尺寸等。
1.3 基于文本的圖像搜素技術(shù)的特點(diǎn)
根據(jù)當(dāng)前的事情來分析,基于文本的搜索存在著兩方面的困難:一方面就是通過文本上的描述并不能準(zhǔn)確表達(dá)圖像的全部?jī)?nèi)容,因?yàn)槲淖值拿枋瞿芰τ邢蓿荒苁峭ㄟ^定向的詞語(yǔ)或句式來表達(dá)。一旦圖像中出現(xiàn)了類似不規(guī)則形狀或不常見的紋理時(shí),就很難應(yīng)用文本對(duì)其進(jìn)行解釋。再有就是通過文本描述離不開會(huì)出現(xiàn)主觀因素的形象,當(dāng)圖像的內(nèi)容過于豐富,就會(huì)使內(nèi)容上的描述具有很大的主觀性,那么這樣的搜索方法會(huì)出現(xiàn)歧義。
但是基于文本的圖像搜素技術(shù)也有很多優(yōu)點(diǎn),比如說可以把圖像的搜索轉(zhuǎn)為了與圖像相適應(yīng)相符合的文本檢索,這樣更加利于實(shí)現(xiàn)。另一方面,由于文本搜索是人工來控制操作的,所以它的查準(zhǔn)率非常高,可以用來輔助其他圖像的搜索技術(shù)。
2 如何用文本的方法對(duì)圖像進(jìn)行搜索
2.1 圖像關(guān)聯(lián)文本的選取
基于文本的圖像搜索,其實(shí)就是找到與這個(gè)圖像有關(guān)連的文本,來對(duì)圖像進(jìn)行索引和標(biāo)注。跟圖像有關(guān)聯(lián)的文本本文由論文聯(lián)盟http://www.LWlm.cOm收集整理主要包括了文件的拓展名和超文本文件的圖像標(biāo)記符號(hào)。文件的拓展名就是圖片的存儲(chǔ)格式,常見的有g(shù)if.、jpg.等,根據(jù)這些文件的拓展名,我們可以很好地定位圖像信息。而超文本文件的圖像標(biāo)記符號(hào)其實(shí)就是讓我們?cè)趯?shí)際的搜索中應(yīng)用到超文本標(biāo)記語(yǔ)言和可拓展標(biāo)記語(yǔ)言。
2.2 文本匹配技術(shù)
當(dāng)一個(gè)需要被搜索的圖像里所有的文本都提取出來時(shí),就要根據(jù)這些文本的特征進(jìn)行排序。不同的排序標(biāo)準(zhǔn)往往會(huì)出現(xiàn)不同的搜索結(jié)果,比如根據(jù)圖片的類型來進(jìn)行文本搜索,那么我們可能會(huì)搜索出特定的圖片,但如果是根據(jù)這個(gè)圖片的內(nèi)容在網(wǎng)站中進(jìn)行搜索,那么搜索的范圍也會(huì)縮小。
3 如何對(duì)圖像中的文字進(jìn)行提取
3.1 基于文本區(qū)域空間頻率特征的紋理方法
基于文本區(qū)域空間頻率特征的紋理方法,又稱為紋理圖像分割法。主要是采取了平穩(wěn)離散的小波變換來對(duì)圖像進(jìn)行著分解,由于紋理圖像在局部的區(qū)域內(nèi)是呈現(xiàn)不規(guī)則性,但在整體中又表現(xiàn)出了規(guī)律性,因此可以對(duì)其進(jìn)行分割。這樣的方法可以準(zhǔn)確檢測(cè)到字符與背景的對(duì)比度較小的文本,但是也有一定的缺點(diǎn):由于它產(chǎn)生的文本區(qū)域常常和附近的其他邊緣輪廓相互黏接,所以說不能得到文本區(qū)域的精確位置。
3.2 連通區(qū)域方法
根據(jù)圖像進(jìn)行連通區(qū)域的方法可以有效確定出文本區(qū)域的精確位置和大小,但和基于文本區(qū)域空間頻率特征的紋理方法相反的是,它不能夠檢測(cè)到字符與背景的對(duì)比度較小的文本,因此也有著自身的約束性。
3.3 神經(jīng)網(wǎng)絡(luò)方法
由于區(qū)域空間紋理法和連通區(qū)域法都有著自身的局限性,所以提出了一種新的方法——神經(jīng)網(wǎng)絡(luò)方法。這種方法將紋理法和連通區(qū)域法進(jìn)行了巧妙的融合,通過整幅的彩色圖像色調(diào)的直方圖來對(duì)圖像的顏色進(jìn)行分類,當(dāng)字符和背景的對(duì)比度較小時(shí),根據(jù)圖像中的其他像素顏色,文本和背景的顏色就會(huì)在神經(jīng)網(wǎng)絡(luò)中形成一個(gè)絕大值。在實(shí)際的搜索中,會(huì)用紋理法將圖像分隔成一個(gè)個(gè)可能會(huì)包含著文本的圖像塊,然后用區(qū)域法來確定文本的大小和具體位置。
神經(jīng)網(wǎng)絡(luò)的方法改進(jìn)了紋理法和連通區(qū)域法中存在的不足,是目前為止應(yīng)用最為廣泛的圖像中文字的提取方法。
4 結(jié)論
其實(shí)基于文本來對(duì)圖像進(jìn)行搜索,從根本上說就是利用文本的特征來準(zhǔn)確搜索到圖像,在這里文本就是起到了橋梁的作用。在今后的生活中,互聯(lián)網(wǎng)將會(huì)是一個(gè)多媒體的網(wǎng)絡(luò),除了文字外,圖像、音頻、視頻都在扮演著越來越重要的角色。隨著基于文本的圖像搜索技術(shù)發(fā)展水平越來越高,也有著非常大的現(xiàn)實(shí)意義。但是技術(shù)的發(fā)展并不是一朝一夕可以完成的,在現(xiàn)階段的搜索技術(shù)力還有這很多問題,顯得不夠成熟,我們應(yīng)該通過分析文本的圖像搜索技術(shù)的優(yōu)點(diǎn)和不足,找出今后的發(fā)展方向,推動(dòng)檢索技術(shù)更加成熟化發(fā)展,給人們創(chuàng)造出更多的價(jià)值。
相關(guān)論文