信息科技論文發表期刊推薦《通信學報》是由中國通信學會主辦的一級學術性刊物,創刊于1980年,面向國內外公開發行。其辦刊宗旨是及時反映中國通信科學技術發展水平,交流國內外通信科技新成果,促進學術進步和人才成長,探索新理論、新技術。主要讀者對象為信息通信領域的研究人員、大專院校通信及相關專業的教師和研究生。
摘要:在當今社會的網絡信息存儲中,圖像方面的信息占據了越來越重的比例,根據之前的調查表明,互聯網上有80%的信息都來源于圖像,網民們對于圖像的搜索需求越來越高。就目前的技術來看,圖像的搜索技術主要是基于文本和基于圖像內容兩種方法。在這兩種技術方法中,基于文本的網絡圖像搜索技術的不斷發展,更加符合絕大多數人的搜索習慣,對于關鍵字的描述也相對準確。
關鍵詞:文本,網絡圖像,搜索,電子商務雜志網站
基于文本的網絡圖像信息搜索技術
1 基于文本的圖像檢索技術
1.1 什么是基于文本的圖像搜索技術
基于文本的圖像搜索,就是指在收集圖像的時候,把這個圖像周圍的文本也一同收集了起來,或是在搜索過程中,圖像中存在的文本被識別出來,作為對于該圖像的定量描述。基于文本的圖像檢索也就是通過關鍵字來進行圖像檢索,非常地簡便并且易于實現。
1.2 基于文本的圖像檢索技術索引數據庫的建立
在基于文本的圖像搜索技術中,最關鍵要素就是索引數據庫的建立。建立起這個索引數據庫,首先就要提取出跟圖像的所有有關的信息,比如圖像的格式、名稱和尺寸等。
1.3 基于文本的圖像搜素技術的特點
根據當前的事情來分析,基于文本的搜索存在著兩方面的困難:一方面就是通過文本上的描述并不能準確表達圖像的全部內容,因為文字的描述能力有限,它只能是通過定向的詞語或句式來表達。一旦圖像中出現了類似不規則形狀或不常見的紋理時,就很難應用文本對其進行解釋。再有就是通過文本描述離不開會出現主觀因素的形象,當圖像的內容過于豐富,就會使內容上的描述具有很大的主觀性,那么這樣的搜索方法會出現歧義。
但是基于文本的圖像搜素技術也有很多優點,比如說可以把圖像的搜索轉為了與圖像相適應相符合的文本檢索,這樣更加利于實現。另一方面,由于文本搜索是人工來控制操作的,所以它的查準率非常高,可以用來輔助其他圖像的搜索技術。
2 如何用文本的方法對圖像進行搜索
2.1 圖像關聯文本的選取
基于文本的圖像搜索,其實就是找到與這個圖像有關連的文本,來對圖像進行索引和標注。跟圖像有關聯的文本本文由論文聯盟http://www.LWlm.cOm收集整理主要包括了文件的拓展名和超文本文件的圖像標記符號。文件的拓展名就是圖片的存儲格式,常見的有gif.、jpg.等,根據這些文件的拓展名,我們可以很好地定位圖像信息。而超文本文件的圖像標記符號其實就是讓我們在實際的搜索中應用到超文本標記語言和可拓展標記語言。
2.2 文本匹配技術
當一個需要被搜索的圖像里所有的文本都提取出來時,就要根據這些文本的特征進行排序。不同的排序標準往往會出現不同的搜索結果,比如根據圖片的類型來進行文本搜索,那么我們可能會搜索出特定的圖片,但如果是根據這個圖片的內容在網站中進行搜索,那么搜索的范圍也會縮小。
3 如何對圖像中的文字進行提取
3.1 基于文本區域空間頻率特征的紋理方法
基于文本區域空間頻率特征的紋理方法,又稱為紋理圖像分割法。主要是采取了平穩離散的小波變換來對圖像進行著分解,由于紋理圖像在局部的區域內是呈現不規則性,但在整體中又表現出了規律性,因此可以對其進行分割。這樣的方法可以準確檢測到字符與背景的對比度較小的文本,但是也有一定的缺點:由于它產生的文本區域常常和附近的其他邊緣輪廓相互黏接,所以說不能得到文本區域的精確位置。
3.2 連通區域方法
根據圖像進行連通區域的方法可以有效確定出文本區域的精確位置和大小,但和基于文本區域空間頻率特征的紋理方法相反的是,它不能夠檢測到字符與背景的對比度較小的文本,因此也有著自身的約束性。
3.3 神經網絡方法
由于區域空間紋理法和連通區域法都有著自身的局限性,所以提出了一種新的方法——神經網絡方法。這種方法將紋理法和連通區域法進行了巧妙的融合,通過整幅的彩色圖像色調的直方圖來對圖像的顏色進行分類,當字符和背景的對比度較小時,根據圖像中的其他像素顏色,文本和背景的顏色就會在神經網絡中形成一個絕大值。在實際的搜索中,會用紋理法將圖像分隔成一個個可能會包含著文本的圖像塊,然后用區域法來確定文本的大小和具體位置。
神經網絡的方法改進了紋理法和連通區域法中存在的不足,是目前為止應用最為廣泛的圖像中文字的提取方法。
4 結論
其實基于文本來對圖像進行搜索,從根本上說就是利用文本的特征來準確搜索到圖像,在這里文本就是起到了橋梁的作用。在今后的生活中,互聯網將會是一個多媒體的網絡,除了文字外,圖像、音頻、視頻都在扮演著越來越重要的角色。隨著基于文本的圖像搜索技術發展水平越來越高,也有著非常大的現實意義。但是技術的發展并不是一朝一夕可以完成的,在現階段的搜索技術力還有這很多問題,顯得不夠成熟,我們應該通過分析文本的圖像搜索技術的優點和不足,找出今后的發展方向,推動檢索技術更加成熟化發展,給人們創造出更多的價值。
相關論文