在线观看日产精品_成人性生交大片免费看中文网站_神马影院午夜我不卡_亚洲国产精品久久久久久

中文核心期刊咨詢網權威的中英文核心期刊目錄大全,最新2023中文核心期刊目錄查詢,英文論文期刊發表學術咨詢服務。
中文核心期刊咨詢網

大數據有何應用技術

作者: 中文核心期刊2018-08-27閱讀:文章來源:中文核心期刊咨詢網

  隨著大數據概念的大肆宣傳,大數據已經與我們的生活密切相關。但對大多數人來說,大數據只是一個新術語,它不了解大數據的概念和應用。 大數據的概念仍然沒有定論,接下來小編簡單介紹一篇優秀數據通信論文。

數據通信

  關于數據方面的新名詞是層出不窮,云計算、物聯網的概念還沒有完全理解,大數據的概念又頻頻出現在媒體中,特別是今年“兩會”期間,在央視報道中,多次使用大數據進行實時分析。大數據的概念從計算機業界也迅速傳播到各行各業,與我們的日常生活也密切的聯系在一起。不但中國如此,2012年3月,奧巴馬宣布美國政府五大部門投資兩億美元啟動“大數據研究與開發計劃”,【1】大力推動大數據相關的收集、儲存、保留、管理、分析和共享海量數據技術研究,以提高美國的科研、教育與國家安全能力,美國政府以及把“大數據”技術上升到國家安全戰略的高度。其他國家也紛紛加大對大數據研究的資金投入,同時,許多大公司企業也將此技術視作創新前沿。

  1 大數據概念與特征

  但是,到目前為止,業界關于大數據的概念尚未有統一的定義。最早將大數據應用于IT環境的是著名的咨詢公司麥肯錫,它關于大數據的定義是這樣的:大數據是指無法在一定時間內用傳統數據庫軟件工具對其內容進行采集、存儲、管理和分析的數據集合。另外,被引用較多得到大家認可的還有維基百科的定義:大數據指數量巨大、類型復雜的數據集合,現有的數據庫管理工具或傳統的數據處理應用難以對其進行處理。這些挑戰包括如捕獲、收集、存儲、搜索、共享、傳遞、分析與可視化等!2】

  當前,較為統一的認識是大數據有四個基本特征:數據規模大(Volume),數據種類多(Variety),數據要求處理速度快(Velocity),數據價值密度低(Value),即所謂的四V特性。這些特性使得大數據區別于傳統的數據概念!3】

  首先,數據量龐大是大數據的最主要的特征,大數據的數據規模是以PB、EB、ZB量級為存儲單位的,數據量非常龐大。同時,此類數據還在不斷的加速產生,因此,傳統的數據庫管理技術無法在短時間內完成對數據的處理。第二,數據種類多。與傳統的數據相比,大數據的數據類型種類繁多,包括了結構化數據、半結構化數據和非結構化數據等多種數據類型。傳統的數據庫技術采取關系型數據庫較多,結構單一,而大數據重點關注的是包含大量細節信息的非結構化數據,因此傳統數據庫技術不能適應新的大數據的要求,傳統的數據處理方式也面臨著巨大的挑戰。第三,大數據的產生與存儲是動態的,有的處理結果時效性要求很高,這就要求對數據能夠快速處理,數據處理速度快也是大數據區別數據倉庫的主要因素。數據產生的速度以及快速變化形成的數據流,超越了傳統的信息系統的承載能力。最后,數據價值密度低是大數據關注的非結構化數據的重要屬性。大數據分析是采用原始數據的分析,保留了數據的全貌,因此一個事件的全部數據都會被保存,產生的數據量激增,而有用的信息可能非常少,因此價值密度偏低。

  2 大數據可用性的面臨的技術與問題

  大數據并不僅僅指其數據量之大,更代表著其潛在的數據價值之大。有研究證明,有效地管理、使用大數據能夠給企業提供更多增強企業生產能力和競爭能力的機會,能夠給企業帶來巨大的潛在商業價值!4】但不可否認的是,大數據目前也面臨很多負面影響。低質量低密度的數據也可能對決策造成致命性的錯誤。如何把大數據從理論研究到企業應用的轉變,還面臨很多問題與挑戰。

  (1)可用性理論體系的建立。大數據的可用性需要完整的理論做支撐,才能解決諸如如何形式化的表示數據可用性、如何評估數據可用性、數據錯誤自動發現和修復依據什么理論、如何管理數據和數據融合、數據安全性采取何種策略和理論等一系列問題。因此,要建立完整可用性理論體系,構建統一的模型,為大數據的進一步應用提供堅實的理論基礎。

  (2)高質量數據的獲取的能力。大數據技術最基礎的對象就是數據,是一切應用和分析決策的前提。因此,獲取高質量數據是確保信息可用性的重要因素之一。隨著互聯網的數據不斷增大,物聯網的興起以及復雜物理信息系統的應用,大數據的來源也多種多樣,數據模型千差萬別,質量也參差不齊,這就為加工整合數據帶來非常大的困難。

  大數據是對事物最原始的全貌記錄,數據量規模很大,但是其中有用的信息非常少,因此,對于處理數據來說,數據并不是越多越好。如何提高數據中的有效數據是非常關鍵的。大量的數據中如果僅僅包含了少量的錯誤數據,對分析結果可能不會造成很大的影響。但是如果對錯誤數據沒有有效控制的話,大量錯誤數據的涌入很可能會得到完全錯誤的結果。

  因此,獲取高質量數據的能力是大數據能否進行實用的關鍵因素,否則只會在浪費人力物力后獲得完全無效甚至錯誤的結果。但是目前還缺乏系統的研究,對于出現的問題還沒有很好的解決方案,在獲取數據方面的工作任重而道遠。

  (3)數據分析與顯示。單純的大數據是沒有意義的,只有通過對大數據進行分析,從中提取知識,使之能夠轉化成有用的結果,才是大數據可用性的實質。當前,對非結構化數據散亂無序的特征,仍然缺乏高效的分析處理手段。一方面是大數據以幾何速度增長和更新,另一方面是難以從這么冗雜散亂的數據中進行有效數據分析,大數據能否發展應用完全取決于能否從數據中進行有效分析。

  大數據分析主要針對非結構化數據,意味著不能保證輸入的數據是完整的、清洗過和沒有錯誤的。這使它更有挑戰性,但同時提供了在數據中獲得更多洞察力的范圍。

  同時,數據分析的結果是直接反饋給用戶的,因此要以可見或可讀的形式輸出。而大數據處理的主要對象是關系復雜而且種類繁多的非結構化數據,因此傳統的顯示方法通常難以直觀的表現大量的數據表、繁亂的關系圖的分析結果,還可能使用戶感到迷茫,甚至可能誤導用戶。因此還需要計算機圖形學技術引入到大數據分析顯示的應用中來。

  (4)數據安全挑戰。從基礎技術角度看,數據的聚合會增加數據泄露的風險。首先,大數據的來源和承載方式的多樣性,為企業定位和保護機密信息帶來困難。安全機制的不完善,就會產生缺乏機密性和完整性的特質。其次,大數據的關鍵在于數據分析和應用,但是隨著分析技術的發展,勢必對用戶隱私產生極大威脅。在大數據時代,想要屏蔽外部數據商挖掘個人信息幾乎是不可能的,個人隱私問題堪憂。再次,黑客的隱藏攻擊也大數據面臨的一個重要威脅。大數據的低密度性為攻擊代碼的隱藏提供了更大的隱蔽場所,目前的檢測機制很難發現與阻止,因此,一旦受到攻擊產生的破壞性也更大。

  3 結束語

  隨著社交網絡、物聯網、云計算等技術的飛速發展,數據產生的規模和復雜度的增長遠遠超出了符合摩爾定律增長的機器處理和計算能力。為大數據的發展帶來了寶貴機遇,同時在對數據獲取、分析、存儲和安全等方面帶來了巨大挑戰。目前為止,關于大數據還存在泡沫言論,有觀點認為大數據是媒體熱炒的后果,大數據是虛構的,是一個“大謊言”,大數據在某種程度上不過是過去30-40年來對數據管理和數據處理挑戰的理解、認識的新一輪說法。但是事物的興起都是在不斷的爭議中發展壯大的,大數據到底是真科學還是偽科學,還需要不斷的研究,我們拭目以待。

  參考文獻:

  [1]David Reinsel,John Gantz.The Digital Universe in 2020:Big Data,Bigger Digital Shadows,and Biggest Growth in the Far East,2012.

  [2]Wikipedia.Big Data[EB/OL].http://en. Wikipedia.org/wiki /Big data,2013.

  閱讀期刊:數據通信

  《數據通信》(雙月刊)創刊于1980年,由信息產業部數據通信科學技術研究所主辦。本刊主要內容涉及下一代網絡技術、寬帶網絡技術、多媒體通信、無線通信、網絡與信息安全、數據處理、數據傳輸、測試與維護。榮獲信息部優秀科技期刊二、三等獎、中文核心期刊(1992)。

相關論文

主站蜘蛛池模板: 克什克腾旗| 剑阁县| 方山县| 山西省| 鄂托克前旗| 乐东| 富川| 锡林郭勒盟| 揭东县| 福建省| 平度市| 二手房| 乌审旗| 黄石市| 宁阳县| 普兰店市| 开封县| 卢湾区| 蓝田县| 奇台县| 宜丰县| 天镇县| 漠河县| 新密市| 肥乡县| 瑞金市| 区。| 航空| 宜君县| 老河口市| 田东县| 行唐县| 怀仁县| 交口县| 汉中市| 略阳县| 乌兰察布市| 陆良县| 海安县| 吕梁市| 尚志市|