-
企業(yè)管理
-
市場研究公司IDC預(yù)測,2015年大數(shù)據(jù)市場規(guī)模將從2010年的32億美元增長到170億美元,復(fù)合年增長率為40%。大數(shù)據(jù)是一個龐大的新的領(lǐng)域,其中的數(shù)據(jù)集可以增長的非常龐大,以至于使用傳統(tǒng)的數(shù)據(jù)庫管理工具也很難處理。處理這種問題所需要的新工具、框架、硬件、軟件和服務(wù)是一個巨大的市場機(jī)會。隨著企業(yè)用戶越來越多地需要連續(xù)不斷地訪問數(shù)據(jù),好的大數(shù)據(jù)工具集將以最低的成本和接近實時的速度提供可伸縮的、高性能的分析。通過分析這種數(shù)據(jù),企業(yè)可得到更大的智能以及競爭優(yōu)勢。下面是Hadoop和大數(shù)據(jù)專業(yè)廠商MapR共同創(chuàng)始人和首席執(zhí)行官約翰·施羅德(John Schroeder)對2014大數(shù)據(jù)市場的預(yù)測。
1. SQL擁有大數(shù)據(jù)的最大潛力
用于 Hadoop(分布式計算)的SQL的發(fā)展能夠讓商業(yè)分析師利用自己的技能和選擇的SQL工具執(zhí)行大數(shù)據(jù)項目。開發(fā)人員可以選擇Hive、Drill和 Impala等Apache項目,以及選擇Hadapt、HAWQ和Splice Machine等公司的專有技術(shù)。
2. 盡管如此 SQL還面臨挑戰(zhàn)
SQL需要數(shù)據(jù)結(jié)構(gòu)。而集中的結(jié)構(gòu)化數(shù)據(jù)可引起延遲并且需要人工管理。SQL還限制分析類型。過分強(qiáng)調(diào)SQL將延遲機(jī)構(gòu)全面利用其數(shù)據(jù)價值的努力和延遲反應(yīng)。
3. 身份識別是主要的數(shù)據(jù)安全問題
隨著Hadoop(分布式計算)中提供的接入控制能力的猛烈攻擊,機(jī)構(gòu)迅速認(rèn)識到線路級身份識別是必要的基礎(chǔ)。沒有充分的身份識別,任何更高級的控制都很容易被繞過,妨礙預(yù)定的安全計劃。
4. 數(shù)據(jù)錯誤變成學(xué)習(xí)機(jī)會
2014年機(jī)構(gòu)將出現(xiàn)許多數(shù)據(jù)錯誤。數(shù)據(jù)錯誤將表明基礎(chǔ)的來源系統(tǒng)的問題嗎?數(shù)據(jù)錯誤是在下游分析中出現(xiàn)偏差導(dǎo)致的數(shù)據(jù)提取問題嗎?數(shù)據(jù)錯誤將表明定義差異或者缺少跨部門和業(yè)務(wù)部門的一致性嗎?2014年將看到解決數(shù)據(jù)異常問題。
5. 出現(xiàn)可運(yùn)行的Hadoop
2014年將看到Hadoop在各個行業(yè)中的生產(chǎn)部署顯著增加。這將顯示出Hadoop在運(yùn)營中的實力。在那里,生產(chǎn)應(yīng)用與分析結(jié)合在一起能夠提供可以衡量的商業(yè)優(yōu)勢,如在客戶化零售建議、詐騙檢測和試驗傳感器數(shù)據(jù)進(jìn)行規(guī)范的維護(hù)等應(yīng)用中提供這些優(yōu)勢。
6. 更多的數(shù)據(jù)倉庫將部署企業(yè)數(shù)據(jù)中心
數(shù)據(jù)中心把數(shù)據(jù)提取處理和數(shù)據(jù)從企業(yè)數(shù)據(jù)倉庫卸載到Hadoop。作為一個核心的中心企業(yè)中心,數(shù)據(jù)中心要便宜10倍,能夠?qū)︻~外的處理或者新的應(yīng)用進(jìn)行更多的分析。
7. 新的以數(shù)據(jù)為中心的應(yīng)用將成為強(qiáng)制性的
利用大數(shù)據(jù)的能力將在2014年成為競爭的武器。更多的公司將使用大數(shù)據(jù)和Hadoop準(zhǔn)確地針對個人消費(fèi)者的偏愛追逐賺錢的追加銷售和交叉銷售的機(jī)會,更好地緩解風(fēng)險以及減少生產(chǎn)和開銷成本。
8. 數(shù)據(jù)成為數(shù)據(jù)中心的核心
機(jī)構(gòu)將從開發(fā)者過渡到大數(shù)據(jù)計劃中。IT部門將越來越多地?fù)?dān)負(fù)定義支持多種應(yīng)用的數(shù)據(jù)基礎(chǔ)設(shè)施的任務(wù),把重點集中在部署、處理和保護(hù)一個機(jī)構(gòu)的核心資產(chǎn)所需要的基礎(chǔ)設(shè)施方面。
9. 搜索將成為非結(jié)構(gòu)化的查詢語言
2013年有大量的用于Hadoop的SQL計劃。2014年將是這種非結(jié)構(gòu)化查詢語言成為重點的一年。把搜索集成到Hadoop將為查找重要信息的企業(yè)用戶提供一種簡單和直觀的方法。搜索引擎還是包括推薦引擎在內(nèi)的許多發(fā)現(xiàn)和分析應(yīng)用的核心。
10. Hadoop將獲得地位
Hadoop將繼續(xù)取代其它IT開支,顛覆企業(yè)數(shù)據(jù)倉庫和企業(yè)存儲。例如,甲骨文的主要營收目標(biāo)在過去的10個季度里有5個季度沒有實現(xiàn)。Teradata在過去的5個季度有4個季度沒有實現(xiàn)營收和利潤目標(biāo)。
11. Hadoop仍需要幫助才能成為主流應(yīng)用
更多的機(jī)構(gòu)認(rèn)識到Apache Hadoop本身還沒有準(zhǔn)備好在企業(yè)應(yīng)用。Apache Hadoop不是為系統(tǒng)管理或者災(zāi)難恢復(fù)等統(tǒng)一企業(yè)IT流程設(shè)計的。企業(yè)將繼續(xù)推進(jìn)混合的解決方案,把架構(gòu)技術(shù)創(chuàng)新與Apache Hadoop的開源軟件結(jié)合在一起。