摘要: 大數據時代CIO們在就如何收集、存儲、分析和展示大數據開展工作的同時,還被賦予了應對更加困難的挑戰——運用數據作為驅動業務決策的手段的重任。 IT組織可以如何利用大數據?經過一年左右與專家和CIO們的試探後,我...
大大數據時代CIO們在就如何收集、存儲、分析和展示大數據開展工作的同時,還被賦予了應對更加困難的挑戰——運用數據作為驅動業務決策的手段的重任。 IT組織可以如何利用大數據?經過一年左右與專家和CIO們的試探後,我開始認為這一努力需要CIO們進入一個以往很少有人觸及的領域:電影。
三維方法:數據展示的“未來之路”
最近湯姆·達文波特在即將出版的關於分析的書中清晰地闡述了CIO和商業智能(BI)組織的工作不是簡單的展示數據,而是要以一種能夠影響業務決策的方式進行展示。在他的關於展示數據最佳方式問卷調查中,達文波特印象最深的一組把“一個非常簡單的財務報告應用”做成了一個視頻。這很可能是未來之路,他說,如果你看看我們是如何說服做其他事情,購買產品,自娛自樂——想想最近大家在YouTube上觀看的所有聰明貓的視頻——除非我們願意通過視頻來溝通分析的結果,否則它不可能每個都保持長久。
這個案例對於展示大數據技術特別有說服力。一個簡單的圖可以用一個事情繪製另一個——就像我從代數課上學到的。添加顏色也許就能在一個圖中獲得三個變量。但是大數據,正如從PayPal到金融街的首席科學家們所說,可能包含上百種變量,並且這些變量正隨著時間和空間而改變。萬能的貓視頻!什麼樣的數據展示才能弄明白這個。
當然,如果你已經知道自己在尋找什麼,感謝你那有準備的頭腦,除了留下與少數變量相關的信息,你只是過濾掉了其他的所有信息。但是如果你不知道自己在尋找什麼,如果你已經有了上PB的數據,你希望從中能發現新的關係而不是簡單的為舊觀點提供支撐或反駁的證據,那會怎麼樣?如果你想看到不帶偏見處理數據的方式——正如我所知道的,那真是大數據分析的最高目標(theholygrail)——除了逐字逐句的看,根本沒有什麼其他選擇。但是,怎樣做呢?
我想,這就是為什麼要有電影,為什麼財務業績通過視頻可以給象達文波特這樣老練的分析家留下如此深刻的印象。電影呈現出三維空間;它讓我們看見時間的流逝。顏色、紋理甚至聲音的應用為我們描繪出了更多的變數。我們所熟知的世界就是三維的,有聲電影會被人們當作真實的經歷。
現在的CIO們必須讓大數據看起來像那個真實的世界,是否所有可用來表現工具都已存在了?當然不是。達文波特的觀點是他們還相當不成熟,但是每個我們見到的計算機製作出的動畫都向我們展示了一條前進的道路。詹姆斯·卡梅隆在《阿凡達》中使用的軟件工具,象AutodeskMaya和Zbrush,都可以找到一種方式進入到CIO的組件中。燈光、攝像、開始!拿我來說,我就期待在電影中的大數據。據我推測企業也是一樣在期待。正如另一位哲人所說,觀察能讓你學會很多。
六家創業公司數據可視化分析
1.Ayasdi
Ayasdi來自印第安語,是“尋找”的意思。斯坦福大學的GurjeetSingh,GunnarCarlsson和HarlanSexton一直在致力於將拓撲學的研究方法應用於數據分析。在2008年,他們聯合成立了Ayasdi公司。 Ayasdi成立以後,就獲得了DARPA(美國國防部高級研究項目組)350萬美元的資助。
Ayasdi的底層使用的是HBase數據存儲,然後再利用拓撲數據分析技術和上百種機器學習的算法來處理複雜的數據集,最終確定數據節點之間的相似度。而對終端用戶而言,這看起來更像是一個數據集的拓撲圖,只是強調了集群中有關聯的數據點。
Ayasdi的技術有一個重要的特點,它不像別的系統需要類似搜索查詢式語句,Ayasdi可以自動從數據中發現隱藏的模式。 Ayasdi的一個應用就是在醫學研究領域,MountSinai醫學院基因與多尺度生物學系的主任EricSchadt就帶領一個團隊,利用Ayasdi的技術進行一些疾病的遺傳傾向的研究,而且利用Ayasdi的數據分析技術,幫助發現了乳腺癌的14個變種。
2.BeyondCORE
實際上BeyondCore運作的基本前提和Ayasdi是相同的——只是展示給用戶顯著相關的聯繫,而無需考慮這個結果是如何發現的——雖然BeyondCore使用的是標準化圖表,但是事實上還提供了另一種選擇:在發現軟件發現關聯性結果時,會讓化身(見圖片)通知用戶。
3.ClearStory
ClearStory擁有一個獨一無二的產品,即使該產品的很多細節並沒有公佈。也許只有在產品正式發布之後,我們才能“一睹真容”。 ClearStory將與存儲在數據庫、網絡和其他來源的數據連接,在數據源變化時進行動態的更新,並加入虛擬的數據挖掘組件,使用戶分析數據並理解信息。在今年3月份,ClearStory獲得了來自谷歌風投、安德里森·霍洛維茨、KhoslaVentures等多家風投的青睞,融資金額不詳。
4、Datahero
Datahero是由來自AsterData的大數據分析業務骨幹ChrisNeumann、寶馬的高級工程師JeffZabel聯合創立,該公司尚在起步階段就獲得了100萬美元的融資。他們打著“你的數據你做主”的口號,試圖彌合大數據與普通用戶之間的鴻溝,不僅幫助用戶分析密切相關的數據,而且通過可視化的形式,讓用戶更好地理解這些數據。
據外媒報導,Datahero是基於瀏覽器的一個平台,數據的輸出、整理以及解釋都會在一個單獨的窗口完成,而不是通常意義上的借助不同的應用。通過瀏覽器,用戶可以將多種網絡服務的信息輸入到Datahero,也可以從公共的數據庫下載報告,還可以直接在本地把電子表格及文件上傳到Datahero。 Datahero會根據它的算法自動為這些信息歸類,並給他們加上標籤。
5.Platfora
Platfora在Hadpoop的基礎上進行數據的操作,並為用戶提供一個簡單易用的操作平台。因為Hadpoop有很多不同的發行版,所以Platfora的重點之一就是確保它能在所有的發行版上運行,這樣大大降低了Hadpoop的使用門檻,讓更多的人能夠體驗Hadpoop的技術優勢,實現真正意義上的“平民化”。
6.Zoomdata
初創公司ZoomData是為數不多的支持移動設備的數據分析公司,它們的數據可視化系統能夠將實施的大數據流轉化為觸屏友好的、藝術感十足的三維數據。蘋果iPad和Android平板電腦用戶可以用手指縮放數據可視化界面,隨著界面縮放的級別不同,數據將實時進行更新。 ZoomData的數據可視化技術支持多種數據源,包括社交媒體、企業應用系統以及HadoopHDFS數據。
資料來源:煉數成金
留下你的回應
以訪客張貼回應