Hadoop會取代數據倉庫嗎?看看矽谷的專家怎麼說 摘要: 一想數據管理世界中的那個偉大的存在–數據倉庫吧。在過去的二十年中,儘管其他的系統和軟件在許許多多的迭代、變革中演進,甚至完全被新模型所拋棄,數據倉庫這個老骨幹卻安然屹立。她可能會偷偷地給自己的面頰,皺紋整容,也可能會激起一些不那麼令人深刻的模仿,但是沒有什麼能長期的吸引她的注意力。 直到現在。自從Hadoop出現在舞台上之後,一直有人嘀咕說,這個閃亮的新星正在為一些最好的數據管理角色提供服務–這些角色就是,在幾年前,數據倉庫已穩操勝券。 但是現在真的到了數據倉庫要退休的時候了嗎?Hadoop甚至想要進入她的鞋子裡嗎?還有誰在後面等著呢? 讓我們仔細看看這些據報導的競爭對手的全部本領。
一步一步學習大數據:Hadoop 生態系統與場景 摘要: Hadoop的出現解決了互聯網時代的海量數據存儲和處理,其是一種支持分佈式計算和存儲的框架體系。假如把Hadoop集群抽象成一台機器的話,理論上我們的硬件資源(CPU、Memoery等)是可以無限擴展的。
「範例卷積神經網絡」和信息最大化 摘要: 本文對「範例卷積神經網絡」的訓練方法僅作了簡單簡單的概述,所以如果想要獲得更多、更真實的信息,請閱讀論文原文。本文簡要介紹了「變分信息最大化」,並將其運用到了「範例卷積神經網絡」的案例中。我們在案例中只使用了一個數量適中的訓練圖像集,「範例卷積神經網絡」恰恰利用了這一點,把數據分佈表示爲一個經驗分佈(離散有限可能性的分佈)。
麥肯錫用數據說明,關於機器學習有120個商業機會 摘要: 麥肯錫研究發布了機器學習將影響的12個領域,每個領域又分為10個方面。換言之,這就是機器的120個商業機會。有理由相信,深度學習將徹底改變以下提及的這12個領域。這些行業的大多數領導者都在關注機器學習,不過他們卻認為深度學習帶來的改變在遙遠的未來才會發生。他們錯了。
數據科學界華山論劍:R與Python巔峰對決 摘要: 如果你是數據分析領域的新兵,那麼你一定很難抉擇——在進行數據分析時,到底應該使用哪個語言,R還是Python?在網絡上,也經常出現諸如“我想學習機器語言,我應該用哪個編程語言”或者“我想快速解決問題,我應該...
基於面部表情的情緒識別 摘要: 一直以來,作為人類我們都以擁有情感而自豪,這是我們和機器的一種本質上的區別。隨著計算機的發展,我們更期盼人機之間的溝通交流,尤其是一種帶有感情的溝通交流。計算機在情感方面的成長經歷也類似於我們每個人的...
想入門機器學習、數據挖掘,我該怎麼做? 摘要: 想入門機器學習、數據挖掘,我該怎麼做?我自己是本科數學出身,本科畢業的時候,我並不知道什麼是機器學習,也沒有寫過大型程序,更不要說去搞一個機器學習的算法和實踐了。這些本科時代就應該熟練掌握的東西包括: ...
自然語言處理 在資訊爆炸的今天,以往的巨量資料大部分是拿數據型資料做分析,例如銷售及顧客資料分析出啤酒與尿布的關聯,數據型分析已經日趨成熟,接下來將會是非結構化資料,也就是自然語言處理以及機器學習的時代,相信在不久的將來,電腦與人類的真實對話將會出現在你我眼前。
SpiderRock Launches Chart Tool to Visualize Options Volatility 摘要: Firm says new tool simplifies stock option data to enable easy comparisons of relative option values.
Data visualization: how to choose a chart type 摘要: Be sure to choose a chart that works best for your data.