Spark VS Hadoop 兩大大數據分析系統深度解讀 摘要: 大數據,無論是從產業上,還是從技術上來看,都是目前的發展熱點。在中國,政府控制著80%的數據,剩下的多由“BAT”這樣的大公司擁有,中小企業如何構建自己的大數據系統?其他企業如何建設自己的大數據系統? 推薦兩大應用最廣泛、國人認知最多的Apache開源大數據框架系統:Spark Hadoop...... 閱讀全文...
如何簡單形象又有趣地講解神經網絡是什麼 摘要: 作者:王小龍0.分類 神經網絡最重要的用途是分類,為了讓大家對分類有個直觀的認識,咱們先看幾個例子: 垃圾郵件識別:現在有一封電子郵件,把出現在裡面的所有詞彙提取出來,送進一個機器裡,機器需要判斷這封郵件是否是垃圾郵件。 疾病判斷:病人到醫院去做了一大堆肝功、尿檢測驗,把測驗結果送進一個機器裡,機器需要判斷這個病人是否得病,得的什麼病。 貓狗分類:有一大堆貓、狗照片,把每一張照片送進一個機器裡,機器需要判斷這幅照片裡的東西是貓還是狗。...... 閱讀全文...
使用Spark Streaming + Kudu + Impala構建一個預測引擎 摘要: 隨著用戶使用天數的增加,不管你的業務是擴大還是縮減了,為什麼你的大數據中心架構保持線性增長的趨勢?很明顯需要一個穩定的基本架構來保障你的業務線。當你的客戶處在休眠期,或者你的業務處在淡季,你增加的計算資源就處在浪費階段;相對應地,當你的業務在旺季期,或者每週一每個人對上週的數據進行查詢分析,有多少次你忒想擁有額外的計算資源。...... 閱讀全文...
IBM Platform Symphony:功能強大的高效大數據分析平台 摘要: IBM Platform Symphony的一個核心優勢是,它能屏蔽底層基礎設施的複雜性,在共享底層基礎設施環境的基礎上,為上層各個不同的大數據應用提供一個多租戶的環境。同時,它還能支基於Hadoop開發的大數據應在同一個分佈式基礎設施環境上運行。...... 閱讀全文...
MarTech、Marketing Software、與 Marketing Technology 生態系統 摘要: 經過 2015 整年的媒體報導與熱議,相信應該有不少人都聽過 FinTech (Financial Technology,金融科技),其意涵與應用領域,大家多少有些了解。相對的,MarTech 則是較為陌生的名詞。...... 閱讀全文...
引力波數據居然是用 Python 分析的 摘要: 美國科學家11日宣布,他們去年9月首次探測到引力波。這一發現印證了物理學大師愛因斯坦100年前的預言。宣布這一發現的,是激光干涉引力波天文台(LIGO)的負責人。這個機構誕生於上世紀90年代,進行引力波觀測已經有...... 閱讀全文...
學神之路—— Python數據科學全攻略(原創譯文) 摘要: 如果你夢想成為一名數據科學家,或者已然是數據科學家的你想擴展自己的工具庫,那麼,你找對地方啦。 本文旨在為做數據分析的Python人提供一條全方位的學習之路,完整講述運用Python進行數據分析的所有步驟...... 閱讀全文...
為什麼可視化數據有一定的誤差值? 摘要: 大數據到底是什麼?大數據能做什麼?已經討論得太多太多,但是還是有很多值得聊一聊的,比如,大數據信息可視化,這是大數據應用於實際中必須要解決的問題。...... 閱讀全文...
Microsoft releases CNTK, its open source deep learning toolkit, on GitHub 摘要: Microsoft is making the tools that its own researchers use to speed up advances in artificial intelligence available to a broader group of developers by releasing its Computational Network Toolkit on GitHub... 閱讀全文...
機器學習開源盛宴:來自谷歌,三星,微軟,普林斯頓的貢獻 摘要: Tensor Flow是Google用於研究深層神經網絡技術,以及對相關產品做機器學習訓練的新一代深度學習系統,日前以Apache2.0許可開源... 閱讀全文...
數據科學界華山論劍:R與Python巔峰對決 摘要: 如果你是數據分析領域的新兵,那麼你一定很難抉擇——在進行數據分析時,到底應該使用哪個語言,R還是Python?在網絡上,也經常出現諸如“我想學習機器語言,我應該用哪個編程語言”或者“我想快速解決問題,我應該... 閱讀全文...