摘要: 自李開復認為台灣沒有發展 AI 的潛力一話道出之後,瞬間兩派人馬唇槍舌戰了起來。一派人認為台灣仍可一戰,還有 Appier 等優秀的新創人工智慧公司;另一派人則認為台灣的確在 AI 舞台上沒有伸展拳腳的餘力,應該找尋其他出路。

摘要: 所謂的熱點圖,是圖1)構建一張灰度圖,圖2)在每個熱點的位置上繪製並疊加形成灰色的熱點圖,圖3)根據顏色表生成熱點圖。不難看出,最核心的是圖2的過程。詳情參考《可視化之熱點圖》。

摘要: 作為目前最常見的一種可視化手段,熱圖因其豐富的色彩變化和生動飽滿的信息表達被廣泛應用於各種大數據分析場景。同時,專用於大數據統計分析、繪圖和可視化等場景的R 語言,在可視化方面也提供了一系列功能強大、覆蓋全面的函數庫和工具包。因此,對相關從業者而言,用R 語言繪製熱圖就成了一項最通用的必備技能。本文將以R 語言為基礎,詳細介紹熱圖繪製中遇到的各種問題和注意事項。

摘要: 在上篇兩篇文章裡《遇見大數據可視化:基礎研究》和《遇見大數據可視化:來做一個數據可視化報表》,簡單的介紹了下可視化的基礎和製作流程。我們也發現將數據進行可視化的好處,可以清晰有效的傳達數據信息,以實現“用視覺的方式去思考”。相比數據的公平,視覺的方式會帶有一定的引導性。

摘要: 簡單的介紹了數據可視化的基礎,將數據進行設計可視化後,可以讓我們有一種全新的方式去認識數據,改變對數據的呈現和思考方式。那現在就讓我們開始做一份數據的可視化圖表,一步步的來看下我們如何獲取數據,以及如何進行可視化的展示。

摘要: 針對內容複製,難以形象表達的信息,通過圖形簡單清晰地向受眾呈現出來,這種圖稱之為信息圖。在報紙、雜誌等紙質媒體中,為了讓讀者感到新奇且直觀容易的理解,運用了大量的信息圖解的表現。

摘要: 銀行貸款員需要分析數據,以便搞清楚哪些貸款申請者是“安全”那些是“有風險”的。銷售經理需要數據分析,以便幫助他猜測哪些顧客會購買計算機。再或者醫學研究人員需要分析乳腺癌數據,以便預測病人應當接受三種治療中的哪一種。在上面的例子中,數據分析任務都是分類,都需要構造一個模型來預測一個類別型數據。譬如安全或者不安全、會購買與不會購買、那種治療都是類別型。分類是一種重要的數據分析形式,它提取刻畫重要數據類的模型,用來預測(離散的、無序的)類標號。

摘要: 一想數據管理世界中的那個偉大的存在–數據倉庫吧。在過去的二十年中,儘管其他的系統和軟件在許許多多的迭代、變革中演進,甚至完全被新模型所拋棄,數據倉庫這個老骨幹卻安然屹立。她可能會偷偷地給自己的面頰,皺紋整容,也可能會激起一些不那麼令人深刻的模仿,但是沒有什麼能長期的吸引她的注意力。 直到現在。自從Hadoop出現在舞台上之後,一直有人嘀咕說,這個閃亮的新星正在為一些最好的數據管理角色提供服務–這些角色就是,在幾年前,數據倉庫已穩操勝券。 但是現在真的到了數據倉庫要退休的時候了嗎?Hadoop甚至想要進入她的鞋子裡嗎?還有誰在後面等著呢? 讓我們仔細看看這些據報導的競爭對手的全部本領。

摘要: 主要分析了大數據平台架構的生態環境,並主要以數據源、數據採集、數據存儲與數據處理四個方面展開分析與講解,並結合具體的技術選型與需求場景,給出了我個人對大數據平台的理解。

Popular Tags

每月文章