摘要: 大數據時代CIO們在就如何收集、存儲、分析和展示大數據開展工作的同時,還被賦予了應對更加困難的挑戰——運用數據作為驅動業務決策的手段的重任。 IT組織可以如何利用大數據?經過一年左右與專家和CIO們的試探後,我...

  有天老總提了個要求,希望重新設定VP客戶分群,希望將客戶分成幾群來擬定行銷策略。CRM分析一個很重要的精神就是幫客戶分群,於是這個工作理所當然地落到我們的頭上。一般我們都會利用客戶的貢獻程度來將客戶分群,但是傳統上到底要切成幾群,或是要怎麼分一直沒有個依據,所以這次我們就利用很紅的八二法則來將客戶分群。

從這篇文章開始,會陸續帶入一些常用的分析方法,雖然分析方法百百種,但是在頭一次接觸資料時,總會有個先後順序,由淺入深,由外表到內在,由粗糙的細緻。整個資料分析的報告架構就如同說故事般,透過數據引導聽眾建立對於消費者的想像。故事的第一頁通常會描寫時間季節,寫到人物時也只會初步描述人物的年齡長相,資料分析的第一個環節也由這邊展開......

摘要: 在Go​​ogle搜索有關“大數據”,會出現很多個由立體0和1組成的圖片,一些解釋性的信息圖示,甚至出現“黑客帝國”的界面。那“大數據”到底是什麼,人類能夠理解嗎?如果問一家大公司的首席執行官什麼是“大數據”,他...

摘要: 一直以來,作為人類我們都以擁有情感而自豪,這是我們和機器的一種本質上的區別。隨著計算機的發展,我們更期盼人機之間的溝通交流,尤其是一種帶有感情的溝通交流。計算機在情感方面的成長經歷也類似於我們每個人的...

摘要: 想入門機器學習、數據挖掘,我該怎麼做?我自己是本科數學出身,本科畢業的時候,我並不知道什麼是機器學習,也沒有寫過大型程序,更不要說去搞一個機器學習的算法和實踐了。這些本科時代就應該熟練掌握的東西包括: ...

雖然近年來流行將海量資料分析稱為是資料採礦(Data Mining),但是對我來說,整個資料分析的過程也很像是幾年前很紅的漫畫"鋼之鍊金術師(簡稱鋼煉)"中的煉金術。


資料來源:http://zh.wikipedia.org/wiki/%E9%8B%BC%E4%B9%8B%E9%8D%8A%E9%87%91%E8%A1%93%E5%B8%AB

 

前面幾篇[Python][教學] 網路爬蟲(crawler)實務(上)–網頁元件解析[Python][教學] 網路爬蟲(crawler)實務(下)–爬蟲策略以及設定介紹了撰寫爬蟲程式基本的觀察以及實作方式.這樣的方式爬一兩個小網站還可以,但是如果要爬比較複雜或是多個網站就比較難維護.因此實務上比較常使用Scrapy這個爬蟲框架來處理,這次將介紹更進階的使用方法給各位.

 今年部落格最受歡迎文章:[Python] 現學現賣之網路爬蟲(Crawler)--以抓本BLOG為例是我剛學python時寫的程式,內容其實也都是照著老師的課程講義來做,很多細節也是矇懞懂懂.至今過了半年,爬網的經驗也多了一點,比較有內容可以跟大家分享.爬網有很多種用途,對比起搜尋引擎的全頁抓取,更多時候是抓取特定網站的特定內容,這時候除了爬蟲程式本身之外,對於網站欄位的解析更為重要.

摘要: 概述数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息。但是,这并不就意味着,数据可视化就一定因为要实现其功能用途而令人感到枯燥乏味,或者是为了看上去绚丽多彩而显得极端复杂。为了有效地传达思 ...

熱門標籤雲

每月文章