詳細內容
Coding
建立: 22 十一月 2017
點擊數: 2915
摘要: Many data science competitions suffer from a test set being markedly different from a training set (a violation of the “identically distributed” assumption). It is then difficult to make a representative validation set. We propose a method for selecting training examples most similar to test examples and using them as a validation set. The core of this idea is training a probabilistic classifier to distinguish train/test examples.
詳細內容
Coding
建立: 27 八月 2017
點擊數: 7591
摘要: 「開始」往往是最難的,尤其是當選擇太多的時候,一個人往往很難下定決定做出選擇。本教程的目的是幫助幾乎沒有 Python 機器學習背景的新手成長為知識淵博的實踐者,而且這個過程中僅需要使用免費的材料和資源即可 。
詳細內容
Coding
建立: 02 八月 2017
點擊數: 3440
摘要:
我們在處理資料時,為了萃取資料的重要資訊常常會使用主成份分析,不過有時候卻難以解釋主成分分析的結果與成因。此篇教導了主成份分析的視覺化方法,可以有效地幫助我們了解並給予主成份分析背後的意義
詳細內容
Coding
建立: 02 六月 2017
點擊數: 5861
摘要: 對於初學者來講,入門機器學習和深度學習非常困難;同時深度學習庫也難以理解。通過收集多方資源,我在Github 上創建了一個速查表庫,希望能對你有所幫助。歡迎訪問這個庫,並完善它(如果你也有速查表)。
詳細內容
Coding
建立: 03 五月 2017
點擊數: 2128
摘要:
Python 是一門更注重可讀性和效率的語言,尤其是相較於Java,PHP 以及C++ 這樣的語言,它的這兩個優勢讓其在開發者中大受歡迎。
詳細內容
Coding
建立: 23 四月 2017
點擊數: 2680
摘要:
每一步中我們都會對經過時間檢驗的國際象棋程序進行改進,我會展示不同算法風格所產生的影響。你也可以在GitHub上看到最終的AI算法。
詳細內容
Coding
建立: 21 二月 2017
點擊數: 7766
摘要: R語言翻轉教室,是作者參考社群多次開辦R教學的心得,撰寫出來的一份「自學教材」、 「自學教材」、「自學教材」。 有興趣的版友可以到官網上去安裝課程與進行教材。這份教材也具有挑戰性,沒有程式基 礎的版友做完一次約12 ~ 18小時。有經驗的版友大約是6 ~12小時,並不輕鬆。
詳細內容
Coding
建立: 10 九月 2016
點擊數: 2790
摘要: 神經網絡是一種數學模型,是存在於計算機的神經系統,由大量的神經元相連接並進行計算,在外界信息的基礎上,改變內部的結構,常用來對輸入和輸出間複雜的關係進行建模。......
詳細內容
Coding
建立: 11 八月 2016
點擊數: 5229
摘要: 從基礎理論入手,詳細講解了爬蟲內容,分為六個部分:我們的目的是什麼;內容從何而來;了解網絡請求;一些常見的限制方式;嘗試解決問題的思路;效率問題的取捨。......
詳細內容
Coding
建立: 11 七月 2016
點擊數: 2602
摘要: 在離人工智能越來越近的今天,研究界和工業界對神經網絡和深度學習的興趣也越來越濃,期待也越來越高。我們在深度學習與計算機視覺專欄中看過計算機通過卷積神經網絡學會了識別圖片的內容——模仿人類的看,而工業界大量的應用也證明了神經網絡能讓計算機學會聽(比如百度的語音識別),於是大量的精力開始投向NLP領域,讓計算機學會寫也一定是非常有意思的事情,試想一下,如果計算機通過讀韓寒和小四的小說,就能寫出有一樣的調調的文字,這是多帶勁的一件事啊。.......
詳細內容
Coding
建立: 21 六月 2016
點擊數: 13073
摘要: 大數據,無論是從產業上,還是從技術上來看,都是目前的發展熱點。在中國,政府控制著80%的數據,剩下的多由“BAT”這樣的大公司擁有,中小企業如何構建自己的大數據系統?其他企業如何建設自己的大數據系統? 推薦兩大應用最廣泛、國人認知最多的Apache開源大數據框架系統:Spark Hadoop......
詳細內容
Coding
建立: 05 六月 2016
點擊數: 2966
摘要: 隨著用戶使用天數的增加,不管你的業務是擴大還是縮減了,為什麼你的大數據中心架構保持線性增長的趨勢?很明顯需要一個穩定的基本架構來保障你的業務線。當你的客戶處在休眠期,或者你的業務處在淡季,你增加的計算資源就處在浪費階段;相對應地,當你的業務在旺季期,或者每週一每個人對上週的數據進行查詢分析,有多少次你忒想擁有額外的計算資源。......