摘要: 本文的主要目的是要破除許多學生對於貝式定理「困難又不實用」的刻板印象。事實上,我們生活之中有許多情況必須要運用貝式定理的邏輯思考,否則便容易產生偏差甚至陷於謬誤。

摘要: 有些公司儘管擁有出色的人工智能業務理念,但當他們意識到自己沒有足夠的數據時,卻會慢慢變得沮喪......然而,解決方案確實存在!本文的目的是簡要介紹其中一些(在實踐中被證明有效的那些)而不是列出所有現有的解決方案。

摘要: Here a list of resources, mostly in the form of tutorials, covering most important topics in data science: This resource is part of a series on specific topics related to data science: regression, clustering, neural networks, deep learning, Hadoop, decision trees, ensembles, correlation, outliers, regression, Python, R, Tensorflow, SVM, data reduction, feature selection, experimental design, time series, cross-validation, model fitting, dataviz, AI and many more.

摘要: 部署Hadoop時,存儲擴展可能很困難且成本高昂,因為存儲和計算位於同一硬件節點上。通過使用S3兼容存儲軟件並使用S3連接器而不是HDFS來實現存儲層,可以獨立地分離存儲,計算和擴展存儲。這提供了更大的靈活性和成本效益,但提出了性能如何受到影響的問題。

摘要: GBDT和xgboost在競賽和工業界使用都非常頻繁,能有效的應用到分類、回歸、排序問題,雖然使用起來不難,但是要能完整的理解還是有一點麻煩的。本文嘗試一步一步梳理GB、GBDT、xgboost,它們之間有非常緊密的聯繫,GBDT是以決策樹(CART)為基學習器的GB算法,xgboost擴展和改進了GDBT,xgboost算法更快,準確率也相對高一些。

Popular Tags