摘要: 本文的主要目的是要破除許多學生對於貝式定理「困難又不實用」的刻板印象。事實上,我們生活之中有許多情況必須要運用貝式定理的邏輯思考,否則便容易產生偏差甚至陷於謬誤。

摘要: 有些公司儘管擁有出色的人工智能業務理念,但當他們意識到自己沒有足夠的數據時,卻會慢慢變得沮喪......然而,解決方案確實存在!本文的目的是簡要介紹其中一些(在實踐中被證明有效的那些)而不是列出所有現有的解決方案。

摘要: Here a list of resources, mostly in the form of tutorials, covering most important topics in data science: This resource is part of a series on specific topics related to data science: regression, clustering, neural networks, deep learning, Hadoop, decision trees, ensembles, correlation, outliers, regression, Python, R, Tensorflow, SVM, data reduction, feature selection, experimental design, time series, cross-validation, model fitting, dataviz, AI and many more.

摘要: 部署Hadoop時,存儲擴展可能很困難且成本高昂,因為存儲和計算位於同一硬件節點上。通過使用S3兼容存儲軟件並使用S3連接器而不是HDFS來實現存儲層,可以獨立地分離存儲,計算和擴展存儲。這提供了更大的靈活性和成本效益,但提出了性能如何受到影響的問題。

摘要: 「機器學習中所有的算法都需要最大化或最小化一個函數,這個函數被稱為「目標函數」,其中,我們一般把最小化的一類函數,稱為「損失函數」。」本篇文章作者手把手教你找到損失函數達到極小值的點,解決機器學習優化中最重要的部分。

摘要: 不論是AI也好,其他學科也好,學習、研究的過程中不斷反思學科的歷史,總結學科的發展現狀,找出最重要的理念,總能讓人能「吾道一以貫之」。軟體工程師James Le近期根據他研究的經驗總結出了AI研究必須要知道的十種深度學習方法。