年度最強乾貨文-谷歌大神 Jeff Dean 總結 2018 年重大AI突破(附上完整論文)

摘要： Google 去年有哪些大事紀呢？除了在大會上發表了用人工智慧訂餐廳、新一代 Pixel 手機，還有新的 72 量子比特的量子電腦。這些令人振奮的科技新品，是時候來個大盤點，而谷歌大神 Jeff Dean 親自紀錄了 2018 年 Google 的重大突破，內文還附上論文連結跟開源碼，堪稱年度最強乾貨文！

Jeff Dean 代表 Google AI，完整總結了 2018。

這也是姐夫作為全球 AI 第一大廠總負責人的第一次年度匯報。

他說，2018 真是令 AI 工作者興奮的一年。

學術和應用兩開花，開源和新技術同步推進。

從重要 AI 技術應用突破講起，到展望 2019 結束。Jeff Dean 總結了 14 個大方面的 AI 成果，並透露全年 AI 論文發表數達 608 篇。

涵蓋量子計算、感知技術、計算攝影、算法框架、AutoML、機器人、醫療 AI，計算力和 TPU……

樁樁件件，不僅在當前推動了 AI 作用社會方方面面，而且也是對未來趨勢的小小展示。

毫不誇張地說，欲知 2018 AI 技術進展，看 Jeff 這篇總結再合適不過；欲知 2019 AI 會走向何方，看 Jeff 這篇也能獲益良多。

為了方便閱讀，我們先整理了一個小目錄給你：

智慧助手：打電話回郵件，都靠 AI
量子計算：72 量子比特設備、開源框架、可行的量子神經網絡……
自然語言理解：從 Transformer 到 BERT，碾壓各項 NLP 任務
感知：圖像識別和場景理解，語音增強與合成
拍照：照片動起來，夜景亮起來
算法和理論：谷歌帝國基石，從優化、算法選擇到應用
軟體系統：Mesh TensorFlow、TF-Ranking、JAX、隱私與安全
AutoML：自動找出最高效的網絡結構
TPU：給全世界提供大量算力
開源軟體和數據集：遠不止多巴胺，大量資源預警
機器人學：從多個角度入手，讓機器人更獨立，更強大
人工智會在其他領域的應用：物理學、生命科學、天文學
醫療：從視網膜診斷病症到癌症預測，從輔助診斷到拓展到臨床預測
合作研究：投入大量資源資助教師、學生和各方面研究人員進行研究
新地方、新面孔：持續在世界各地擴張，並廣納人才
展望 2019：對谷歌以及更廣泛的研究和工程領域產生更大影響
AI 原則：Google AI 歷史性指導準則，爭議性軍事項目之後製定了 7 大原則
AI 社會公益：展示 Google 利用 AI 技術推動社會公益的案例

完整報告如下：

智慧工具們

Google AI 也在不斷打造新技術應用幫助用戶提升效率，創造更大的社會價值。

簡而言之：努力打造 Google AI 小助手工具產品。

2018 最典型的莫過於 Google Duplex，這是一個匯集語音識別、語義理解和對話的 AI 系統，可以作為你的虛擬電話助手，訂餐廳、預約會議時間都不在話下。

還有 Smart Compose——智慧回覆。能夠基於語義分析和文本預測，幫助用戶提升郵件回覆的效率。

同樣的還有 Sound Search 和 Smart Linkify，都是 AI 提升用戶效率的嘗試。

Google 目前也在圍繞上述 AI 產品，展開多語言支持的努力，希望類似的產品通過小數據訓練學習，就能對全球更多地區和用戶產生更好的影響。

相關報導：

Google AI 打電話以假亂真

量子計算

量子計算是一種新興的計算範式，有望解決經典計算機無法解決的問題。

在過去的幾年裡，我們一直積極進行相關的研究，我們相信該領域正處在實現量子霸權能力的轉折階段，這將是量子計算領域的一個分水嶺。

2018 年，我們取得了許多令人興奮的成果，開發了一種新的 72 量子比特的量子計算設備 Bristlecone。在邁向量子霸權的過程中，這台設備擴展了量子計算機可以解決問題的規模。

相關報導：

首個 72 量子比特的量子計算機問世，谷歌出品

我們還發布了量子計算機的開源編程框架 Cirq，並探討了量子計算機如何用於神經網絡。

此外，我們還分享了理解量子處理器性能波動的經驗與技術，以及量子計算機如何作為神經網絡計算底層的一些想法。

相關報導：

谷歌證明量子神經網絡可訓練圖像分類

2019 年，我們期待在量子計算領域取得激動人心的成果！

自然語言理解

谷歌的自然語言研究在 2018 年取得了令人興奮的成果，既有基礎研究，也有以產品為中心的研究。

從 2017 年起，我們開始對 Transformer 進行改進，去年開發了一個名為通用 Transformer 模型的新的並行時間版本，該版本顯示了包括翻譯和語言推理在內的許多自然語言任務上的巨大進步。

相關論文：

Universal Transformers
https:// arxiv.org/pdf/1807.0381 9.pdf

我們還開發了 BERT，這是第一個深度雙向、無監督的語言表示，僅使用純文本語料庫進行預訓練，然後可以使用遷移學習對各種自然語言任務進行微調。

在 11 項自然語言任務上，BERT 比以往最先進成果有顯著的改進。

除了與各種研究團隊合作以實現 AI 幫助寫郵件（Smart Compose）和虛擬電話助手（Duplex）外，我們還努力使谷歌智能助手能夠更好地處理多語言使用案例，目標是使助手能與所有用戶進行自然的對話。

相關報導：

谷歌助手超進化：可以同時識別兩種語言了

感知

我們的感知研究解決了讓計算機理解圖像、聲音、音樂和視頻的難題，並為圖像捕捉、壓縮、處理、創造性表達和增強現實提供了更強大的工具。

2018 年，我們的技術提高了 Google Photos 組織照片的能力，這項功能也是用戶最關心的內容，比如給人和寵物照片分組。

Google Lens 和 Google Assistant 使用戶能夠了解周圍世界，實時獲取問題的答案，還能在讓你在谷歌圖像搜索中做更多的事情。

谷歌 AI 使命的一個關鍵方面是讓其他人從我們的技術中受益，我們在改進 Google API 一部分的功能和構建模塊方面取得了很大進展。

例如 Cloud ML API 中視覺和視頻方面的改進和新功能，以及通過 ML 工具包在面部識別相關的設備上構建模塊。

2018 年，我們對學術研究的貢獻包括在 3D 場景理解的深度學習方面的進步，例如立體放大（Stereo Magnification），這使我們得能夠用多張圖像合成場景的逼真視圖。

相關論文：

Stereo Magnification: Learning View Synthesis using Multiplane Images
https:// arxiv.org/abs/1805.0981 7

我們正在進行關於更好地理解圖像和視頻的研究，使用戶能夠在谷歌產品中找到、組織、增強和改善圖像和視頻，比如 Google Photos、YouTube、搜索等等。

2018 年，我們取得了多項顯著的進步，包括：

快速自下而上的聯合姿態估計和人物實例的分割模型

PersonLab: Person Pose Estimation and Instance Segmentation with a Bottom-Up, Part-Based, Geometric Embedding Mode
https://arxiv.org/abs/1803.08225

將複雜運動可視化的系統

MoSculp: Interactive Visualization of Shape and Time
http://mosculp.csail.mit.edu/

對人和物體之間時空關係建模的系統

Actor-Centric Relation Network
https://arxiv.org/abs/1807.10982

基於 distillation 和 3D 卷積的視頻動作識別的改進

D3D: Distilled 3D Networks for Video Action Recognition
https:// arxiv.org/abs/1812.0824 9

Rethinking Spatiotemporal Feature Learning: Speed-Accuracy Trade-offs in Video Classification
https:// arxiv.org/abs/1712.0485 1

在音頻領域，我們提出了一種無監督學習語義音頻表示的方法，並且顯著改進了語音合成，讓它更生動、更像人類。

相關論文：

Unsupervised Learning of Semantic Audio Representations
https:// ieeexplore.ieee.org/abs tract/document/8461684

Towards End-to-End Prosody Transfer for Expressive Speech Synthesis with Tacotron
https://arxiv.org/abs/1803.09047

多模態感知是一個越來越重要的研究課題。Looking to Listen 將輸入視頻中的視覺和聽覺提示結合起來，分離並增強視頻中說話者的聲音。

相關論文：

Looking to Listen at the Cocktail Party: A Speaker-Independent Audio-Visual Model for Speech Separatio
https://arxiv.org/abs/1804.03619

這項技術可以支持一系列應用：從視頻中的語音增強和識別，到視頻會議，再到改進的助聽器，尤其是在有多人說話的情況下。

在資源受限的平台上實現感知變得越來越重要。MobileNetV2 是谷歌的下一代移動計算機視覺模型，廣泛應用於學術界和工業界。

相關論文：

MobileNetV2: Inverted Residuals and Linear Bottlenecks
http://openaccess.thecvf.com/content_cvpr_2018/papers/Sandler_MobileNetV2_Inverted_Residuals_CVPR_2018_paper.pdf

MorphNet 提出了一種學習深層網絡結構的有效方法，這種方法可以在計算資源受到限制時，全面提高圖像和音頻模型的性能，最近在自動生成移動網絡架構方面的工作表明，實現更高的性能也是可能的。

相關論文：

MorphNet: Fast & Simple Resource-Constrained Structure Learning of Deep Networks
http://openaccess.thecvf.com/content_cvpr_2018/html/Gordon_MorphNet_Fast__CVPR_2018_paper.html

拍照算法

過去幾年中，手機相機的拍照質量和功能提升十分顯著，雖然手機實際物理傳感器的進步是一方面，不過更大的進步則是拍照算法方面的。

我們的研究團隊發布了新技術，與 Google 的安卓和消費者硬件團隊密切合作，讓這項新技術在最新的 Pixel 等安卓手機和其他設備上落地。

2014 年，我們發布了 HDR+，一種依靠計算機軟件將單幀對齊融合的技術。HDR+最初應用的主要目的是為了讓圖片比單次曝光有更大的動態範圍，但隨後，拍攝動態幀併計算分析成為了 2018 年相機進步的一種通用方式。例如 Pixel 2 中的動態照片（Motion Photos）功能和動態劇照（Motion Stills）裡的 AR 模式。

動態照片
http://link.zhihu.com/?target=https%3A//ai.googleblog.com/2018/03/behind-motion-photos-technology-in.html

動態劇照 AR 模式
http://link.zhihu.com/?target=https%3A//ai.googleblog.com/2018/02/the-instant-motion-tracking-behind.html

2018 年，我們在拍照算法方面的主要工作之一就是創造了夜視（Night Sight）功能，讓 Pixel 手機的相機能看到黑暗中的物體，這項功能贏得了媒體和用戶的讚譽。

相關報導：

宛如白晝，谷歌發布最強夜景拍照 AI 算法，單攝秒殺一眾蘋果華為三星

當然，夜視只是我們團隊開發的多種幫助用戶攝影的軟件功能之一，另外還有用機器學習提供更好的人像模式、用 Super Res Zoom 看得更清晰更遠、用 Top Shot 和 Google Clips 捕捉更好的瞬間。

機器學習人像模式
http://link.zhihu.com/?target=https%3A//ai.googleblog.com/2018/11/learning-to-predict-depth-on-pixel-3.html

Super Res Zoom
http://link.zhihu.com/?target=https%3A//ai.googleblog.com/2018/10/see-better-and-further-with-super-res.html

Top Shot
http://link.zhihu.com/?target=https%3A//ai.googleblog.com/2018/12/top-shot-on-pixel-3.html

Google Clips
http://link.zhihu.com/?target=https%3A//ai.googleblog.com/2018/05/automatic-photography-with-google-clips.html

算法和理論

算法是 Google 系統的基幹，關係到我們所有產品，從 Google Trips 旅行 App 背後的路徑選擇算法，到谷歌云的哈希一致性校驗都是如此。

相關論文：

Consistent Hashing with Bounded Loads
http://link.zhihu.com/?target=https%3A//arxiv.org/abs/1608.01350

過去一年，我們繼續研究算法和理論，覆蓋了從理論基礎到應用算法，從圖數據挖掘到隱私保護計算。

我們在優化方面的工作涉及到機器學習的持續優化、分佈式組合優化等領域。

在持續優化上，我們研究隨機優化算法訓練神經網絡的收斂性的工作，展示了 ADAM 變體等一些流行的基於梯度優化方法存在的問題，但也為新的基於梯度的優化算法提供了監視的基礎，獲得了 ICLR 2018 最佳論文。

相關論文：

On the Convergence of Adam and Beyond
http://link.zhihu.com/?target=https%3A//openreview.net/forum%3Fid%3DryQu7f-RZ

上圖就是 ADAM 和 AMSGRAD 在一個簡單一維凸問題模擬例子上的性能對比，左中兩幅是在線設置，最右一幅是隨機設置。

在分佈式優化上，我們努力提高一些經過充分研究的組合優化問題的循環和通信複雜性，比如通過 round compression、core-sets、以及子模塊最大化、k 核分解等進行圖匹配。

相關論文：

Round Compression for Parallel Matching Algorithms
http://link.zhihu.com/?target=https%3A//dl.acm.org/citation.cfm%3Fid%3D3188764

Optimal Distributed Submodular Optimization via Sketching
http://link.zhihu.com/?target=https%3A//dl.acm.org/citation.cfm%3Fid%3D3220081

Parallel and Streaming Algorithms for K-Core Decomposition
http://link.zhihu.com/?target=http%3A//proceedings.mlr.press/v80/esfandiari18a/esfandiari18a.pdf

在更多應用層面，我們開發的算法技術，能通過 sketching 實現大規模集合覆蓋，能為數万億邊的圖解決平衡分區和分層聚類問題。

我們關於 online delivery services 的工作，還獲得了 WWW’18 會議的最佳論文呢提名。

相關論文：

Minimizing Latency in Online Ride and Delivery Services
http://link.zhihu.com/?target=https%3A//dl.acm.org/citation.cfm%3Fdoid%3D3178876.3186104

最後，我們的開源優化平台 OR-tools 在 Minizinc 約束規劃競賽中獲得了 4 枚金牌。

平台主頁：
http://link.zhihu.com/?target=https%3A//developers.google.com/optimization/

在算法選擇理論中，我們提出了新的模型，研究了重建（reconstruction）問題、學習多項 logit 混合問題。我們還研究了可通過神經網絡學習的函數類，以及如何使用機器學習來改進經典在線算法。

相關論文：

A Discrete Choice Model for Subset Selection
http://link.zhihu.com/?target=https%3A//dl.acm.org/citation.cfm%3Fdoid%3D3159652.3159702

Discrete Choice, Permutations, and Reconstruction
http://link.zhihu.com/?target=https%3A//epubs.siam.org/doi/10.1137/1.9781611975031.38

Learning a Mixture of Two Multinomial Logits
http://link.zhihu.com/?target=http%3A//proceedings.mlr.press/v80/chierichetti18a.html

Convergence Results for Neural Networks via Electrodynamics
http://link.zhihu.com/?target=http%3A//drops.dagstuhl.de/opus/volltexte/2018/8352/

Improving Online Algorithms via ML Predictions
http://link.zhihu.com/?target=http%3A//papers.nips.cc/paper/8174-improving-online-algorithms-via-ml-predictions

對 Google 來說還有一件事非常重要，那就是理解具有強隱私保障的學習技術。

在這一領域，我們開發了兩種新方法，分析如何通過迭代和混排來強化差分隱私。

我們還運用差分隱私技術，設計了對博弈具有魯棒性的激勵感知學習方法。這樣的學習技術可以用於高效在線市場設計。

相關論文：

Privacy Amplification by Iteration

http://link.zhihu.com/?target=https%3A//ieeexplore.ieee.org/abstract/document/8555134

Amplification by Shuffling: From Local to Central Differential Privacy via Anonymity

http://link.zhihu.com/?target=https%3A//epubs.siam.org/doi/abs/10.1137/1.9781611975482.151

Incentive-Aware Learning for Large Markets
http://link.zhihu.com/?target=https%3A//dl.acm.org/citation.cfm%3Fid%3D3186042

我們在市場算法領域的新研究，還包括幫助廣告主測試廣告競價激勵兼容性的技術，優化 App 內廣告刷新的技術等。

相關論文：

Testing Incentive Compatibility in Display Ad Auctions
http://link.zhihu.com/?target=https%3A//pdfs.semanticscholar.org/30a7/773faea229efa6a47178c396ef7b9617fcef.pdf

Optimizing Ad Refresh In Mobile App Advertising
http://link.zhihu.com/?target=https%3A//dl.acm.org/citation.cfm%3Fid%3D3186045

我們也推動了重複拍賣動態機制的發展，展示了對缺乏未來預測、對嘈雜預測、對異質買方行為具有魯棒性的動態拍賣機制，還把研究結果擴展到動態雙重拍賣上。

最後，關於在線優化、在線學習的魯棒性，我們開發了新的在線分配算法，用於流量峰值的隨即輸入，以及對損壞的數據具有魯棒性的新型 bandit 算法。

軟體系統

我們在軟件系統方面的一大部分研究依然是在建設機器學習模型和 TensorFlow 上。

例如，我們發布了 TensorFlow 1.0 動態流程控制的動態設計與實踐，我們的一些新研究引入了一個我們稱之為 Mesh TensorFlow 的系統，這使得用模型並行指定大規模分佈式計算變得容易，有時會有數十億個參數。

相關論文：

The Case for Learned Index Structures
http://link.zhihu.com/?target=https%3A//arxiv.org/abs/1712.01208

Dynamic Control Flow in Large-Scale Machine Learning
http://link.zhihu.com/?target=http%3A//delivery.acm.org/10.1145/3200000/3190551/a18-yu.pdf

Mesh-TensorFlow: Deep Learning for Supercomputers
http://link.zhihu.com/?target=https%3A//papers.nips.cc/paper/8242-mesh-tensorflow-deep-learning-for-supercomputers

另一個例子是，我們發布了一個使用 TensorFlow 的可擴展深度神經排序庫。

相關論文：
TF-Ranking: Scalable TensorFlow Library for Learning-to-Rank
http://link.zhihu.com/?target=https%3A//arxiv.org/abs/1812.00073

我們還發布了 JAX，這是一個加速器支持的 NumPy 變體，支持自動將 Python 函數區分為任意順序。雖然 JAX 不是 TensorFlow 的一部分，但它利用了一些相同的底層軟件基礎架構（例如 XLA），並且它的一些想法和算法對我們的 TensorFlow 項目有所幫助。

最後，我們繼續研究機器學習的安全性和隱私性，以及在人工智能係統中老發安全和隱私的開源框架，如 CleverHans 和 TensorFlow Privacy。

相關開源項目：
CleverHans
http://link.zhihu.com/?target=https%3A//github.com/tensorflow/cleverhans

TensorFlow Privacy
http://link.zhihu.com/?target=https%3A//github.com/tensorflow/privacy

我們的另一個重要的研究方向是將機器學習在軟件系統中在堆棧的許多層面上應用。

例如，我們繼續努力使用分層模型將計算部署到設備上，並且我們有助於學習內存訪問模式。我們還繼續探索如何使用學習指數來取代數據庫系統和存儲系統中的傳統索引結構。正如我去年寫下的，我們在計算機系統中使用機器學習僅僅停留在表面。

相關論文：
A HIERARCHICAL MODEL FOR DEVICE PLACEMENT
http://link.zhihu.com/?target=https%3A//openreview.net/pdf%3Fid%3DHkc-TeZ0W

Learning Memory Access Patterns
http://link.zhihu.com/?target=http%3A//proceedings.mlr.press/v80/hashemi18a/hashemi18a.pdf

2018 年，得益於 Google 的 Project Zero 團隊與其他人的合作，我們發現了 Spectre 和 Meltdown，現代計算機處理器中新的嚴重安全漏洞，這兩者以及其他相關的漏洞讓計算機架構研究者們相當忙碌。

在我們繼續努力模擬 CPU 行為時，我們的編譯器研究團隊將他們用於測量機器指令延遲和端口壓力的工具集成到 LLVM 中，從而可以做出更好的編譯決策。

相關文檔：
llvm-exegesis – LLVM Machine Instruction Benchmark
http://link.zhihu.com/?target=https%3A//llvm.org/docs/CommandGuide/llvm-exegesis.html

Google 產品，我們的雲產品和機器學習模型推理決定了計算、存儲和網絡提供大規模、可靠、高效的技術基礎架構的能力。

過去一年的一些研究亮點包括 Google 軟件定義網絡 WAN 的發展，一個獨立的聯合查詢處理平台，可以在許多存儲系統中對基於不同文件格式存儲的數據執行 SQL 查詢（BigTable、Spanner、Google Spreadsheets 等）以及我們廣泛使用的代碼審查報告，調查 Google 代碼審查背後的動機，當前的實踐以及開發人員的滿意度和挑戰。

F1 Query: Declarative Querying at Scale
http://link.zhihu.com/?target=https%3A//storage.googleapis.com/pub-tools-public-publication-data/pdf/fa380016eccb33ac5e92c84f7b5eec136e73d3f1.pdf

運行內容託管等大型 Web 服務需要在動態環境中實現穩定的負載平衡。我們開發了一致的哈希方案，對每台服務器的最大負載提供了嚴格的可證明保證，並將其部署到 Google Cloud Pub/Sub 中的雲客戶。

在提供了我們論文的早期版本後，Vimeo 的工程師找到了論文，在 haproxy 中實現並開源，並將其用於 Vimeo 的負載平衡項目。結局是戲劇性的：應用這些算法思想幫助他們將緩存帶寬減少了近 8 倍，消除了縮放瓶頸。

AutoML

AutoML，是用機器學習來加速機器學習的一種方法。

在這個領域，我們已經做了很多年的研究，長期目標是開發出那種拿到一個新問題，也能自動解決的學習系統：

從之前解決的問題裡面獲得的啟發、習得的能力，就是處理新問題的依據。

這一領域的早期研究，大多是用強化學習做的，不過我們也對進化算法感興趣。

去年我們就展示過，怎樣用進化算法自動找到各種不同的視覺任務裡，最先進 (State-of-the-Art) 的神經網絡結構是什麼。

我們還探索過，怎樣把強化學習用到神經網絡結構搜索以外的其他地方。發現有這些用途：

1) 自動生成圖像變換序列 (Image Transformation Sequence) ，來提高各種圖像模型的準確性。

2）找到新的符號優化表達方式 (Symbolic Optimization Expressions)，比常用的優化更新規則更有效。

我們在 AdaNet 上的成果，展示瞭如何造出一個快速靈活的 AutoML 算法：

另外一個關注點，是自動發現計算效率高的神經網絡結構，讓網絡在手機、自動駕駛汽車這樣的環境下也能跑起來：不論是計算資源有限，還是時間有限。

在這個問題上，我們證明了：把模型準確度和推理計算時間結合到一起，來設置強化學習的獎勵函數，就可以找到高準確度的那些模型，應對不同的環境限制。

除此之外，我們也探索了用機器學習自動壓縮機器學習模型，減少參數，就會減少計算資源的佔用。

TPU

TPU 是谷歌內部用的機器學習硬體加速器，從一開始就是設計用來支持大規模訓練和大規模推理的。

谷歌的許多重大突破都是在 TPU 的加速下實現的，比如剛才討論過的 BERT 自然語言處理模型。TPU 也能讓世界各地的研究人員在谷歌開源研究的基礎之上，尋求自己的研究突破。

還是以 BERT 為例，任何人都可以在 TPU 上，用 Colab 來給 BERT 做微調。TensorFlow Research Cloud 已經為數千研究人員，提供了大量的雲 TPU 算力。

我們還把多代 TPU 硬件，用雲 TPU 的形式做了商用：比如名叫 Cloud TPU Pods 的機器學習超級計算機，支持大規模訓練。

而在谷歌內部，除了讓機器學習研究進步更快之外，TPU 也驅動了谷歌核心產品的重大改進：搜索、YouTube、Gmail、谷歌助手、谷歌翻譯，等等。

希望不論是谷歌還是谷歌以外的機器學習團隊，都能在 TPU 提供的、前所未有的計算規模之下，達成更多的成就。

開源軟體和數據集

發布開源軟件、創建新的公共數據集，是我們為學界和業界做出貢獻的兩種主要方式。

TensorFlow

在這一方面，我們做過最大的努力之一就是 TensorFlow。2015 年 11 月發布的機器學習系統，不久前才慶祝了三歲生日。

三年間，TensorFlow 已被下載了超過 3000 萬次，貢獻者超過 1700 個，添加過 45000 多次代碼 (Commits) 。

2018 年，TensorFlow 經歷了 8 次主要版本更新，增加了重要功能：比如 Eager Execution，以及分佈策略 (Distribution Strategies) 。

我們還在開發過程中啟用了大眾評審，讓廣大貢獻者都參與進來。

隨著 TensorFlow Lite、TensorFlow.js 和 TensorFlow Probability 這些相關產品的推出，TensorFlow 生態系統在 2018 年茁壯成長。

我們很高興地發現，TensorFlow 的 GitHub 的用戶留存率 (User Retention) ，在主流機器學習/深度學習框架裡面是最高的。

除此之外，TensorFlow 團隊也在加快處理 GitHub 上面討論的問題 (Issue) ，給外部貢獻者提供一個更好的體驗。

研究方面，TensorFlow 還在繼續為這個世界大量的機器學習和深度學習研究提供支持，從 Google Scholar 論文發表的數據上就能看出。

另外，TensorFlow Lite 僅僅上線一年，就有 15 億台設備搭載了這套系統。

還有，TensorFlow.js 是 JavaScript 機器學習框架裡面的第一名：推出 9 個月，CDN (內容分發網絡) 點擊量已經超過 200 萬，下載 25 萬次，GitHub 標星 10000 多。

其他框架

除了繼續發展開源生態系統，2018 年還發布了一個新框架「多巴胺 (Dopamine)」，用來做靈活、可重複的強化學習。量子位報導在此：

令人激動！谷歌推強化學習新框架「多巴胺」，基於 TensorFlow，已開源丨附 github

發布了 What-If 可視化工具，可以快速了解數據集的特徵（無需編寫任何代碼）：

https://pair-code.github.io/what-if-tool/

發布了 TF-Ranking 高級庫，用來表達涉及排名的機器學習問題 (報導如下) ：

谷歌開源 TF-Ranking 可擴展庫，支持多種排序學習

發布了 AdaNet，一個快速靈活的 AutoML 框架 (報導如下) ：

谷歌開源集成學習工具 AdaNet：2017 年提出的算法終於實現了

還發布了能在瀏覽器裡實時做 tSNE 可視化的框架，基於 TensorFlow.js：

tensorflow/tfjs-tsne

數據集

公開數據集是很好的靈感來源，可以讓整個學界看到有趣的數據和有趣的問題，在許多不同的任務上獲得更好的結果。

這一年，我們很高興地發布了谷歌數據集搜索引擎，可以在全網搜索數據集：

Google 數據集搜索神器上線，和搜索論文一樣簡單| 還不去訓練網絡？

發布了 Open Images V4，一個包含 190 萬張圖 1540 萬個邊界框、600 個類別的圖像數據集：
https://storage.googleapis.com/openimages/web/index.htmlstorage.googleapis.com

發布了動作識別 AVA 數據集，提供視聽雙重標註：
https://research.google.com/ava/download.htmlresearch.google.com

還發布了新版本的 Youtube-8M 數據集，包含 610 萬個調視頻，3862 個類別，26 億次視聽特徵標註：
https://research.google.com/youtube8m/download.htmlresearch.google.com

HDR+連拍數據集 (HDR+ Burst Photography Dataset)，是計算攝影領域的數據集：
https://hdrplusdata.org/hdrplusdata.org

Google-Landmarks，地標識別數據集：
https://www.kaggle.com/google/google-landmarks-datasetwww.kaggle.com

其中，許多數據集都是伴隨著挑戰賽一同發布的，HDR+連拍數據集也是，地標數據集也是，Youtube-8M 也是。還有一場 Kaggle 比賽，內容是識別「Quick, Draw!」(猜畫小歌) 數據集裡的塗鴉：
https://quickdraw.withgoogle.com/dataquickdraw.withgoogle.com

機器人

2018 年，我們朝著理解機器學習如何教機器人在世界上行動的目標，取得了重大進展，教機器人抓取新物體的能力也達到了一個新的里程碑，並通過這種方式幫助機器人在沒有人類監督的情況下了解物體。

將機器學習、基於抽樣的方法和機器人幾何學結合，我們在機器人運動學習方面也取得了進展。機器人在通過自主觀察來更好地理解世界結構的能力上，取得了巨大的進步。

我們首次成功地在真實的機器人上在線訓練了深度強化學習模型，並且正在尋找新的理論基礎方法來讓機器人控制更穩定。

相關報導：

受嬰兒抓鬮啟發，谷歌讓機器臂自學抓取物體，不用標註數據

人工智慧在其他領域的應用

2018 年，我們將機器學習應用到了物理和生物科學中的各種問題上。使用機器學習，我們可以向科學家提供「成百上千的研究助理」，來幫他們助挖掘數據，從而使他們變得更有創造力和生產力。

我們發表在《Nature Methods》上關於神經元高精度自動重建的論文提出了一種新的模型，與以前的深度學習技術相比，這個模型將自動解釋連接組學數據的精度提高了一個層次。

相關論文：

High-precision automated reconstruction of neurons with flood-filling networks
https://www. nature.com/articles/s41 592-018-0049-4

其他一些將機器學習應用到科學問題中的例子包括：

通過數據挖掘恆星的光變曲線尋找太陽系外的新行星

Identifying Exoplanets with Deep Learning: A Five-planet Resonant Chain

識別短 DNA 序列的起源或功能

A deep learning approach to pattern recognition for short DNA

自動檢測離焦顯微鏡圖像

Assessing microscope image focus quality with deeplearning

用數字技術製作同一細胞的多重染色圖像

In Silico Labeling: Predicting Fluorescent Labels in Unlabeled

自動將質譜輸出映射到肽鏈上

http://link.zhihu.com/?target=https%3A//arxiv.org/pdf/1808.06576.pdf

醫療

在過去的幾年裡，我們一直在將機器學習應用到醫療領域。我們相信，機器學習可以通過增強醫療專業人員的直覺和經驗而產生巨大影響。

在這個領域，我們通常與醫療保健組織合作，解決基礎研究問題 (利用臨床專家的反饋使我們的結果更加可靠) ，然後在備受尊敬的、有同行評審的科學和臨床期刊上發表研究結果。

一旦這項研究得到臨床和科學驗證，我們將進行用戶和人機交互研究，以了解我們如何在真正的臨床環境中部署這項技術。

2018 年，我們將研究範圍從計算機輔助診斷擴展到了臨床任務預測中。

在 2016 年年底，我們發表的一項回顧性研究顯示，一個經過訓練的、根視眼底圖像來評估糖尿病病變的模型，能夠與經過美國醫學委員會認證的眼科醫生相媲美。

2018 年，我們得到了一個與視網膜專家水平相當的模型。我們發表了一篇評估報告，展示了眼科在醫生與機器學習模型結合，診斷上比單獨使用任何一種方法都更準確。

我們與 Alphabet 的其他兄弟公司合作，在印度的 Aravind 眼科醫院和泰國衛生部下屬的 Rajavithi 醫院等 10 多個地點部署了這套糖尿病視網膜病變檢測系統。

左邊是視網膜眼底圖像，由眼科醫生評定為中度 DR (「Mo」)(ground truth)。右上角是模型預測分數的圖示 (「n」=無 DR,「Mi」=輕度 DR,「Mo」=中度 DR)。右下角是醫生未經協助 (“Unassisted”) 的情況下和看到模型預測後，醫生給出的分數 (「Grades Only」)。

相關論文：

Improving the Effectiveness of Diabetic Retinopathy Models
http://www. aaojournal.org/article/ S0161-6420(18)31575-6/fulltext

我們還推出了其他的機器學習模型，可以從視網膜圖像中評估人們患有心血管疾病的風險。

相關論文：

Assessing Cardiovascular Risk Factors with Computer Vision
https://www. nature.com/articles/s41 551-018-0195-0.epdf

這一年，我們還在繼續關注病理學，展示瞭如何使用機器學習改善前列腺癌的分級狀況，通過深度學習來檢測轉移性乳腺癌。

並開發了一種增強現實顯微鏡的原型，將計算機視覺模型中的視覺信息實時疊加到顯微鏡操作員的視野中，來幫助病理學家和其他科學家進行分析診斷。

前列腺癌論文：

Development and Validation of a Deep Learning Algorithm for Improving Gleason Scoring of Prostate Cancer
https:// arxiv.org/abs/1811.0649 7

乳腺癌論文：

Artificial Intelligence–Based Breast Cancer Nodal Metastasis Detection
https:// doi.org/10.5858/arpa.20 18-0147-OA

Impact of Deep Learning Assistance on the Histopathologic Review of Lymph Nodes for Metastatic Breast Cancer
https:// doi.org/10.1097/PAS.000 0000000001151

在過去的四年裡，在使用深度學習技術，基於電子健康記錄做出臨床相關的預測記錄方面，我們進行了大量的研究工作。

2018 年，我們與芝加哥大學醫學院、加州大學舊金山分校和斯坦福大學醫學院合作，在《Nature Digital Medicine》雜誌上發表了我們的研究成果，展示了機器學習模型在識別電子醫療記錄中的應用，能夠比當前的臨床最佳實踐更準確地預測各種臨床相關的任務。

相關論文：

Scalable and accurate deep learning with electronic health records
https://www. nature.com/articles/s41 746-018-0029-1

在進行這些研究時，我們還開發了一些工具，使得創建這些模型變得非常容易。這些工具也能夠應用到完全不同的任務和數據集上。

我們還開發了與快速醫療互操作性資源 (FHIR) 標準相關的開源軟件，目的是幫助醫療數據處理變得更加容易和標準化。

GitHub 鏈接：

google/fhirgithub.com

我們還提高了基於深度學習的變體調用程序 DeepVariant 的準確性、速度和實用性。研究團隊與合作夥伴一起努力，最近在《Nature Biotechnology》雜誌上發表了經過同行評審的論文。

相關論文：

A universal SNP and small-indel variant caller using deep neural networks
https://www. nature.com/articles/nbt .4235

使用歷史收集的數據訓練機器學習模型時，重要的是了解哪些數據有偏差，以它們及是如何被編入數據中的。

機器學習提供了一個發現和解決偏見的機會，以及推進衛生公平的機會，我們正在設計這樣的系統。

合作研究情況

我們以許多不同的方式與外部研究團體互動，包括教師參與和學生支持。

我們感到自豪的是，在 2018 學年期間，我們招收了數百名本科生、碩士生和博士生作為實習生，並為北美、歐洲和中東的學生提供多年期博士研究生獎學金。

除了財務支持，每個獎學金獲得者都被指派一個或多個谷歌研究人員作為導師，我們把所有的研究人員聚集在一起，參加一年一度的谷歌博士獎學金峰會。

在這裡，他們可以接觸到谷歌最先進的研究成果，並有機會與谷歌的研究人員以及來自世界各地的其他博士研究員交流。

作為對獎學金項目的補充，我們還有一個 Google AI Residency 項目，可以讓那些想要學習進行深度學習研究的人花一年時間在谷歌工作，並接受谷歌研究人員的指導。

2018 年是這個項目的第三個年頭，很多研究人員都加入了谷歌遍布全球的各種團隊，從事諸如機器學習、感知、算法和優化、語言理解、醫療保健等領域的研究。

每年，我們還通過 Google Faculty Research Awards 項目支持一些教師和學生的研究項目。

2018 年，我們還在谷歌的辦公地點為特定領域的教師和研究生舉辦研討會。如：

在印度班加羅爾辦事處舉辦的 AI/ML 研究和實踐研討會；
在蘇黎世辦事處舉辦的算法和優化研討會；
在桑尼維爾舉辦的 ML 醫療應用研討會；
在馬在諸塞州劍橋辦事處舉辦的 ML 公平和偏見研討會。

我們認為，公開地為更廣泛的研究群體做出貢獻是支持健康和富有成效的研究生態系統的關鍵部分。

除了發布開源代碼和數據集，我在們頂級會議和期刊上公開發表了大部分研究成果，並積極參與組織和讚助各種不同學科的會議。

比如 ICLR 2018、NAACL 2018、ICML 2018、CVPR 2018、NeurIPS 2018、ECCV 2018 和 EMNLP 2018。

2018 年，谷歌還廣泛參與了 ASPLOS、HPCA、ICSE、IEEE Security & Privacy、OSDI、SIGCOMM 以及許多其他會議。

新的地方，新的面孔

2018 年，我們非常高興地歡迎許多背景廣泛的新人加入我們的研究組團隊我們在非洲開設了第一個人工智能研究辦公室。

我們擴大了在巴黎、東京和阿姆斯特丹的人工智能研究領域，並在普林斯頓開設了一個研究實驗室。

我們繼續在世界各地廣納人才，你可以在這裡了解更多關於工作的信息。

相關鏈接：

Join Us – GoogleAIai.google

展望 2019 年

這篇文章，只是總結了 2018 年所做研究的一小部分。

當我們回顧 2018 年時，我們很興奮，也很自豪！

2019 年，我們期待著能夠對谷歌以及更廣泛的研究和工程領域產生更大的影響！

One more great thing

AI 原則

實際上，這篇報導最開篇，首先談到的是 Google 在 2018 年發布的 AI 原則。

在過去幾年中，Google 關注到 AI 的重大進步及其對產品和用戶日常生活的積極影響。

但作為搞 AI 的人，保證 AI 向善，始終對社會有益，也是責任所在、題中之義。

2018 年，Google 發布了 AI 七原則，並圍繞這些原則展開應用實踐。

AI 原則為 Google AI 應用和發展提供了指導，讓我們知道在 AI 實踐中該做什麼、不該做什麼，哪些值得做、哪些則要避免。

比如在實踐過程中，Google AI 原則就讓我們對“AI 公平”、“對所有人負責”等有更強使命感。

在機器學習公平性、模型可解釋性方面，投入精力，展開新研究。

在 Google 翻譯中，利用 AI 消除性別偏見。

並發布更多更具包容性的圖像數據集和模型，讓計算機視覺能夠適合全球多元文化。

值得一提的是，這也促進我們可以更廣泛地與全球研究組織一起努力，進一步推動 AI 公平和機器學習普及。

相關報導：

Google AI 七原則

AI for Good

接著，AI 原則之後，緊接著匯報 Google AI 這一年在社會公益方面的努力。

第一個例子，用 AI 來進行洪水預測工作。Google 內部許多團隊通力合作，希望對洪水變化有更精準及時的信息監測，以便洪水多發地區的人，可以更有效保護自己的生命及財產安全。

第二個例子是地震餘震的預測工作。

Google 展示的機器學習模型，可以比傳統餘震預測方式更精準，而且該機器學習模型可解釋，利於地震科學家圍繞餘震數據展開更多研究，不僅能進一步促進餘震精準預測，還對地質等信息有更深了解。

而且 Google AI+外部跨領域科學家這樣的合作模式也越來越多，更多工程師、科學家開始使用 TensorFlow 來解決科學和社會問題。比如識別並精准保護瀕危鯨魚、探索發現行星，以及識別蟲患木薯植物等。

為了進一步推動 AI for Good 的創新。

Google 還設立了 2500 萬美元基金，專門用來支持 AI 為公益的項目，而且參與者不必一定是 AI 方面的專家，只要你的點子好、對社會有益，谷歌願意讓 AI 專家提供技術支持，此外還為你提供谷歌雲服務。

一句話：只要你的出發點有益社會公益，Google 就會給錢、給資源，做到 AI 技術最大化支援。

或許，通過 AI 原則和 AI 公才能益，解釋 Google 何以為 Google。

相關報導：

Google AI for Good

轉貼自： BuzzOrange

年度最強乾貨文-谷歌大神 Jeff Dean 總結 2018 年重大AI突破(附上完整論文)

智慧工具們

量子計算

自然語言理解

感知

拍照算法

算法和理論

軟體系統

AutoML

TPU

開源軟體和數據集

TensorFlow

其他框架

數據集

機器人

人工智慧在其他領域的應用

醫療

合作研究情況

新的地方，新的面孔

展望 2019 年

AI 原則

AI for Good

留下你的回應

以訪客張貼回應

回應

釘選列表

喜愛列表

Web Services

YOU MAY BE INTERESTED

Popular Tags

	今日	303
	昨日	1532
	本週	1835
	本月	34265
	總訪客量	2780299