【2018 AI 發展總整理】帶你了解 AI 的 5 大領域進展,各種開放原始碼任你取用
Posted on2018/12/22
https://buzzorange.com/techorange/2018/12/22/ai-breakthrough-in-2018/
2018 ,仍是 AI 領域激動人心的一年。
這一年成為 NLP(Natural Language Processing,自然語言處理)研究的分水嶺,各種突破接連不斷;
CV(Computer Vision,電腦視覺)領域同樣精采紛呈,與四年前相比 GAN(Generative Adversarial Network,生成對抗網路)生成的假臉逼真到讓人不敢相信;
新工具、新框架的出現,也讓這個領域的明天特別讓人期待。
報告共涉及了五個主要部分:
自然語言處理(NLP)
電腦視覺(CV)
工具和庫
強化學習(RL)
AI 道德
自然語言處理(NLP)
詳細的說明可以讀他們的 論文
Fast.ai 網站 上放出了訓練腳本、模型
這裡 有 ELMo 的更多介紹和資源
如果你還沒有讀過 BERT 的 論文 ,真的應該在 2018 年結束前補完這一課。
另外,Google 官方開源了 訓練代碼和預訓練模型 。
如果你是 PyTorch 黨,也不怕。這裡還有官方推薦的 PyTorch 重實現和轉換腳本 。
PyText 基於 PyTorch ,能夠加速從研究到應用的進度,從模型的研究到完整實施只需要幾天時間。框架裡還包含了一些預訓練模型,可以直接拿來處理文本分類、序列標註等任務。
想試試?開源地址 在此
■ Duplex
如果前面這些研究對你來說都太抽象的話, Duplex 則是 NLP 進展的最生動例證。
名字有點陌生?不過這個產品你一定聽說過,它就是 Google 在 2018 年 I/O 開發者大會上展示的「打電話 AI」。
它能主動打電話給美髮店、餐館預約服務,全程流暢交流,簡直以假亂真。 Google 董事長 John Hennessy 後來稱之為「非凡的突破」,還說:「在預約領域,這個 AI 已經通過了圖靈測試」。
Duplex 在多輪對話中表現出的理解能力、合成語音的自然程度,都是 NLP 目前水平的體現。
電腦視覺(CV)
延伸閲讀:
驚!史上最佳 GAN 現身,超真實 AI 假照片,行家們都沸騰了
訓練史上最佳 GAN 用了 512 塊 TPU,一作自述:這不是算法進步,是算力進步
史上最強 GAN:訓練費 10 萬起,現在免費體驗,畫風鬼畜又逼真
Fast.ai 團隊只用了 16 個 AWS 雲實例,每個實例搭載 8 塊英偉達 V100 GPU ,結果比 Google 用 TPU Pod 在斯坦福 DAWNBench 測試上達到的速度還要快 40%。
這樣拔群的成績,成本價只需要 40 美元(約 1200 元新台幣), Fast.ai 在博客中將其稱作人人可實現。
延伸閲讀:
40 美元 18 分鐘訓練整個 ImageNet!人人可實現
224 秒!ImageNet 上訓練 ResNet-50 最佳戰績出爐,索尼下血本破紀錄
■ vid2vid 技術
今年 8 月,英偉達和 MIT 的研究團隊高出一個超逼真高解析影片生成 AI。
只要一幅動態的語義地圖,就可獲得和真實世界幾乎一模一樣的影片。換句話說,只要把你心中的場景勾勒出來,無需實拍,電影級的影片就可以自動 P 出來:
好消息, vid2vid 現已被英偉達開源。
延伸閲讀:
真實到可怕!英偉達 MIT 造出馬良的神筆
一文看盡深度學習這半年
今年,機器學習領域的工具和框架仍在快速的發展,下面就是這方面的總結和展望。
■ PyTorch 1.0
根據 10 月 GitHub 發佈的 2018 年度報告, PyTorch 在增長最快的開源項目排行上,名列第二。也是唯一入圍的深度學習框架。
作為谷歌 TensorFlow 最大的「勁敵」, PyTorch 其實是一個新兵, 2017 年 1 月 19 日才正式發佈。 2018 年 5 月, PyTorch 和 Caffe2 整合,成為新一代 PyTorch 1.0 ,競爭力更進一步。
相較而言, PyTorch 速度快而且非常靈活,在 GitHub 上有越來越多的開碼都採用了 PyTorch 框架。可以預見,明年 PyTorch 會更加普及。
至於 PyTorch 和 TensorFlow 怎麼選擇?在我們之前發過的一篇報導裡,不少大老站 PyTorch。
實際上,兩個框架越來越像。前 Google Brain 深度學習研究員 Denny Britz 認為,大多數情況下,選擇哪一個深度學習框架,其實影響沒那麼大。
延伸閲讀:
PyTorch 還是 TensorFlow?這有一份新手指南
嘗鮮 PyTorch 1.0 必備伴侶
TensorFlow 王位不保?ICLR 投稿論文 PyTorch 出鏡率快要反超了
■ AutoML
很多人將 AutoML 稱為深度學習的新方式,認為它改變了整個系統。有了 AutoML ,我們就不再需要設計複雜的深度學習網絡。
這個庫的作者是美國德州農工大學(Texas A&M University)助理教授胡俠和他的兩名博士生:金海峰、 Qingquan Song 。 Auto Keras 直擊谷歌 AutoML 的三大缺陷:
第一,得付錢。
第二,因為在雲端上,還得配置 Docker 容器和 Kubernetes 。
第三,服務商 Google 保證不了你的數據安全和隱私。
延伸閲讀:
一文看懂深度學習新王者「AutoML」
開源的"谷歌 AutoML 殺手"來了
谷歌放大招!全自動訓練 AI 無需寫代碼,全靠剛發佈的 Cloud AutoML
■ TensorFlow.js
今年 3 月底的 TensorFlow 開發者會峰會 2018 上, TensorFlow.js 正式發佈。
谷歌還給了幾個 TensorFlow.js 的應用案例。比如借用你的攝影機,來玩經典遊戲:吃豆人(Pac-Man)。
延伸閲讀:
有筆記本就能玩的體感遊戲!TensorFlow.js 實現體感格鬥教程
谷歌 AI 魔鏡:看你手舞足蹈,就召喚出 8 萬幅照片學你跳
我不是偷拍的變態,只是在找表情包的本尊
強化學習(RL)
■ OpenAI 的強化學習入門教程
全無機器學習基礎的人類,現在也可以迅速上手強化學習。
11 月初, OpenAI 發佈了強化學習入門教程: Spinning Up 。從一套重要概念,到一系列關鍵演算法實現代碼,再到熱身練習,每一步都以清晰簡明為上,全程站在初學者角度。
團隊表示,目前還沒有一套比較通用的強化學習教材, RL 領域只有一小撮人進得去。這樣的狀態要改變啊!因為強化學習真的很有用。
延伸閲讀:
強化學習如何入門?看這篇文章就夠了
人人能上手:OpenAI 發射初學者友好的強化學習教程 | 代碼簡約易懂
強化學習算法 Q-learning 入門:教電腦玩"抓住芝士"小遊戲
■ 谷歌的強化學習新框架「多巴胺」
Dopamine(多巴胺),這是谷歌今年 8 月發佈的強化學習開源框架,基於 TensorFlow
另外,還有一組 Dopamine 的教學 colab 。
Dopamine 谷歌博客
Dopamine github 下載
colabs
遊戲訓練可視化網頁
■ 2019 趨勢展望
DataHack Summit 2018 發言人、 ArxivInsights 創始人 Xander Steenbrugge ,也是一名強化學習專家,以下是來自他的總結和展望。
1、由於輔助學習任務越來越多,增加了稀疏的外在獎勵,樣本的複雜性將繼續提高。在非常稀疏的獎勵環境中,效果非常好。
2、正因如此,直接在物理世界訓練將越來越可行,替代當前大多先在虛擬環境中訓練的方法。我預測 2019 年,會出現第一個只由深度學習訓練,沒有人工參與而且表現出色的機器人 demo 出現。
3、在 DeepMind 把 AlphaGo 的故事延續到生物領域之後(AlphaFold),我相信強化學習將逐步在學術領域外創造實際的商業價值。例如新藥探索、電子晶片架構優化、車輛等等。
4、強化學習會有一個明顯的轉變,以前在訓練數據上測試智能體的行為將不再視為「允許」。泛化指標將成為核心,就像監督學習一樣。
AI 道德
AI 被濫用事故在 2018 年被頻頻爆出: Facebook AI 幫助川普當選美國總統、 Google 與美國軍方聯手開發 AI 武器、微軟為移民和海關執法局(ICE)提供雲端計算和人臉識別服務。
每一次事故都會重新掀起一波對 AI 道德準則的討論高潮,一些矽谷科技公司也再次期間制定了企業 AI 準則。
Analytics Vidhya 認為, AI 道德現在還是一個灰色地帶,目前還沒有所有人可以遵循的框架, 2019 年將有更多企業和政府制定相關條例。
AI 道德規範的制定,現在才剛剛起步。
延伸閲讀:
谷歌將禁止 AI 用於武器,李飛飛等"反對與軍方合作"事件始末
剛剛,Google 發佈 AI 七原則:不開發武器,但會繼續與軍方合作
AI 助特朗普當選?FB 史上最大數據濫用曝光,牽出 ACL 終身獎得主