線上學習-數位學習- 數字學習－－終身學習: 2018年12月23日

2018年12月23日

【2018 AI 發展總整理】帶你了解 AI 的 5 大領域進展，各種開放原始碼任你取用

Posted on2018/12/22

https://buzzorange.com/techorange/2018/12/22/ai-breakthrough-in-2018/

2018 ，仍是 AI 領域激動人心的一年。

這一年成為 NLP（Natural Language Processing，自然語言處理）研究的分水嶺，各種突破接連不斷；

CV（Computer Vision，電腦視覺）領域同樣精采紛呈，與四年前相比 GAN（Generative Adversarial Network，生成對抗網路）生成的假臉逼真到讓人不敢相信；

新工具、新框架的出現，也讓這個領域的明天特別讓人期待。

報告共涉及了五個主要部分：
自然語言處理（NLP）
電腦視覺（CV）
工具和庫
強化學習（RL）
AI 道德

自然語言處理（NLP）

詳細的說明可以讀他們的論文
Fast.ai 網站上放出了訓練腳本、模型

這裡有 ELMo 的更多介紹和資源

如果你還沒有讀過 BERT 的論文，真的應該在 2018 年結束前補完這一課。
另外，Google 官方開源了訓練代碼和預訓練模型。
如果你是 PyTorch 黨，也不怕。這裡還有官方推薦的 PyTorch 重實現和轉換腳本。

PyText 基於 PyTorch ，能夠加速從研究到應用的進度，從模型的研究到完整實施只需要幾天時間。框架裡還包含了一些預訓練模型，可以直接拿來處理文本分類、序列標註等任務。

想試試？開源地址在此

■ Duplex
如果前面這些研究對你來說都太抽象的話， Duplex 則是 NLP 進展的最生動例證。

名字有點陌生？不過這個產品你一定聽說過，它就是 Google 在 2018 年 I/O 開發者大會上展示的「打電話 AI」。

它能主動打電話給美髮店、餐館預約服務，全程流暢交流，簡直以假亂真。 Google 董事長 John Hennessy 後來稱之為「非凡的突破」，還說：「在預約領域，這個 AI 已經通過了圖靈測試」。

Duplex 在多輪對話中表現出的理解能力、合成語音的自然程度，都是 NLP 目前水平的體現。

電腦視覺（CV）

研究論文

延伸閲讀：
驚！史上最佳 GAN 現身，超真實 AI 假照片，行家們都沸騰了
 訓練史上最佳 GAN 用了 512 塊 TPU，一作自述：這不是算法進步，是算力進步
 史上最強 GAN：訓練費 10 萬起，現在免費體驗，畫風鬼畜又逼真

Fast.ai 團隊只用了 16 個 AWS 雲實例，每個實例搭載 8 塊英偉達 V100 GPU ，結果比 Google 用 TPU Pod 在斯坦福 DAWNBench 測試上達到的速度還要快 40%。

這樣拔群的成績，成本價只需要 40 美元（約 1200 元新台幣）， Fast.ai 在博客中將其稱作人人可實現。

Fast.ai 博客介紹

延伸閲讀：
40 美元 18 分鐘訓練整個 ImageNet！人人可實現
 224 秒！ImageNet 上訓練 ResNet-50 最佳戰績出爐，索尼下血本破紀錄

■ vid2vid 技術
今年 8 月，英偉達和 MIT 的研究團隊高出一個超逼真高解析影片生成 AI。

只要一幅動態的語義地圖，就可獲得和真實世界幾乎一模一樣的影片。換句話說，只要把你心中的場景勾勒出來，無需實拍，電影級的影片就可以自動 P 出來：

好消息， vid2vid 現已被英偉達開源。

研究論文
 GitHub 地址

延伸閲讀：
真實到可怕！英偉達 MIT 造出馬良的神筆
 一文看盡深度學習這半年

今年，機器學習領域的工具和框架仍在快速的發展，下面就是這方面的總結和展望。

■ PyTorch 1.0

根據 10 月 GitHub 發佈的 2018 年度報告， PyTorch 在增長最快的開源項目排行上，名列第二。也是唯一入圍的深度學習框架。

作為谷歌 TensorFlow 最大的「勁敵」， PyTorch 其實是一個新兵， 2017 年 1 月 19 日才正式發佈。 2018 年 5 月， PyTorch 和 Caffe2 整合，成為新一代 PyTorch 1.0 ，競爭力更進一步。

相較而言， PyTorch 速度快而且非常靈活，在 GitHub 上有越來越多的開碼都採用了 PyTorch 框架。可以預見，明年 PyTorch 會更加普及。

至於 PyTorch 和 TensorFlow 怎麼選擇？在我們之前發過的一篇報導裡，不少大老站 PyTorch。

實際上，兩個框架越來越像。前 Google Brain 深度學習研究員 Denny Britz 認為，大多數情況下，選擇哪一個深度學習框架，其實影響沒那麼大。

PyTorch 官網

延伸閲讀：
PyTorch 還是 TensorFlow？這有一份新手指南
 嘗鮮 PyTorch 1.0 必備伴侶
 TensorFlow 王位不保？ICLR 投稿論文 PyTorch 出鏡率快要反超了

■ AutoML
很多人將 AutoML 稱為深度學習的新方式，認為它改變了整個系統。有了 AutoML ，我們就不再需要設計複雜的深度學習網絡。

這個庫的作者是美國德州農工大學（Texas A&M University）助理教授胡俠和他的兩名博士生：金海峰、 Qingquan Song 。 Auto Keras 直擊谷歌 AutoML 的三大缺陷：

第一，得付錢。
第二，因為在雲端上，還得配置 Docker 容器和 Kubernetes 。
第三，服務商 Google 保證不了你的數據安全和隱私。

官網
 GitHub

延伸閲讀：
一文看懂深度學習新王者「AutoML」
開源的"谷歌 AutoML 殺手"來了
 谷歌放大招！全自動訓練 AI 無需寫代碼，全靠剛發佈的 Cloud AutoML

■ TensorFlow.js
今年 3 月底的 TensorFlow 開發者會峰會 2018 上， TensorFlow.js 正式發佈。

谷歌還給了幾個 TensorFlow.js 的應用案例。比如借用你的攝影機，來玩經典遊戲：吃豆人（Pac-Man）。

官網

延伸閲讀：
有筆記本就能玩的體感遊戲！TensorFlow.js 實現體感格鬥教程
 谷歌 AI 魔鏡：看你手舞足蹈，就召喚出 8 萬幅照片學你跳
 我不是偷拍的變態，只是在找表情包的本尊

強化學習（RL）

■ OpenAI 的強化學習入門教程
全無機器學習基礎的人類，現在也可以迅速上手強化學習。

11 月初， OpenAI 發佈了強化學習入門教程： Spinning Up 。從一套重要概念，到一系列關鍵演算法實現代碼，再到熱身練習，每一步都以清晰簡明為上，全程站在初學者角度。

團隊表示，目前還沒有一套比較通用的強化學習教材， RL 領域只有一小撮人進得去。這樣的狀態要改變啊！因為強化學習真的很有用。

教程入口
 GitHub 傳送門

延伸閲讀：
強化學習如何入門？看這篇文章就夠了
 人人能上手：OpenAI 發射初學者友好的強化學習教程 | 代碼簡約易懂
 強化學習算法 Q-learning 入門：教電腦玩"抓住芝士"小遊戲

■ 谷歌的強化學習新框架「多巴胺」
Dopamine（多巴胺），這是谷歌今年 8 月發佈的強化學習開源框架，基於 TensorFlow

另外，還有一組 Dopamine 的教學 colab 。

Dopamine 谷歌博客
 Dopamine github 下載
 colabs
遊戲訓練可視化網頁

■ 2019 趨勢展望
DataHack Summit 2018 發言人、 ArxivInsights 創始人 Xander Steenbrugge ，也是一名強化學習專家，以下是來自他的總結和展望。

1、由於輔助學習任務越來越多，增加了稀疏的外在獎勵，樣本的複雜性將繼續提高。在非常稀疏的獎勵環境中，效果非常好。

2、正因如此，直接在物理世界訓練將越來越可行，替代當前大多先在虛擬環境中訓練的方法。我預測 2019 年，會出現第一個只由深度學習訓練，沒有人工參與而且表現出色的機器人 demo 出現。

3、在 DeepMind 把 AlphaGo 的故事延續到生物領域之後（AlphaFold），我相信強化學習將逐步在學術領域外創造實際的商業價值。例如新藥探索、電子晶片架構優化、車輛等等。

4、強化學習會有一個明顯的轉變，以前在訓練數據上測試智能體的行為將不再視為「允許」。泛化指標將成為核心，就像監督學習一樣。

AI 道德

AI 被濫用事故在 2018 年被頻頻爆出： Facebook AI 幫助川普當選美國總統、 Google 與美國軍方聯手開發 AI 武器、微軟為移民和海關執法局（ICE）提供雲端計算和人臉識別服務。

每一次事故都會重新掀起一波對 AI 道德準則的討論高潮，一些矽谷科技公司也再次期間制定了企業 AI 準則。

Analytics Vidhya 認為， AI 道德現在還是一個灰色地帶，目前還沒有所有人可以遵循的框架， 2019 年將有更多企業和政府制定相關條例。

AI 道德規範的制定，現在才剛剛起步。

延伸閲讀：
谷歌將禁止 AI 用於武器，李飛飛等"反對與軍方合作"事件始末
 剛剛，Google 發佈 AI 七原則：不開發武器，但會繼續與軍方合作
 AI 助特朗普當選？FB 史上最大數據濫用曝光，牽出 ACL 終身獎得主

尼爾森：解讀新零售時代“人貨場”十大演進趨勢

尼爾森：解讀新零售時代"人貨場"十大演進趨勢

來源：食評方 2018-12-20

http://www.linkshop.com.cn/web/archives/2018/415934.shtml

當前，中國快消品市場活力依舊，快消品全管道銷售額增速超過14%，但驅動力更為錯綜複雜。

產品創新、消費升級、實體店增長以及電商發展共同構成了當前快消品市場的主要驅動力。其中，產品創新中，新品對快消品整體的增長貢獻率為41%，新品效率下降到品類占比達到了50%；

消費升級貢獻增長品類占比高達84%，而驅動力減弱的品類占比也達到了70%；實體店整體門店增長率為10%，開關店變化率超過43%；

電商發展中，快消品線上銷售額增長率超過32%，非綜合電商月用戶增長率對比綜合電商超過了194%。

根據國家統計局資料，2017年全國居民人均消費支出18322元，其中，食品煙酒比重最高，達到31.2%。中國消費者開始在傳統消費支出上逐漸節約，轉向在追求保障型、享受型專案上的消費。

消費者在購買產品時，也不再盲目的追求折扣和促銷，而是根據自身需求去選擇自己喜歡的產品和品牌。

在理性消費時代，消費者更熱衷於"貨比三家不吃虧"。2018年，跨管道購買消費者比重中，

現代管道+電商的占84，

現代管道+傳統管道的占65，

電商+傳統管道的和現代+傳統+電商的都占60。

有24%的消費者會多管道比價後選擇便宜的管道購買自己的產品；

有45%的消費者會加入天貓88付費會員，

31%的消費者是因為會員專享價而加入；

另外，有65%的消費者願意因為價格便宜加入拼購，拼購用戶增長率超過了57%。

Google Lens 推出一年人工智能已可辨認 10 億物件

十二月 21

https://unwire.hk/2018/12/21/google-lens-ai-camera-recognize-detect-1-billion-items/software/android-app/

Google 透露 Google Lens 現在已經能分辨超過 10 億件物品，這要多得系統的光學字符識別引擎，令 Google Lens 能夠「閱讀」產品的招紙所致。

能夠達到超過 10 億件物品的驕人數字，其實有賴 Google Shopping 收錄的產品，所以無法購買的物品，

例如 80 年代的舊遊戲主機、古書等，Google Lens 可能還是無法辨認。

去年 Google Lens 支持拍攝 Wi-Fi 路由器標籤，自動連接 Wi-Fi 的功能，

今年則加入將卡片資訊自動匯入手機通訊錄；

網誌又提到 Google Lens 現在還能夠認人、無線網絡名稱和幾何圖案形狀。

IDC預測2019年中國人工智能十大趨勢

12月21日(五)

https://hk.on.cc/hk/bkn/cnt/finance/20181221/bkn-20181221191616064-1221_00842_001.html

一、機器學習 /深度學習開始走進傳統企業。

IDC預計到2020年行業前列的15%企業，都將採用機器學習平台。

二、融合視覺、語音、語義等多模態電腦開始落地

預計未來三年多模態電腦將在實際應用中開始落地。

三、多模型數據庫開始走向市場。

企業內各種非結構化數據高速增長，使得能夠支持多種格式數據管理的多模型數據庫成為迫切需求。

四、AI技術使用門檻降低。

中小企業也能平等使用AI，實現普惠AI。

五、人工智能從雲端部署向邊緣電腦計算(Edge Computing)擴展。

IDC預計至2022年，25%的物聯網端設備都將以AI運算。

六、業務流程智能化達新高水平。

IDC預計至2023年，人工智能將取代50%的IT業務工作量，節省20%以上的營運成本。

七、人機交互界面趨向智能化。

IDC預計到2023年，支持AI的人機(人與電腦)交互接口將取代目前50%的基於屏幕的B2B和B2C的應用程序。

八、六大行業全面採用AI。

政府行業、金融業、互聯網行業在經過近年的應用實踐後將全面擴展AI的應用。而新零售、新製造、醫療領域也將成為AI市場的新增長點。

九、軟件及應用引領基礎架構。

機器學習應用的普及程度、深度學習神經網絡的演化，都會影響加速計算類硬件的發展路線。

十、生態資源整合成為致勝關鍵。

技術型廠商與傳感器、攝像頭、模組等細分產業的整合愈加重要。

訂閱：文章 (Atom)

線上學習-數位學習- 數字學習－－終身學習

2018年12月23日

【2018 AI 發展總整理】帶你了解 AI 的 5 大領域進展，各種開放原始碼任你取用

自然語言處理（NLP）

電腦視覺（CV）

強化學習（RL）

AI 道德

尼爾森：解讀新零售時代“人貨場”十大演進趨勢

Google Lens 推出一年人工智能已可辨認 10 億物件

IDC預測2019年中國人工智能十大趨勢

搜尋

標籤

友善聯結

總網頁瀏覽量

相關文章

2018年12月23日

【2018 AI 發展總整理】帶你了解 AI 的 5 大領域進展，各種開放原始碼任你取用

自然語言處理（NLP）

電腦視覺（CV）

強化學習（RL）

AI 道德

尼爾森：解讀新零售時代“人貨場”十大演進趨勢

Google Lens 推出一年 人工智能已可辨認 10 億物件

IDC預測2019年中國人工智能十大趨勢

搜尋

標籤

友善聯結

訂閱

總網頁瀏覽量

Google Lens 推出一年人工智能已可辨認 10 億物件