谷歌AI最新博文:視頻模型中的模擬策略學(xué)習(xí)【馬哥教育新聞快報387期】
各位小伙伴下午好,今天是2019年3月27日,這里是馬哥教育新聞快報387期。
本期重點關(guān)注: 谷歌AI最新博文:視頻模型中的模擬策略學(xué)習(xí)
1、谷歌AI最新博文:視頻模型中的模擬策略學(xué)習(xí)
深度強(qiáng)化學(xué)習(xí)(RL)技術(shù)可用于從視覺輸入中學(xué)習(xí)復(fù)雜任務(wù)的策略,并已成功應(yīng)用于經(jīng)典的 Atari2600 游戲中。最近在這一領(lǐng)域的研究表明,即使在像 Montezuma's Revenge 這樣的游戲所展示的具有挑戰(zhàn)性的探索機(jī)制中,它也可能獲得超人的表現(xiàn)。然而,目前許多最先進(jìn)方法的局限之一是,它們需要與游戲環(huán)境進(jìn)行大量的交互,且這些交互通常比人類去學(xué)習(xí)如何玩得好要多得多。
近日,谷歌 AI 發(fā)布了一篇博文,討論了他們的視頻模型中的模擬策略學(xué)習(xí)模型,雷鋒網(wǎng)(公眾號:雷鋒網(wǎng)) AI 科技評論編譯整理如下。
解釋為什么人們能更有效地學(xué)習(xí)這些任務(wù)的一個假設(shè)是,他們能夠預(yù)測自己行動的效果,從而含蓄地學(xué)習(xí)一個模型,其行動順序?qū)?dǎo)致理想的結(jié)果。其一般思想是,建立所謂的博弈模型并用它學(xué)習(xí)一個選擇行為的良好策略,這是基于模型的強(qiáng)化學(xué)習(xí)(MBRL)的主要前提。
在「基于模型的 Atari 強(qiáng)化學(xué)習(xí)」中,我們引入了模擬策略學(xué)習(xí)(SimPLe)算法,這是一個 MBRL 框架,用于訓(xùn)練 Atari 游戲機(jī)的代理,其效率顯著高于當(dāng)前最先進(jìn)的技術(shù),只需要使用與游戲環(huán)境的約 100K 交互(相當(dāng)于真人 2 小時的游戲時間)就能顯示出有競爭力的結(jié)果。此外,我們已經(jīng)將相關(guān)代碼作為 Tensor2Tensor 開源代碼庫的一部分進(jìn)行了開源。這個版本包含了一個預(yù)訓(xùn)練的 world 模型,可以用一個簡單的命令行運行,也可以使用類似于 Atari 的界面來播放。
2、 百度大腦,“上新了”!
前不久,百度大腦推出了包括語音技術(shù)、視覺技術(shù)、自然語言處理、知識圖譜等在內(nèi)的通用 AI 能力,以及開源深度學(xué)習(xí)框架方面的優(yōu)化升級。與此同時,人工智能已經(jīng)連續(xù)三年進(jìn)入政府報告、“智能+”成為 2019 年行業(yè)的新命題。
雷鋒網(wǎng)了解到,百度大腦自 2016 年啟動開放以來,目前已經(jīng)是服務(wù)規(guī)模最大的 AI 開放平臺。共計開放了 158 項 AI 能力,24 小時快速集成,開發(fā)者數(shù)量超過 100 萬。面向廣泛的企業(yè)和開發(fā)者提供最先進(jìn)、最全面的 AI 能力,不斷降低 AI 應(yīng)用落地的門檻。
語音方面
在今年 1 月的百度輸入法探索版發(fā)布會上,首次發(fā)布了領(lǐng)先國際的語音技術(shù):在線語音領(lǐng)域全球首創(chuàng)的流式多級截斷注意力模型 SMLT「Streaming trancated multi-layer attention」。值得注意的是,這是首次在大規(guī)模語音識別工業(yè)界采用注意力(attention)模型。
提升識別率的同時大幅優(yōu)化了解碼速度?!罢Z音識別極速版”,擁有更快的響應(yīng)速度,相對識別準(zhǔn)確度提升 15%。此項語音能力在 API 調(diào)用方式下,實時率小于 0.1,意味著 5s 的音頻不到 500ms 即可完成識別過程,減少了識別音頻所需的耗時,提升語音交互的響應(yīng)體驗。
3、 歐盟版權(quán)改革 版權(quán)方與谷歌等巨頭有喜有憂
歐洲立法者批準(zhǔn)了一項有爭議的版權(quán)立法的初步協(xié)議,該協(xié)議可能對谷歌和 Facebook 等科技巨頭的商業(yè)模式產(chǎn)生深遠(yuǎn)影響。
該法案旨在將歐盟的版權(quán)規(guī)則帶入 21 世紀(jì),以幫助那些作品在互聯(lián)網(wǎng)上廣泛傳播的藝術(shù)家和出版商。
歐洲議會于周二在法國斯特拉斯堡通過了新版權(quán)指令的初步文本。但這仍然需要得到歐洲委員會部長們的批準(zhǔn)。該委員會機(jī)構(gòu)根據(jù)職責(zé)和角色將歐盟中的不同部長聚集在一起。
這項改革計劃,自 2016 年以來就一直在醞釀。該計劃使得包括 Facebook、Twitter 和谷歌在內(nèi)的大型科技公司與藝術(shù)家和媒體公司展開了激烈的競爭。
谷歌的回應(yīng)
據(jù)外媒報道,歐洲議會投票后,谷歌表示,周二通過的版本是對原有法律的改進(jìn)。但谷歌還補(bǔ)充說,這仍將導(dǎo)致法律不確定性,并損害創(chuàng)意產(chǎn)業(yè)。
該法案中的一項條款可能導(dǎo)致(監(jiān)管方)實施預(yù)過濾系統(tǒng),阻止互聯(lián)網(wǎng)用戶分享包含受版權(quán)保護(hù)材料的潮流語、表情包和其他內(nèi)容。
版權(quán)改革的另一部分將要求像谷歌這樣的新聞聚合服務(wù)平臺與出版商協(xié)商商業(yè)許可,以便發(fā)布文章的片段或鏈接。
在技術(shù)公司一方,谷歌和多位知名人士,如互聯(lián)網(wǎng)先驅(qū)蒂姆·伯納斯·李、維基百科創(chuàng)始人吉米·威爾士,都對新的歐盟版權(quán)指令表示不滿。在媒體一方,像前披頭士樂隊成員保羅·麥卡特尼和歌手黛比·哈里等知名藝術(shù)家都表示支持。
4、 Spotify今日宣布將收購洛杉磯播客工作室Parcast
Spotify 今天表示,將收購 Parcast,這是該公司在兩個月內(nèi)收購的第三家播客公司,該公司正在努力轉(zhuǎn)型為音頻領(lǐng)域的奈飛。
Spotify 沒有透露交易條款,但早些時候表示,公司已在 2019 年撥出高達(dá) 5 億美元用于收購。
Parcast 成立于 2016 年,專注于“犯罪”和“神秘”主題的音頻內(nèi)容。該公司推出了 18 個高級播客系列,包括“連環(huán)殺手”(Serial Killers)、“懸案謀殺”(Unsolved Murders)等主題內(nèi)容。
今年 2 月,全球最受歡迎的音樂流媒體服務(wù)平臺 Spotify 同意收購播客生產(chǎn)商 Gimlet Media 和播客服務(wù)公司 Anchor。
【快報內(nèi)容】
【今日學(xué)習(xí)必備】
【Linux面試真題】- 當(dāng)用戶在瀏覽器當(dāng)中輸入一個網(wǎng)站,說說計算機(jī)對dns解釋經(jīng)過那些流程?注:本機(jī)跟本地dns還沒有緩存。
答:
a.用戶輸入網(wǎng)址到瀏覽器;
b.瀏覽器發(fā)出DNS請求信息;
c.計算機(jī)首先查詢本機(jī)HOST文件,看是否存在,存在直接返回結(jié)果,不存在,繼續(xù)下一步;
d.計算機(jī)按照本地DNS的順序,向合法dns服務(wù)器查詢IP結(jié)果;
e.合法dns返回dns結(jié)果給本地dns,本地dns并緩存本結(jié)果,直到TTL過期,才再次查詢此結(jié)果;
f.返回IP結(jié)果給瀏覽器;
【Python面試真題】- 簡單談下GIL -Global Interpreter Lock(全局解釋器鎖)
Python代碼的執(zhí)行由Python 虛擬機(jī)(也叫解釋器主循環(huán),CPython版本)來控制,Python 在設(shè)計之初就考慮到要在解釋器的主循環(huán)中,同時只有一個線程在執(zhí)行,即在任意時刻,只有一個線程在解釋器中運行。對Python 虛擬機(jī)的訪問由全局解釋器鎖(GIL)來控制,正是這個鎖能保證同一時刻只有一個線程在運行。
>【就業(yè)喜訊】
【學(xué)員喜訊-798期】- 從建筑工程到Linux運維工程師,馬哥教育助力學(xué)員成功轉(zhuǎn)行 !

【近期開班】
Linux面授班:2019年4月29日(北京)
Linux網(wǎng)絡(luò)班:2019年5月4日(網(wǎng)絡(luò))
Python面授班:2019年6月24日(北京)
Python網(wǎng)絡(luò)班:2019年3月30日(網(wǎng)絡(luò))