人工智能邁向真實(shí)"智能學(xué)習(xí)體
據(jù)英國(guó)"自然"雜志24日?qǐng)?bào)道,美國(guó)團(tuán)隊(duì)報(bào)告了一種可以追溯到過(guò)去并解決了復(fù)雜任務(wù)的增強(qiáng)學(xué)習(xí),并確實(shí)改善了探索復(fù)雜環(huán)境的方式,并有望用于機(jī)器人、語(yǔ)言理解和藥物設(shè)計(jì)。這種被統(tǒng)稱為"去探索"的算法在經(jīng)典游戲的算法挑戰(zhàn)中超越了人類玩家和先進(jìn)的人工智能系統(tǒng)。這一成就被認(rèn)為是朝著實(shí)現(xiàn)真正的"智能學(xué)習(xí)體"邁出的重要一步。
強(qiáng)化學(xué)習(xí)可以讓人工智能系統(tǒng)通過(guò)探索和理解復(fù)雜環(huán)境做出決定,并學(xué)會(huì)如何以最好的方式獲得獎(jiǎng)勵(lì)。獎(jiǎng)勵(lì)可以包括到達(dá)特定位置或在電腦游戲中達(dá)到一定水平的機(jī)器人。然而,當(dāng)面對(duì)一個(gè)反饋很少的復(fù)雜環(huán)境時(shí),現(xiàn)有的增強(qiáng)學(xué)習(xí)算法很容易碰壁,這讓人工智能專家非常不安。
OpenAI是一個(gè)非營(yíng)利性人工智能組織,由許多硅谷巨頭共同創(chuàng)建,其中包括美國(guó)企業(yè)孵化器YCombinator的總裁薩姆·阿爾特曼(Sam Altman)和美國(guó)太空技術(shù)探索公司(SpaceX)的創(chuàng)始人埃隆·馬斯克(Elon Musk)。其目標(biāo)是防止人工智能的災(zāi)難性影響,并推動(dòng)人工智能發(fā)揮積極作用。這次,OpenAI的科學(xué)家Edland Ekfield、Juster Huizinga和團(tuán)隊(duì)提出了兩個(gè)主要障礙,并設(shè)計(jì)了一系列解決這些障礙的算法。
研究人員說(shuō),去探索可以對(duì)環(huán)境進(jìn)行全面的觀察,并建立一個(gè)檔案來(lái)記住它所處的位置,并確保它不會(huì)忘記通往充滿希望的臨時(shí)或最終勝利的道路(獎(jiǎng)勵(lì))。"研究人員說(shuō),它可以全面地探索環(huán)境,同時(shí)建立檔案以記住它在哪里,并確保它不會(huì)忘記通往充滿希望的臨時(shí)或最終勝利的道路。它在雅達(dá)利經(jīng)典游戲中的得分超過(guò)了人類玩家和先進(jìn)的人工智能系統(tǒng)。研究人員使用這樣的算法來(lái)解決2600個(gè)以前未被解決的亞達(dá)利游戲,并驗(yàn)證了這些算法的潛力。"去探索"在算法挑戰(zhàn)中的得分是"蒙特祖馬的復(fù)仇"的四倍,比另一項(xiàng)算法挑戰(zhàn)"瑪雅冒險(xiǎn)"中的人類玩家平均得分還要高。"相反,以前的算法沒(méi)有得到一分錢。
去探索"算法還可以完成一個(gè)模擬機(jī)器人任務(wù),它必須用一個(gè)機(jī)械手撿起東西,并把它們放在四個(gè)架子中的一個(gè),其中兩個(gè)是關(guān)在兩扇門后面的。
研究人員指出,記住并返回有望成功的探索領(lǐng)域的簡(jiǎn)單原理是一種強(qiáng)大而普遍的探索方式。他們相信,最新的算法有望應(yīng)用于機(jī)器人、語(yǔ)言理解和藥物設(shè)計(jì)。
-
海能新能源助力科技創(chuàng)新——第六屆射頻與天線技術(shù)國(guó)際學(xué)術(shù)研討會(huì)在深圳成功召開(kāi)
-
漢王友基與廣州美術(shù)學(xué)院達(dá)成校企戰(zhàn)略合作
-
以遠(yuǎn)見(jiàn)超越未見(jiàn) | 2023 山石網(wǎng)科 · 安全守護(hù)者峰會(huì)成功舉辦
-
漢王友基點(diǎn)陣筆新品上市,賦能紙筆互動(dòng)智慧教育場(chǎng)景
-
新生產(chǎn)力,躍升!2023WAIC“智慧金融與數(shù)字員工”分論壇在滬成功舉辦
-
DHL亞特蘭大樞紐投運(yùn)
-
三亞太陽(yáng)灣柏悅酒店開(kāi)啟盛夏山海暑期童趣之旅