比特幣交易所 比特幣交易所
Ctrl+D 比特幣交易所
ads

AI Arena:掌握游戲機制 訓練你的下一個拳王_RENA

Author:

Time:1900/1/1 0:00:00

人工神經網絡

一個最重要的創新:人工神經網絡

簡單來講,神經網絡意味著理論上它可以學習任何用戶動作的映射!

為了介紹一會兒將使用的一些術語,從狀態到行動的映射將被稱為“策略”。

為了讓拳手的神經網絡學習策略,AI Arena將采取模擬學習和強化學習。其中神經網絡架構存儲在IPFS上。

在上圖中,神經元之間的連接稱為“權值”。當你的神經網絡正在“學習”時,所發生的是它正在改變權值的值。

OpenAI 推出針對其人工智能系統的漏洞賞金計劃:金色財經報道,熱門聊天機器人ChatGPT的制造者OpenAI周二表示,將向報告其人工智能系統漏洞的用戶提供最高達2萬美元的獎金。OpenAI漏洞賞金計劃于周二上線,將根據人們報告的漏洞的嚴重程度為他們提供獎勵,每個漏洞的獎勵從200美元起。據悉,科技公司經常使用漏洞賞金計劃來鼓勵程序員和有道德的黑客報告他們軟件系統中的漏洞。[2023/4/12 13:58:02]

權值最終將決定狀態如何映射到動作,這意味著我們可以將權值解釋為“智能”。

神經網絡權值對于每個NFT都是唯一的,并存儲在以太坊上。

AI設計機制全攻略

狀態

(1)什么是狀態?

狀態是環境在某個時間點的表示。它并沒有包含所有信息——只包含了其中必要的信息。

幣安AI NFT生成器Binance Bicasso正式上線:金色財經報道,幣安官方宣布正式推出AI NFT生成器Binance Bicasso,支持用戶用文本或圖像創建獨特的藝術品,并將他們的作品鑄造為BNB鏈上的NFT,2023-03-29 12:00 (UTC)到2023-03-30 00:00 (UTC)期間,所有符合條件的幣安用戶都可以使用Binance Bicasso免費鑄造一枚NFT,總計10萬枚。此外,幣安還宣布將推出“Exclusive Bicasso”NFT Collection系列。[2023/3/27 13:29:30]

例如:研究人員使用屏幕上的所有像素作為狀態,讓AI計算出像素代表什么。然后根據他們認為對決策過程重要的因素進行人工調試。

AI Arena一再強調其關心的是為所有人提供平等的機會——團隊希望獎勵能夠更多地給予堅持訓練AI的用戶,而不是獎勵擁有更多資源的用戶。

Multichain CEO回應質疑:Fantom DAI由以太坊等7個鏈的DAI 1:1支持:9月22日消息,以太坊鏈上研究員bartek.eth發推稱,Multichain使用EOA作為Bridge托管,在Fantom上通過7400萬的DAI進行抵押鑄造超過1億美元的跨鏈DAI。鏈上交易數據顯示,在2021年7月的一系列交易中,驗證者從托管中移除DAI,而沒有進行相應的銷毀,而被挪用的DAI再次被用于“向其他鏈提供流動性”。對此,bartek認為,一旦遺留的增發跨鏈DAI進行有效的贖回,普通用戶的托管資產將受損。

Multichain聯合創始人兼CEO Zhaojun表示,Multichain有兩個路由路徑支持從Fantom跨鏈至超過8條鏈,不是只支持跨鏈至以太坊。Fantom DAI由以太坊和其他6個鏈上的底層DAI 1:1支持。

bartek質疑為何截圖顯示Fantom上3013.8萬DAI由anyDAI合約持有,Zhaojun回復稱,因為用戶通過Router Pool將Fantom DAI橋接到其他鏈。路由器流動性池在不同的鏈上動態變化。[2022/9/22 7:13:35]

(2)游戲將使用哪些變量?

NFT平臺Luxy在Mumbai testnet部署其測試應用程序:NFT平臺Luxy在Mumbai testnet部署其測試應用程序,這將是LUXY市場在主網上部署后如何運作的預覽。[2021/8/3 1:31:44]

下面是狀態中包含的變量列表。需要注意的是,AI Arena將使用下標1表示用戶自己的AI,下標2表示對手。

此外,競技場的左邊界的X位置為0,右邊界的X位置為1。

訓練

(1)訓練概述

這是改變神經網絡中權值的過程,以使AI能夠起作用。

例如:如果我們在對手面前,我們可能希望我們的戰士出擊。

BitMax明日將啟動xDai (STAKE) 競拍:據官方消息,北京時間4月28日 (明日)21:00 - 23:00,BitMax用戶將獲得STAKE競拍權。按競價由高到低排名,前400名用戶將以第400名用戶給出的競拍價為最終價獲得拍賣品1000 STAKE(無鎖定期)。本次競拍起拍價格為400 USDT,上限為550 USDT。

BitMax (BTMX.com) 交易所將于北京時間4月29日 22:00開啟獨家上線xDai Chain (STAKE),并開放STAKE/USDT交易對。

更多活動和交易詳情登錄BitMax平臺官網查看。[2020/4/27]

有一系列的權值可以實現這一點,訓練的重點是讓AI學會在特定場景中采取特定的行動。

AI Arena在應用程序中嵌入了以下培訓計劃:

模仿學習

為了學習如何戰斗,你的AI將觀察你并學習模仿你的動作。

自我學習

為了學習你無法教給它的技能,你的AI將與自己的副本對抗,以不斷提高。

(2)為什么需要訓練?

1·隨機初始化

首次創建NFT拳手時,神經網絡權值也隨之生成。一開始它會隨機采取行動,因為它不知道在什么情況下應該采取什么行動。

因此為了準備戰斗,我們必須訓練它,使它學會一個好的作戰策略。

2·隨機策略

正如上文“神經網絡”部分中提到的,從狀態到動作的映射稱為策略。

換句話說,策略定義了代理在某些情況下的行為方式。在訓練之前,NFT拳手還沒有學會一個好的戰斗策略,所以只是隨機行動。

(1)通過觀察學習

理解模仿學習的最好方法是想象你是一個師父,你的AI是一個你正在準備戰斗的戰士。

你用你的人工智能進行搏擊,它學習模仿你在特定場景中的動作。

我們正在寫一篇關于模仿學習的綜合博文,到時候會將其鏈接到這里。

(2)演示

實際情況:你實際操控的是左邊的灰色拳手,而你的AI在右邊。你可以測試一些動作,觀察AI如何模仿你。

請注意:它不會立即復刻你的動作,因為神經網絡需要一點時間來學習,所以在AI學會之前,你可能需要多重復幾次你的動作。

為簡單演示,目前AI Arena只允許用戶使用這些操作:向左跑、向右跑、單拳、雙拳和防守。

(1)完美匹配

最完美的拳擊搭檔就是用戶自己。通過自我學習,你的AI總是在不斷地挑戰自己,不斷地改進。

(2)不同的學習范式

通過模仿學習,AI通過觀看演示進行學習。在自我學習中,AI像對手一樣學習和戰斗沒有多大意義,因為對手是人工智能本身的克隆。

但是如果沒有專家向人AI展示如何戰斗,那么它如何學習該做什么呢?——通過獎勵。

AI將學會采取給予它更多正向獎勵的行動,而減少采取給予它負面獎勵的行動。

定制訓練

Python環境[正在準備中]

AI Arena計劃為玩家引入一個python環境來訓練他們自己的模型。

目前,用戶僅限于使用團隊在應用程序中提供的兩種培訓方法;但不久的將來,應用程序將可以允許玩家導入其自定義培訓模型并上鏈。

游戲模式探索

戰斗

AI Arena目前有兩種可用的作戰模式:模擬賽和排位賽。除此之外,團隊計劃在不久后整合另外兩種作戰模式。

1)模擬賽

玩家可以在對抗競技場測試他們的拳手來預先訓練的AI。在這種模式下將沒有任何獎勵。

2)排位賽

玩家將讓他們的拳手去對抗來自世界各地的拳手。玩家的唯一目標就是努力攀登排行榜,成為競技場的冠軍!

玩家在排行榜上的排名越高,贏得一場戰斗的回報獎勵就越高。

3)目標

雖然每種戰斗模式都有其獨特之處,但它們都有一個共同的勝利目標:在指定的時間內消耗對手所有生命值。

鏈金交易員總結

目前AI Arena尚處在早期,很適合提前埋伏觀察。據官方透露,游戲正式版本大概率于明年推出,而今年年末推出的測試版本將只有白名單用戶可以參與體驗。

白名單用戶名額的獲取方式是參與團隊即將推出的解密游戲,通過游戲后的用戶將會被隨機選擇是否進入白名單。

有興趣的玩家可以加入他們的Discord嘗試體驗,大概率后期會有早鳥空投獎勵。

Tags:DAINFTRENARENDAISY價格Ultra NFTAdrenaline AIFrench Connection Finance

比特幣價格今日行情
二層網絡將引領以太坊新敘事:以Arbitrum為例_ARBI

以太坊的敘事正在悄然發生變化。二層網絡正式粉墨登場、大放異彩,越來越多的應用建立在各自生態上;而以太坊一層則退居二線,負責底層的安全工作.

1900/1/1 0:00:00
「永久存儲」的Arweave 用Crypto的方式重構了存儲的邏輯_AVE

存儲賽道在過去一年多里大放異彩,這要歸功于Filecoin這幾年來做的市場教育。在存儲賽道,除了絕對的龍頭Filecoin,還有Storj、Crust、Sia等項目也都按照各自的節奏在發展.

1900/1/1 0:00:00
元宇宙龍頭游戲 sandbox玩法攻略(建議收藏)_區塊鏈

南京市鼓樓區:集智打造元宇宙“鼓樓樣本”:金色財經報道,2023(首屆)中國產業元宇宙峰會暨2022中國雙鏈年會,1月7日在南京市鼓樓區舉行.

1900/1/1 0:00:00
一文說透固收黑馬Element的7種玩法_USD

在DeFi的世界中用戶不論是參與DEX、Leading還是Yield項目都是為了尋求高收益。DeFi的高風險眾所周知,除了要承擔幣價的波動外,大部分平臺給出的收益也是浮動的,希望有穩定收益率的用.

1900/1/1 0:00:00
一文速覽知名投資人整理的35個潛在空投名單_EFI

DYDX 的強勢表現讓刷量和 Airdrop 持有者興奮不已,再次證明在這個市場中,「Try Everything」有概率獲得忠實的回報.

1900/1/1 0:00:00
詳解最小化反共謀基礎設施MACI:鏈上治理中的抗勾結框架_KEY

關于這篇文章的背景,請參考《二次方投票和二次方資助》。在這篇文章發布后的一個月,BSC基金會在DoraHacks開發者平臺HackerLink上運行了BSC生態第一輪二次方資助?,并在其后的15.

1900/1/1 0:00:00
ads