本申請(qǐng)屬于人工智能,具體涉及一種虛擬對(duì)象的控制方法、裝置、設(shè)備、存儲(chǔ)介質(zhì)及程序產(chǎn)品。、強(qiáng)化學(xué)習(xí)(reinforcement?learning,rl)是一種通過(guò)智能體與環(huán)境交互來(lái)學(xué)習(xí)最優(yōu)策略的方法。在這個(gè)過(guò)程中,智能體通過(guò)觀察環(huán)境,嘗試不同的動(dòng)作,接收環(huán)境的反饋,逐步學(xué)習(xí)在該環(huán)境中做出最優(yōu)的...