勵志

勵志人生知識庫

icm方法

ICM方法,全稱Intrinsic Curiosity Module,是一種鼓勵探索的機制,旨在通過將觀察特徵映射到高維的連續狀態空間,專注於探索那些對智慧型體有影響的特徵空間。ICM的主要貢獻在於基於agent對環境的預測誤差來設計內在獎勵信號,該獎勵信號可以擴展到高維連續狀態空間,如圖像,同時能夠自動忽視不影響agent行為的環境變化。ICM通過引入三個神經網路模型來實現其目標:Encoder(編碼器)、Inverse dynamics model(逆向模型)和Forward dynamics model(前向模型)。這些模型共同作用,使智慧型體能夠有效地探索未知狀態空間,同時避免探索無關事物的影響。