Sarsa公式
Sarsa 公式如下 : $(Q(s,a)=Q(s,a)+l… Read more »
Sarsa 公式如下 : $(Q(s,a)=Q(s,a)+l… Read more »
底下使用迷宮的走法,走到 (1,2) 或 (2, 1) 為地… Read more »
為什麼叫 Q-Learning Q 這個字母在強化學習中表示… Read more »
Reinforcement[͵riɪnˋforsmənt] … Read more »
網路上那麼多的動態規化教學,總是一大堆看不懂的東西,本篇先使… Read more »
馬可夫決策比馬可夫鍊多了一個狀態,底下以 4*4 的格子作為… Read more »
什麼是強化學習 美國的心理學家 Skinner (史金納),… Read more »