Se hur ett AI-system lär sig spela NIM med förstärkningsinlärning – testa sedan att spela mot det!
Inställningar
Spel: 0/0
Utforskar: 100% | Utnyttjar: 0%
Tänk dig att du lär dig ett spel bara genom att spela om och om igen och se vad som funkade. Det är precis så AI-systemet gör.
För varje situation i spelet lär det sig ett Q-värde – ett betyg på hur bra ett visst drag brukar vara. Om ett drag leder till vinst höjs betyget, och om det leder till förlust sänks det. I början provar AI-systemet drag nästan slumpmässigt – det utforskar. Ju fler träningar, desto mer börjar det utnyttja vad det lärt sig och väljer de drag med högst betyg. Tabellen till höger visar vilket betyg respektive drag har i varje situation.
0
Du
0
AI
0
Spel
🎯
Tryck Nytt spel för att börja.
AI tänker
Q-tabell – AI:ns hjärna
Varje rad = antal kvarvarande pinnar. Varje kolumn = drag. Grönt = bra drag, rött = dåligt. Guldram = bästa draget i tillståndet.