NIM med förstärkningsinlärning

Se hur ett AI-system lär sig spela spelet NIM från grunden – bara genom att spela mot sig själv.

1
Träna AI-systemet – Välj hur många spel AI:n ska öva på. Kolla hur Q-tabellen förändras under träningen!
2
Utforska Q-tabellen – Tabellen till höger visar vad AI:n lärt sig. Grönt = bra drag, rött = dåligt. Ser du ett mönster?
3
Spela mot AI:n – Utmana en halvlärd eller fullärd AI. Kan du slå den?
Mål: Undvik att ta den sista pinnen – den som gör det förlorar.

Hur man spelar:
Spelare turas om. På din tur väljer du att ta 1, 2 eller 3 pinnar (du måste ta minst 1).

Exempel med 9 pinnar:
Du tar 2 → 7 kvar
AI tar 3 → 4 kvar
Du tar 3 → 1 kvar
AI tvingas ta sista → AI förlorar!
← AI-aktiviteter

NIM

Se hur ett AI-system lär sig spela NIM med förstärkningsinlärning – testa sedan att spela mot det!

Inställningar
Tänk dig att du lär dig ett spel bara genom att spela om och om igen och se vad som funkade. Det är precis så AI-systemet gör.

För varje situation i spelet lär det sig ett Q-värde – ett betyg på hur bra ett visst drag brukar vara. Om ett drag leder till vinst höjs betyget, och om det leder till förlust sänks det. I början provar AI-systemet drag nästan slumpmässigt – det utforskar. Ju fler träningar, desto mer börjar det utnyttja vad det lärt sig och väljer de drag med högst betyg. Tabellen till höger visar vilket betyg respektive drag har i varje situation.
Q-tabell – AI:ns hjärna
Varje rad = antal kvarvarande pinnar. Varje kolumn = drag. Grönt = bra drag, rött = dåligt. Guldram = bästa draget i tillståndet.
Bra drag
Dåligt drag
Bästa draget
Träna AI:n för att se Q-tabellen fyllas i.