NIM med förstärkningsinlärning

Se hur ett AI-system lär sig spela spelet NIM från grunden – bara genom att spela mot sig själv. Regeln är enkel: ta 1–3 pinnar per drag, och den som tvingas ta den sista pinnen förlorar.

Träna AI-systemet – Välj hur många spel AI:n ska öva på. Kolla hur Q-tabellen förändras under träningen!

Utforska Q-tabellen – Tabellen till höger visar vad AI:n lärt sig. Grönt = bra drag, rött = dåligt. Ser du ett mönster?

Spela mot AI:n – Utmana en halvlärd eller fullärd AI. Kan du slå den?

AI-aktiviteter

NIM

Se hur ett AI-system lär sig spela NIM med förstärkningsinlärning – testa sedan att spela mot det!

🇬🇧 English

NIM-reglerna Förstärkningsinlärning Q-värde Utforska vs utnyttja

Inställningar

Antal pinnar

Max per drag

Antal träningar

Q-tabell – AI:ns hjärna

Varje rad = antal kvarvarande pinnar. Varje kolumn = drag. Grönt = bra drag, rött = dåligt. Guldram = bästa draget i tillståndet.

Bra drag

Dåligt drag

Bästa draget

AI:ns inlärda strategi

Träna AI:n för att se Q-tabellen fyllas i.