NAÏVE BAYES-LABBET

Ett interaktivt klassificeringslaboratorium

I det här labbet tränar du en Naïve Bayes-klassificerare — samma typ av algoritm som används i spamfilter. Du bestämmer vad modellen lär sig, och kan sedan se hur matematiken bakom algoritmen fungerar när den klassificerar nya mejl.

Algoritmen kallas naïve (naiv) för att den antar att varje ord i ett mejl är oberoende av alla andra ord. I verkligheten stämmer det sällan, men förenklingen gör matematiken hanterbar och modellen förvånansvärt träffsäker.

① TRÄNA

Börja med att klicka på ⚡ GENERERA — då fylls modellen med exempelmail automatiskt. Du kan styra hur många och hur fördelningen mellan skräppost och vanliga mejl ser ut med reglaget. Det går också att skriva egna meningar eller ladda upp en textfil med träningsdata.

② MODELL

Här ser du vad modellen lärt sig — vilka ord som är mest typiska för varje klass och deras sannolikheter. Jämförelsevisningen visar samma ord för båda klasser sida vid sida, så du ser vilka ord som verkligen skiljer dem åt.

③ KLASSIFICERA

Skriv in ett mejl och tryck Enter. Modellen visar hur texten tokeniseras, hur sannolikheten förskjuts ord för ord, och hur säker den är på sin klassificering. Klicka på Visa hela beräkningen för att se Bayes formel med dina egna siffror.

LÄGG TILL TRÄNINGSEXEMPEL
KLASS:
STATISTIK
SKRÄPPOST
0
exempel
P(Skräppost) = —
EJ SKRÄPPOST
0
exempel
P(Ej skräppost) = —
Ordförråd: — ord
TRÄNINGSDATA 0 0
IMPORTERA TRÄNINGSDATA VIA FIL
Filen ska vara en .csv eller .txt — en rad per exempel, format: SPAM,Din text här HAM,Din text här Etiketten måste vara SPAM eller HAM (versaler).
📂
Klicka för att välja fil
.csv eller .txt · en rad per exempel
GENERERA TRÄNINGSDATA AUTOMATISKT

Genererar exempelmail ur den inbyggda exempelbanken. Variera fördelningen för att se hur ojämn träningsdata påverkar modellens beteende.

ANTAL:
FÖRDELNING SKRÄPPOST / EJ SKRÄPPOST 50% / 50%
Jämn fördelning — priorsannolikheten P(klass) påverkar inte klassificeringen nämnvärt.
Ingen modell ännuLägg till träningsdata i fliken Träna.
Ingen modell ännuLägg till träningsdata i fliken Träna.