Ett interaktivt klassificeringslaboratorium
I det här labbet tränar du en Naïve Bayes-klassificerare — samma typ av algoritm som används i spamfilter. Du bestämmer vad modellen lär sig, och kan sedan se hur matematiken bakom algoritmen fungerar när den klassificerar nya mejl.
Algoritmen kallas naïve (naiv) för att den antar att varje ord i ett mejl är oberoende av alla andra ord. I verkligheten stämmer det sällan, men förenklingen gör matematiken hanterbar och modellen förvånansvärt träffsäker.
Börja med att klicka på ⚡ GENERERA — då fylls modellen med exempelmail automatiskt. Du kan styra hur många och hur fördelningen mellan skräppost och vanliga mejl ser ut med reglaget. Det går också att skriva egna meningar eller ladda upp en textfil med träningsdata.
Här ser du vad modellen lärt sig — vilka ord som är mest typiska för varje klass och deras sannolikheter. Jämförelsevisningen visar samma ord för båda klasser sida vid sida, så du ser vilka ord som verkligen skiljer dem åt.
Skriv in ett mejl och tryck Enter. Modellen visar hur texten tokeniseras, hur sannolikheten förskjuts ord för ord, och hur säker den är på sin klassificering. Klicka på Visa hela beräkningen för att se Bayes formel med dina egna siffror.
SPAM,Din text här
HAM,Din text här
Etiketten måste vara SPAM eller HAM (versaler).
Genererar exempelmail ur den inbyggda exempelbanken. Variera fördelningen för att se hur ojämn träningsdata påverkar modellens beteende.