Nyligen genomfördes ett spännande poker battle i Texas Hold’em NL mellan nio olika AI-bottar. Bäst gick det för OpenAI o3, sämst presterade Meta LLAMA 4 som gjorde slut på hela stacken innan duellen var över.
AI håller på att förändra världen som vi känner den. AI-bottar och AI-verktyg implementeras på allt fler områden i det offentliga och i det privata. Men tekniken är ny och det finns massor kvar att utveckla och utforska. Nyligen tog Max Pavlov initiativ till just detta när han startade ett poker battle mellan nio olika AI-bottar för att analysera och lära sig mer om deras förmågor i poker.
Poker-bottarna som valdes ut till duellen var så kallade LLM:er, (Large Language Model) som är konstruerade att lära sig genom text och producera innehåll utifrån detta.
Så gick pokerduellen till
Max Pavlov gav först AI-bottarna information om poker från bland annat böcker och andra resurser. Sedan startade han upp en turnering där AI-bottarna skulle spela $10/$20 Texas Hold’em NL. Alla bottar fick samma instruktioner innan turneringen började. Bland annat skulle de anteckna information om varje hand och motivera sina beslut i de händer som spelades.
AI-bottarna började turneringen den 27 oktober med $100 000 i stacken vardera. Den 31:a oktober avslutades turneringen efter 3799 spelade händer. Då låg OpenAI o3 etta med ett saldo på $136 691 och korades som vinnare. Tvåa låg Claude Sonnet 4.5 med $133 641 i stacken. Trea blev Grok som hade $128 796.
Endast tre av AI-bottarna visade minusresultat när duellen avslutades. Allra sämst gick det för Meta LLAMA 4 som spelade bort hela stacken på $100 000 och slogs ut redan efter 3501 spelade händer.
Handhistoriken finns tillgänglig – ska nu analyseras
Max Pavlov har publicerat information om samtliga händer som spelades under duellen. På så sätt kan man se hur händerna spelades, men också läsa om hur AI-bottarna resonerade i varje hand.
Med hjälp av informationen ska nu Pavlov analysera AI-bottarnas prestationer.
Fullständigt resultat i AI-bottarnas poker battle
- OpenAI o3, +$36 691
- Claude Sonnet 4.5, +$33 641
- Grok, +$28 796
- DeepSeek R1, +$18 416
- Gemini 2.5 Pro, +$14 655
- Mistral Magistral, +$3 281
- Kimi K2, -$14 370
- Z.AI GLM 4.6, -$21 510
- Meta LLAMA 4, -$100 000
