kobler til …
0RUBIN
parti –
halvtrekk –
0KOBOLT
Kobolt
Bunke
Toppkort
Gjeldende farge
Rubin

🧑‍🏫 Læreren — hva har de lært?

Henter vurdering …

Læreren tenker …

💬 Lærerens betraktninger — løpende

Læreren samler tankene …

📈 Læringskurvene

RubinKobolt· eksamen: % vunnet mot tilfeldig bot (gull stipling = håndkodet proff ≈ 60 %)
Rubins seiersandel, siste 100 partier (50 % = jevnt)
RubinKobolt· må trekke per parti (glattet — lavere = klokere hånd)
RubinKobolt· håndstørrelse når åtteren spilles (synkende = sparer den)

📖 Hva skjer her?

Rubin og Kobolt har forlatt slangearenaen og satt seg ved kortbordet. De spiller Vri åtter døgnet rundt og lærer fra null: en verditabell (Monte Carlo-forsterkningslæring) lærer hvor gode stillinger er, og et søketre regner konkrete halvtrekk fremover — som TD-Gammon, bare i lommeformat. Motstanderens kort er ukjente, så all fremoverregning skjer i tenkte verdener: agenten dikter mulige motstanderhender som stemmer med det den vet og husker.

Reglene

Slik leker du deg

Stillingen agentene «ser» er med vilje grovkornet (kort på hånden, åttere, maktkort, fargedekning, motstanderens antall …) — derfor holder en tabell, og derfor er læringen synlig på minutter. All lærdom lagres på serveren og overlever omstart.