?.? sanoi:
Pitäisikö vielä spekuloida, mitä tapahtuisi, jos KaHe putoaisi kolmoseen? Lieneekö Hämis sarja- vai joukkueuskollinen? Seurasiirto Sykkiin?
Mä kirjoitan tässä vaiheessa vielä erittäin isolla tuon "JOS KAHE PUTOAISI KOLMOSEEN"-kohdan, enkä todellakaan kommentoi tuollaisia seurasiirtohuhuja. Todettakoon vain, että olen mikroista asti (yhtä naurettavaa divarikautta lukuunottamatta) pelannut Heikkilän kanssa samassa jengissä. Tällainen pakettidiili saattaisi siis mahdollisesti vaikuttaa allekirjoittaneen (eli siis tässä tapauksessa Heikkilän) kysyntään vapailla pelaajamarkkinoilla ja toisaalta takaa Heikkilälle power rankingit myös ensi kaudella. Ellei se klovni taas telo itseään.
Mitä KaHen yleisempään statukseen tulee, mua on HNNKY-40 -pelin jälkeen v!tuttanut niin paljon, että olen voinut jopa fyysisesti pahoin. Ja tällaiseen feelikseen ei tunnetusti auta mikään muu kuin matemaattinen mallintaminen.
Tämän yön aiheeksi valittiin alun perin amerikkalaisesta pesiksestä eli baseballista tuttu käsite: odotettu voittoprosentti eli
expected winning percentage. Ideana hommassa on oletus, että joukkueen voittoprosenttiin vaikuttavat sekä joukkueen tekemät pisteet (Pts) että joukkueen vastustajan tekemät pisteet (Opp). Tätä riippuvuutta kuvataan mallilla:
Odotettu voitto% = Pts^alpha/(Pts^alpha + Opp^alpha), (*)
missä alpha on parametri, jonka avulla malli sovitetaan aineistoon. Selvästi näemme, että joukkueen pisteiden lisäys kasvattaa odotettua voittoprosenttia ja vastustajan pisteiden lisäys vastaavasti pienentää ennustetta. Pisteiden vaikutus ennusteeseen riippuu suoraan alphan arvon valinnasta siten, että suuremmalla alphalla yksittäisen pisteen vaikutus on suurempi. NBA:ssa alphan arvona on perinteisesti käytetty vakiota alpha=16.5, mutta M2D:n tapauksessa katsoin parhaaksi suorittaa pienimmän neliösumman sovituksen tämän kauden sarjataulukkoon. Tämä sovitus antoi alphan estimaatiksi arvon alpha=8.36. Kaiken kaikkiaan mallin selitysaste on 0.931 eli 93% prosenttia joukkueiden voittoprosenttien vaihtelusta voidaan selittää edellä kuvatun muotoisella mallilla. Käytännössä tämä on erittäin, erittäin hyvä tulos.
PNS-sovituksen toteutus ja mallissa käytetty aineisto on esitetty tässä linkissä. (**)
Taulukon sarakkeista mielenkiintoisimpia ovat sarakkeet "Pred." (ennustetut voittoprosentit) ja "Actual" (havaitut voittoprosentit). Näitä sarakkeita ja taulukon alla olevaa kuvaajaa tarkastelemalla itse kukin voi vakuuttua siitä, että mallilla tuntuu olevan tietyn laista selitys voimaa; ennustetut voittoprossat ovat hyvin saman suuruisia kuin havaitut prosentit!
Jos tästä mallista haluaa hakea jotain käytännon hyötyä, voi tarkastella viimeistä saraketta "Error", jossa on laskettu ennustettujen ja havaittujen voittoprosenttien erotukset eli mallin ennusteiden virheet. Jos erotus on positiivinen (vihreä), joukkueen voittoprosentti on todellisuudessa suurempi kuin malli ennustaa. Tällainen joukkue on ns. clutch-joukkue, joka voittaa tiukat ottelunsa, eikä joukkueen plus-miinus-tilasto kerro joukkueen tasosta koko totuutta. Esim. Räppä on tainnut hoidella muutaman otteluun Porvooseen tällä kaudella siten, että voittoja on jopa enemmän kuin joukkueen koriero antaisi odottaa. Toisaalta GaYMCA ja Kollit ovat parantaneet keväällä otteitaan niin reippaasti, etteivät syksyiset suurinumeroiset p*rsepanot juurikaan heijastele joukkueen voittosaldoa.
Toisaalta jos erotus on negatiivinen, joukkueen voittoprosentti on huonompi kuin joukkueen koriero antaisi olettaa. Tämän kaltainen joukkue "ei saa koreistaan täyttä hyötyä" ja saattaa esimerkiksi taluttaa vastustajan pelaaja-valmentajan korintekoon aivan ottelun viime sekunneilla tai muuten mokata kaikki tiukat kamppailunsa. Tästä esimerkkinä toimii vaikkapa KaHe, jonka todellinen voittoprossa on jotain aivan muuta kuin joukkueen otteluissa tehdyt pisteet ennustaisivat (voitetaan reippaasti, hävitään tiukasti). Malli ennustaa nimittäin KaHelle voittoprossaa 52.4%, vaikka tunnetusti KaHe on voittanut vain 41.2% otteluistaan. Tästä analyysistä yhteenvetona voitaisiin todeta, että Kartanon Herrojen joukkue on pelannut yllättävän paskasti, mutta se ei tainnut tulla kenellekään uutisena.
(Tietenkin tässä vaiheessa voidaan mainita myös Jaguaarit, joiden voittoprossa on ennustettua alempi yksinkertaisesti siitä syystä, että joukkue on voittanut vain yhden pelin.)
(**) Jykke hei, koodaapa nopeasti sellainen pienimuotoinen kaavaeditori, jolla voisi tuottaa kaavoja esim. LaTeX-koodilla.
(**) Tää foorumi tarvitsee myös kätevämmän tavan tuottaa ruudulle taulukoita, joita kuitenkin koriksessakin joskus saattaa esiintyä.