Digiarjessa-blogi

Ennustimme datasta eduskuntavaalien voittajat – näin se toteutui

Alina Peussa | BI-konsultti18. huhtikuuta 2019

Eduskuntavaalien alla ennustimme Google Trendsin avulla uuden eduskunnan kokoonpanon. Mutta miten tarkka ennuste loppujen lopuksi oli? Teimme yhteenvedon analyysimme onnistumisesta.

vaalit

Alla olevalle raportille on koostettu vaaliennusteiden tuloksia. Malli osoittautui varsin hyväksi ennustamaan negatiivisia tuloksia. Oikeita ennusteita siitä, että ehdokas ei pääse jatkoon oli 2110 kappaletta ja pieleen menneitä 120. Positiivisten tulosten kohdalla tulos ei ollut yhtä hyvä. Oikein menneitä positiivisia ennusteita oli vain 80. Näistä ennusteista 30 kuului henkilöille, jotka eivät entuudestaan olleet kansanedustajia, mikä antaa mielestäni osviittaa Google Trendsin kyvystä havaita signaaleja.

 

 

Ennusteessa Google Trends -keskiarvon lisäksi käytetty tieto siitä, että onko ehdokkaan puolue eduskuntapuolue, ei ollut riittävä ennustamaan läpimenneitä ehdokkaita tarpeeksi hyvin. Osassa tapauksista, kuten pienpuolueiden mediahuomiota herättävien ehdokkaiden kohdalla, se teki tehtävänsä, mutta kaikki eduskuntapuolueet eivät ole samanlaisia. Esimerkiksi Seitsemän tähden liike oli virallisesti eduskuntapuolue ja siksi Paavo Väyrysen lisäksi jatkoon oli ennustettu myös Ilja Janitskin. Kumpikaan ei saanut riittävää äänimäärää päästäkseen kansanedustajaksi. En keksi millä datalla Väyrysen kaltaisen konkarin putoamisen olisi voinut ennustaa.

Ääniharavien TOP 20:ssä ennuste osui oikeaan joka toisen kohdalla. Halla-Aho oli ylivoimainen sekä Google Trends -luvuissa että äänimäärissä. Ehdokas Matti Heikkisen nousu ennustelistan korkeille sijoille lienee hiihtäjä Matti Heikkisen ansiota. Hakutermien etunimi + sukunimi -yhdistelmä ei siis toimi kaikkien ehdokkaiden kohdalla. Monipuolisemmalla Google Trends -palvelun käytöllä olisi mahdollista tarkentaa hakutermejä ja tehdä mielipideanalyysiä. Näin voidaan saada paremmin selville, miksi tiettyä henkilöä on haettu.

Blogiin tuli useita kommentteja siitä, miten ennuste ei ota huomioon suhteellista vaalitapaa ja eri ikäryhmien tiedonhakukäyttäytymistä. Kommentit ovat aiheellisia ja nämä seikat pitää ottaa huomioon jatkosuunnittelussa. Malli voisi esimerkiksi ottaa huomioon ennustetut ääniharavat sekä profiloida eri puolueiden kannattajat tiedonhakukäyttäytymisen perusteella. Tieto kansan tyytyväisyydestä tai tyytymättömyydestä hallitusta kohtaan lienee myös tärkeä muuttuja.

Tutustu alkuperäiseen ennusteeseemme >>


analytiikka


Tilaa blogikirjoitukset sähköpostiisi