Edustaja Tynkkynen on asiantunteva…
Oras Tynkkynen

Edustaja Räsänen puhuu tärkeiksi kokemistaan asioista…
Päivi Räsänen

Edustaja Tuomioja on unionin miehiä…
Erkki Tuomioja

Valtiovarainministeri istuu tiukasti rahakirstun päällä…
Jyrki Katainen

Oppositiojohtaja tietää hyvin ketä sanan säilällä sohia …
Jutta Urpilainen

ja edustaja Virtanen ei tavallaan tosiaan oikein taida sanoa yhtään mitään.
Pertti Veltto Virtanen

Pohdimme uutisten tulevaisuutta ja datajournalismi putkahti esiin yhtenä nousevista trendeistä. Konkretia on aina suositeltavaa, joten päätin iltapuhteikseni kokeilla miten homma voisi toimia. Yllä olevat kuvat esittävät valittujen kansanedustajien uusimpia puheenvuoroja eduskunnassa. Kultakin edustajalta otettiin mukaan tarjolla olevat uusimmat puheenvuorot, kuitenkin maksimisaaan 500 viimeistä.

Puheiden tekstit on raavittu eduskunnan verkkopalvelusta. Sanapilvien selkeyttämiseksi yhdistin kaikkien puheet ja etsin yleisimmät kaikilla esiintyvät sanat, jotka sitten taas poistin kunkin edustajan omista puheista. Tämä siksi, että muuten sanapilvet olisivat vain esittäneet yleisimpiä sanoja (ja, on, ei, jos…) eikä merkittäviä eroja edustajien välillä olisi näkynyt.

Pilvet on muodostettu Wordle-palvelulla ja niissä on kunkin edustajan 300 yleisintä sanaa. Hauska nähdä miten näinkin kevyellä toteutuksella saadaan tietomassasta muodostettua visualisointeja, joissa on ideaa.

Maailmalla Guardian taitaa olla edelläkävijä datajournalismissa, mutta muut tulevat varmasti perässä. Löytyykö kotimaasta yhtään toimitusta tai toimittajaa, joka hyödyntäisi säännöllisesti datan louhintaa ja visualisointeja omassa työssään?