Edustaja Tynkkynen on asiantunteva…
Edustaja Räsänen puhuu tärkeiksi kokemistaan asioista…
Edustaja Tuomioja on unionin miehiä…
Valtiovarainministeri istuu tiukasti rahakirstun päällä…
Oppositiojohtaja tietää hyvin ketä sanan säilällä sohia …
ja edustaja Virtanen ei tavallaan tosiaan oikein taida sanoa yhtään mitään.
Pohdimme uutisten tulevaisuutta ja datajournalismi putkahti esiin yhtenä nousevista trendeistä. Konkretia on aina suositeltavaa, joten päätin iltapuhteikseni kokeilla miten homma voisi toimia. Yllä olevat kuvat esittävät valittujen kansanedustajien uusimpia puheenvuoroja eduskunnassa. Kultakin edustajalta otettiin mukaan tarjolla olevat uusimmat puheenvuorot, kuitenkin maksimisaaan 500 viimeistä.
Puheiden tekstit on raavittu eduskunnan verkkopalvelusta. Sanapilvien selkeyttämiseksi yhdistin kaikkien puheet ja etsin yleisimmät kaikilla esiintyvät sanat, jotka sitten taas poistin kunkin edustajan omista puheista. Tämä siksi, että muuten sanapilvet olisivat vain esittäneet yleisimpiä sanoja (ja, on, ei, jos…) eikä merkittäviä eroja edustajien välillä olisi näkynyt.
Pilvet on muodostettu Wordle-palvelulla ja niissä on kunkin edustajan 300 yleisintä sanaa. Hauska nähdä miten näinkin kevyellä toteutuksella saadaan tietomassasta muodostettua visualisointeja, joissa on ideaa.
Maailmalla Guardian taitaa olla edelläkävijä datajournalismissa, mutta muut tulevat varmasti perässä. Löytyykö kotimaasta yhtään toimitusta tai toimittajaa, joka hyödyntäisi säännöllisesti datan louhintaa ja visualisointeja omassa työssään?
Mahtava idea! “Herra” olisi pitänyt vielä suodattaa pois, koska puheenvuoro alkaa useimmiten sanoilla “herra puhemies”.
Ennen Riitta Uosukaisen puhemieskautta puheet aloitettiin ja niitä rytmitettiin sanoilla “Herra puhemies”. Nykyään on tapana aloittaa ja rytmittää sanomalla “Arvoisa puhemies”
Pilvien perusteella herraakin vielä käytetään, koska kristillisten Räsäsellä nyt voi joku muukin syy olla toistella herraa, mutta Erkki Tuomiojalla sentään vähemmän.
Kyllä, kaikkia yleisiä sanoja ei ole poistettu, koska tarkoituksena oli tehdä pikainen proto, eikä keskittyä viilaamiseen. Täytyy tehdä vähän jatkokehitystä ja miettiä muita kulmia asiaan.
[…] on osa datajournalismiin liittyvää juttusarjaamme, jonka ensimmäisessä osassa tarkasteltiin kansanedustajien puheita. Kuvassa käytetyt luvut on poimittu evl.fi ja eroakirkosta.fi […]