Posted by & filed under Uncategorized.

Verkkotyökalujen ja toimintatapojen kehitys luo painetta oppilaitoksille uudistaa opetusta entistä nopeampaan tahtiin. Uusia opetettavia asioita ja aiheita syntyy jatkuvasti.

Datajournalismi on esimerkki vielä heikosti jäsentyneestä aihealueesta, joka on kuitenkin nopeasti kasvamassa niin merkittäväksi, että monet yliopistot, ammattikorkeakoulut ja vapaan sivistystyön oppilaitokset haluaisivat lisätä sen osaksi opetustarjontaansa.

Teemana datajournalismi nousi esille Suomessa vahvasti vasta vuoden 2011 aikana ja aiheesta ei tuolloin ollut suomenkielistä oppimateriaalia, eikä juurikaan kokemuksia soveltuvista oppimismenetelmistä tai kurssisisällöistä.

Seuraavaksi esitellään tiiviisti kolme kantavaa ajatusta, joiden johdattelemana datajournalismin opetusta on tuotu suomeen. Esimerkketoimia ja kantavia ajatuksia voi soveltaa datajournalismin lisäksi muihin uusiin aihealueisiin, joidenka opetusta on tarvetta kehittää nopeasti ja verkostomaisesti.


1. Ajatus: Uusien aihealueiden omaksuminen tapahtuu edelläkävijöiden verkostoissa

Aivan ensimmäiset kiinnostuneet toimivat yleensä irrallaan toisistaan ja ovat opiskelleet aihetta omilla tahoillaan jo ennen kuin mitään verkostoa on syntynyt. Blogien ja sosiaalisen median kautta nämä pioneerit ennen pitkään löytävät toisensa ja alkavat ensin löyhemmin ja myöhemmin ehkä tiiviimmin verkostoitua jaetun kiinnostuksenkohteen ympärille.

Verkoston kehittymistä on mahdollista tukea muun muassa perustamalla ja ylläpitämällä keskusteluympäristöjä, järjestämällä tapaamisia ja aktiivisesti linkittämällä toimijoita keskenään.

Esimerkkinä suomalainen datajournalismin verkosto


2. Ajatus: Kun ihmiset haluavat tietoa uudesta asiasta he googlettavat sitä

On tyypillistä, että aluksi uudehkoista aihepiireistä on verkossa tarjolla enemmän tietoa englanniksi ja muilla valtakielillä, mutta suomenkielinen sisältö on vähäistä ja usein terminologiakin saattaa olla jäsentymätöntä.

Aihepiirin avainkäsitteiden vakiintumista voi vauhdittaa luomalla suomenkielistä verkkosisältöä, joka on hyvin näkyvillä Google-hauissa.

Esimerkkinä suomenkielinen datajournalismin verkkopresenssi

Kahden vuoden aikana datajournalismi on terminä vakiintunut käyttöön. Aiemmin oli rinnakkaiskäytössä muun muassa tietokantajournalismi ja tietojournalismi. Datajournalismille aiheena ja suomalaiselle datajournalismin verkostolle on kehittynyt osin tavoitteellisen kehitystyön tuloksena selkeä verkkopresenssi. Ohessa on Googlen ensimmäiset hakutulokset sanalla “datajournalismi” (Firefox anonyymi selailu -tilassa 18.5.2013 tilanteessa). Wikipedia, oma verkkotunnus (datajournalismi.fi), sisällöllisesti rikkaat blogit, perinteisen median verkkosivut ja sosiaalisen median alustat, kuten Twitter ja Facebook nousevat hakutuloksissa korkealle.

  1. Wikipedia-artikkeli – Artikkeli perustettu 29.6.2011
  2. Datajournalismi.fi – Sivusto perustettu datajournalismin päivää varten syyskuussa 2011
  3. Teemo Tebestin blogi – Teemo on blogannut joulukuusta 2011 lähtien
  4. Hesarin datajournalismi – Hesari on suomalaisen datajournalismin pioneereja – ensimmäinen HS Open oli 14.3.2011
  5. Kuvalehden datajournalismi – Myös Suomen Kuvalehti lähti aikaisin liikkeelle datajournalismissa
  6. Twitter #datajournalismi
  7. Twitter @datajournalismi

3. Ajatus: Aiheen vakiintuminen osaksi oppilaitosten opetustarjontaa edellyttää laadukkaita oppimateriaaleja

Avoin lisensoiti ja oppimateriaalien jakaminen verkossa sopii erityisen hyvin tilanteisiin joissa käyttäjät kehittävät ja kartuttavat yhteisiä sisältöjä vaiheittain käytön myötä. Ei ole järkevää, että jokainen saman aiheen opettaja tekee omat oppimateriaalit alusta asti itse. Avoimet verkkoaineistot pysyvät paremmin ajantasaisina, kun käyttäjät voivat parantaa niitä. Opettaja voi vaihtaa avoimessa oppikirjassa olevat tehtävät paremmiksi. Verkon kautta sisällöt ovat helposti saatavilla ja niitä voivat hyödyntää opettajat, oppilaat, oppilaitokset ja kaikki muut oppimisesta kiinnostuneet.

Avoimien verkkoaineistojen kehittäminen voidaan käynnistää kokoamalla riittävän laadukas siemenaineisto, joka pyritään saamaan useamman opettajan käyttöön.

Esimerkkinä suomenkielinen datajournalismin avoin oppimateriaali ja opettajaverkosto

  • Datajournalismi.fi -tutoriaalit – Pääosin Antti Poikolan ja Jarno Liskin tekemiä tutoriaaleja, joita on käytetty useissa koulutuksissa
  • Wikiopiston linkkilista – Joukkoistamalla koottu kattava linkkilista suomenkielisiin datajournalismiaineistoihin
  • Opettajien tapaamiset – Jyväskylän yliopisto ja Tampereen yliopisto ovat vuorollaan isännöineet datajournalismin opettajien tapaamisia
  • Vierailijaluennot – Datajournalismin kursseja eri organisaatioissa vetäneet ovat toimineet vierailijaluennoitsijoina toistensa kursseilla
  • Wikiopiston kurssirunko – Eri kurssien kokemusten perusteella muodostetaan yleinen modulaarinen datajournalismin kurssirunko (kesken)

Yhteenveto

Uusi aihepiiri osaksi eri oppilaitosten opetustarjontaa:

1. Tue edelläkävijäverkoston syntymistä

Olennaista on löytää kiinnostuneet ihmiset ja toimia avoimesti ja osallistavasti – ei omia tai dominoida aihepiiriä.

2. Luo selkeä verkkopresenssi aiheelle ja verkostolle

Jos aiheesta ei ole Wikipedia-artikkelia, aloita se heti ja luo yhdistävä selkeä sivusto oman verkkotunnuksen alle – nämä teot paaluttavat verkkopresenssiä parhaiten.

3. Käynnistä avoimien yhteiskäyttöisten oppimateriaalien tekeminen ja opettajien yhteistyö

Avoimen oppimateriaalin tekeminen on helppoa, mutta työlästä – se, että materiaalin saa useiden opettajien käyttöön on vaikeaa, mutta säästää jatkossa kaikkien vaivaa.


Otavan Opisto käynnisti vuoden 2012 alkupuolella datajournalismin opetuksen verkostopilotin osana Avoimuudesta Voimaa Oppimisverkostoihin (AVO2) -projektia. Pilotissa on kehitetty datajournalismin koulutusta ja oppimateriaaleja eri toimijoiden välisenä yhteistyönä. Yleisemmällä tasolla on etsitty keinoja siihen, miten uusi aihepiiri voidaan nopeasti viedä osaksi eri oppilaitosten opetustarjontaa tukeutumalla avoimiin verkostomaisiin toimintamalleihin.

Posted by & filed under Uncategorized.

Mitä: Pondus Open Data HackFest
Missä: Arcada, Jan-Magnus Janssonin aukio 1, Helsinki
Milloin: Tiistaina 5.3. 2013 kello 9-21.30

Ensi tiistaina 5.3.2013 lähinnä ruotsinkielisten aineistojen avaamista ja linkittämistä edistävä Pondus verkosto järjestää Open Data HackFestin Helsingin Arcadassa. Tilaisuudessa on mahdollista päästä kokeilemaan uutta avointa dataa ja parhaille ideoille on luvassa rahapalkinto! Katso lisätiedot tapahtumasta osoitteesta: http://www.pondus.info/open_data_hackfest/hackfestsuomi/

Mikä Pondus?

Pondus syntyi vuonna 2012 projektina, jossa suomenruotsalaiset sanomalehdet olivat mukana rahoittamassa suunnittelua ja koordinaatiota. Muiden muassa myös Svenska Yle on ollut aktiivisesti mukana. Tästä johtuen journalistiset aineistot ovat hyvin edustettuina myös tiistain HackFestissä.

Ontologioita käyttämällä toivomme edistävämme myös kielestä riippumaattomia hakuja ja palveluita, sillä on paljon mielenkiintoisia aineistoja, jotka nykyisin jäävät turhaan pimentoon. Olemme ennen kaikkea tehneet työtä metadatan ja yhteinäisten tietorakenteiden ja aineistojen mahdollisimman avoimen lisenssoinnin puolesta. Myös tekninen datan avaaminen on tärkeä tavoite.

Projektissa ja aineistossa on kiinnostavaa niiden monipuolisuus, sillä yhteistyöpartnereita on kaikilta kolmelta yhteiskunnan sektorilta. Kiinnostavaa on erityisesti yhdistää aineistoja eri sektoreilta. Siis mitä yhteistä voisi olla esim. graffiteilla, paikallisuutisilla, kirjailijoilla, kansanpuvuilla jne? Miten näitä voisi linkittää tai yhdistellä?

Projektin tavoitteet ovat korkealla eli myös suurelta osin vasta tulevaisuudessa. Datan yhtenäistäminen, avaaminen ja linkittäminen on pitkä prosessi. Kuitenkin jo kuluneen projektivuoden aikana olemme saaneet avattua lukuisia aineistoja. Toimintaa koordinoi ja projektia on hallinnoinut Brages Pressarkiv, joka tuottaa metadataa ruotsinkielisen lehdistön aineistoihin.

Myös kartoista ja paikkatiedosta kiinnostuneiden kannattaa paikalle, sillä HackFestin yhteydessä järjestetään myös Finnish Open Data Ecosystem -ryhmässä ideoitu “Suomen kartat kautta aikojen” -tapaaminen, jossa kootaan aineistoja ja ideoidaan projekteja karttoihin liittyen.

Tervetuloa!

Jessica Parland-von Essen

Brages Pressarkiv

Posted by & filed under Uncategorized.

Datajournalismin tutoriaaleja on päivitetty aktiivisesti vuoden 2013 alkupuolella. Työkaluina tutoriaaleissa käytetään Google taulukkoa, Exceliä, Fusion Tablesia ja Google Refinea. Nämä työkalut kehittyvät jatkuvasti ja esimerkiksi Fusion Tablesissa on käyttöliittymä kokenut melkoisen uudistuksen/parannuksen viimevuoden loppupuolella.

Jos teet tutoriaaleja, niin annathan palautetta niiden kehittämiseksi esimerkiksi sähköpostitse: antti.poikola [a] gmail.com

Tutoriaalisivu löytyy täältä: http://datajournalismi.fi/tutoriaaleja/

Posted by & filed under Datavaalit.

Äänestä Doodlessa itsellesi sopiva päivä Datavaalit syystapaamiseen.

Mitä?

Mitä Datavaalit voisi tehdä vaalien välillä? Kutsumme kaikki Datavaalit -hankkeeseen jollain tavalla osallistuneet ja muut kiinnostuneet iltapäivän mittaiseen syystapaamiseen joulunalusviikolla. Ilmoittautuminen tapaamiseen, sekä ohjelman koostaminen tehdään kaikille avoimessa Etherpad -muistiossa: http://datavaalit.muistio.tieke.fi/syystapaaminen

Missä?

Datavaalit-tapaaminen on Helsinki Region Infoshare-hankkeen isännöimänä Forum Viriumin tiloissa Katariinankatu 3. Aluksi kuulemme isäntäorganisaatiolta esittelyn Helsingin päätösasiakirjajärjestelmä AHJO:n datan avaamisesta ja sen jälkeen jatkamme muilla Datavaalit -teemoilla. Syystapaamisen isännöijiksi oli muitakin halukkaita ja jatkossa Datavaalit -porukka tulee kiertämään varmasti muidenkin organisaatioiden vieraana.

Milloin?

Keskiviikkona 19.12 klo 13-17 + vapaamuotoiset jatkot sen jälkeen

Ilmoittaudu lisäämälä nimesi osallistujalistaan (Etherpad-muistio). Tarjolla on kahvia ja pikkupurtavaa, mutta halukkaat voivat osallistua omakustanteiselle lounaalle klo 12-13 kaupungintalon lounasravintolassa (laitamme Datavaalit -logon merkiksi pöytään)

 

Alustava ohjelma

Huom: Ohjelmaa kehitetään Etherpad-muistiossa ja sitä ei aktiivisesti päivitetä tänne.

12:00 – 13:00 Omakustanteinen yhteislounas halukkaille kaupungintalon ravintolassa
13:00 – 13:20 Katsaus Datavaalien nykytilanteeseen
13:20 – 14:00 AHJO-esittely (Helsingin päätöksentekodatan avaaminen)
14:00 – 14:15 Teemojen* esittely ja jakaantuminen pienryhmiin
14:15 – 15:00 Ryhmätyö osa 1
15:00 – 15:15 TAUKO
15:15 – 16:00 Ryhmätyö osa 2
16:00 – 17:00 Yhteenveto
17:00 -> Jatkot

 

*Kukin voi osallistua oman mielenkiintonsa mukaan kahteen teemaan (ryhmän vaihto tauon aikana). Teemoja ei ole vielä lukittu, mutta ehdolla on muun muassa AHJO:n avaaminen, Datavaalit -ehdotus Uutisraivaaja-kisaan, datajournalismin koulutuksen kehittäminen, datavaalit-tietokannan jatkokehitys ja hyödyntäminen, sekä pohdinta siitä, miten miten kehittäjäyhteisö voisi tukea dataa avaavia organisaatioita? Katso kaikki teemaehdotukset ja halutessasi ehdota omaa teemaasi Etherpad-muistiossa: http://datavaalit.muistio.tieke.fi/syystapaaminen

 


Historiaa ja tulevaisuutta

Datavaalit -hankkeen ideointi käynnistyi erilaisissa pienemmissä ja isommissa kokoontumisissa kevättalvella 2012 (idea, tapaaminen Lasipalatsissa) , aihetta lämmiteltiin toukokuun HSopenissa, kesäkuussa tempaistiin YLE:llä, Sitran Uusi Demokratia kiihdytysrahoitus (12 000€) varmistui kesälomien kynnyksellä, sivusto julkistettiin OKfestin yhteydessä syyskuussa, kunnallisvaaleja lähestyttäessä koodattiin infraa, kerättiin verkostoa (aktiivinen Facebookryhmä), tehtiin koulutusmateriaaleja ja julkaistiin ehdokkaiden vaalirahoitusta ja some-aktiivisuutta valottavat avoimeen vaalidataan pohjautuvat esimerkkisovellukset. Vaalien aikoihin ja jälkeenkin Datavaalit -yhteisössä on esitelty lukuisia analyyseja, pohdittu analyyseja ja sovelluksia, joita voisi tehdä ja ideoitu muun muassa vaalikoneiden tulevaisuutta.

Joulukuussa Datavaalit vei sekä tuomarivoiton, että yleisöäänestyksen voiton Apps4Finland-kisan Yksityinen datan avaus-sarjassa. Jatkosuunnitelmissa on hyödyntää nyt koostettu data ja ideat ja jalostaa niistä myös vaalien väliseen aikaan soveltuvia uusia avoimen demokratian palveluita (ks. ideointia fiidiagregaatin tulevaisuudesta), edistää ja tukea hankkeen tarjoamien resurssien laajempaa hyödyntämistä, ja mahdollisesti osallistua Uuutisraivaaja -kilpailuun.

Posted by & filed under Hacks/Hackers.

Verkkolähetys Hacks/Hackers meetupista täällä 21.11.2012 @ 18:10 alkaen!

Hacks/Hackers Helsingin marraskuun tapaamisessa 21.11.2012 Sourcefabricin Douglas Arellanes kertoo journalisteille suunnatuista avoimen lähdekoodin työkaluista. Prahassa päämajaansa pitävä ja muun muassa Berliiniin ja Torontoon laajennut Sourcefabric on voittoa tavoittelematon organisaatio, joka kehittää avoimen lähdekoodin ohjelmistoja uutishuoneisiin.

Muuta illan ohjelmaa:



sourcefabric youtube version





relaa presentation youtube version





Uutisraivaaja

Posted by & filed under Datavaalit.

Lehdistötiedote 26.10.2012

Datavaalit-hanke



Vaalirahailmoitusten jättöprosentit puoueittain perjantaiaamuna 26.10.2012 kaksi päivää ennen kunnallisvaaleja. Tiedot löytyvät Datavaalit -sivulta.


Perjantaiaamuun mennessä vapaaehtoisen vaalirahoituksen ennakkoilmoituksen oli jättänyt 4542 ehdokasta eli noin 12 prosenttia kaikista ehdokkaista. Tilanne kuitenkin vaihtelee huomattavasti paikkakunnan mukaan: aktiivisimpia vaalirahailmoituksen jättäjiä ovat olleet suurten kaupunkien ehdokkaat. Esimerkiksi Jyväskylässä ja pääkaupunkiseudulla jo lähes kolmannes ehdokkaista on täyttänyt ilmoituksen.

Myös puolueiden välillä on selviä eroja: erityisen aktiivisia vaalirahoitusilmoitusten täytössä ovat olleet vihreiden ja piraattien ehdokkaat. Perää pitää perussuomalaiset. Datavaalit.fi-sivuston kuvaajista selviää sekin, että puolueissa on aktivoiduttu ilmoitusten tekoon eri aikoina. Vaalirahoitustietojen kertymistä voi seurata koko maan tasolla tai kuntakohtaisesti.

Datavaalit.fi-sivustolla viranomaisten tarjoama avoin julkinen tieto on jalostettu kaikkien ymmärtämään muotoon. “Palvelu sai alkunsa vapaamuotoisessa ohjelmointityöpajassa, jossa pohdin ääneen, että vaalirahoitusilmoitukset kannattaisi laittaa säännöllisesti talteen. Hankasalmelainen Ville Korhonen tarttui ideaan ja ohjelmoi hetkessä koodin, joka tallentaa vaalirahoitusvalvonta.fi-sivustolla julkaistut tiedot parin tunnin välein”, kertoo Antti Poikola, yksi Datavaalit-hankkeen puuhamiehistä. “Viranomaiset eivät tallenna historiatietoa lainkaan”, hän jatkaa.

Vaalirahoitustietojen lisäksi Datavaalit-sivustolle on koottu myös kuntavaaliehdokkaiden uusimmat päivitykset suosituimmista sosiaalisista verkkopalveluista, Facebookista ja Twitteristä. Säännöllisesti päivittyvällä sivustolla ehdokkaiden viestejä voi katsella kootusti yhdestä paikasta ja tarvittaessa tehdä rajauksia kunnan ja puolueen mukaan. Tällä hetkellä tietokannassa on jo yli 300 000 päivitystä ja määrä kasvaa jatkuvasti.

Kaikki Datavaalit-hankkeen keräämä data on käytettävissä avoimen rajapinnan kautta. Nyt esitellyt visualisoinnit ovatkin vasta alkua: hankkeen tärkein anti on siinä, että se tarjoaa kattavan, keskitetyn tietovaraston kenen tahansa ohjelmoijan käyttöön. Datavaalit-hanke toivottaa kaikki demokratiasta kiinnostuneet koodarit ja datasta kiinnostuneet journalistit mukaan talkoisiin!

Vaalirahoitustiedot visualisoituna:
http://www.datavaalit.fi/candidates/budgets/

Ehdokkaiden uusimmat päivitykset sosiaalisessa mediassa:
http://www.datavaalit.fi/candidates/social/

Lisätietoja:

Juha Yrjölä, Kansan muisti ry
050 306 6955, juha.yrjola A kansanmuisti.fi

Joona Lehtomäki, Louhos
040 826 9069, joona.lehtomai A gmail.com

Antti Poikola, Open Knowledge Foundation Finland
044 337 5439, antti.poikola A gmail.com

Posted by & filed under Tutoriaali.

1. Tutoriaalin sisältö ja vaatimukset

Vaaditut ohjelmat / työkalut

  • Microsoft Excel ohjelma asennettuna

Sisältö tiivistetysti

  • Tilastokeskuksen aineiston lataaminen Exceliin
  • Isojen taulukoiden manipulointi mm. “täyttökahva”
  • Muutama hyödyllinen funktio (concatenate ja vlookup)
  • Pivot -taulukko

Muuta

1. Taulukkolaskenta

2. Haaste: Paljonko nyt ehdolla olevat saivat ääniä 2008 vaaleissa?

2. Haaste: Kuinka paljon nyt ehdolla olevat ehdokkaat saivat 2008 vaaleissa?

3. Vuoden 2008 ehdokasdata

 

Huom. vuoden 2008 tiedosto sisältää myös kaikki vaalitulokset äänestysalueen tarkkuudella, mutta tähän tutoriaaliin riittää kuntakohtainen data, jonka lataustiedosto on huomattavasti pienempi


3. Vuoden 2008 ehdokasdata

4. Datan avaaminen Exceliin

 

  • Avaa ladattu CSV -tiedosto Excelissä
  • Tallenna tiedosto uudelleen Excel -muotoon
4. Datan avaaminen Exceliin

5. Työstövaiheet Excelissä 1.

 

Ennen datan muokkaamista on hyvä käytäntö ottaa kopio alkuperäisestä datasta, sen voi jättää samaan Excel-tiedostoon omalle välilehdelleen

  • Anna ensimmäisen välilehden nimeksi ”Alkuperäinen 2008”
  • Tee välilehdestä kopio ja nimeä se ”Muokattu 2008”
5. Työstövaiheet Excelissä 1.

6. Työstövaiheet Excelissä 2.

 

Mene ”Muokattu 2008” välilehdelle ja tee seuraavat työstövaiheet:

  • Lisää tyhjiä sarakkeita ehdokassarakkeen ja äänestysaluesarakkeen väliin (2 kpl.)
  • Valitse sarake A kokonaan ja klikkaa ”text to columns” -työkalua
  • Laita sieltä ”/” merkki erottimeksi
6. Työstövaiheet Excelissä 2.

7. Vuoden 2012 Ehdokasdata

 

  • Hae vuoden 2012 ehdokasdata osoitteesta http://fi.thedatahub.org/dataset/municipal-elections-candidates-in-finland-2012
  • Avaa CSV –tiedosto Excelissä
  • Klikkaa oikeassa data-alueen vasemmassa ylänurkassa hiiren oikealla näppäimellä ja kopioi koko data leikepöydälle
  • Menen aikaisempaan Excel –tiedostoon (jossa on jo vuoden 2008 data) tyhjälle välilehdelle ensimmäiseen soluun ja liitä (ctrl+v) data sinne
  • Nimeä välilehti ”Alkuperäinen 2012” ja tee siitä kopio ”Muokattu 2012”
  • Lisää ”Muokattu 2012” kaksi uutta saraketta ja nimeä ne: Äänimäärä 2008 ja Ehdokas
7. Vuoden 2012 Ehdokasdata

8. Concatenate –funktio

 

Tavoitteena on saada ”Muokattu 2012” välilehden ehdokas –sarakkeeseen vastaava Sukunimi Etunimi –muotoinen tieto, joka löytyy ”Muokattu 2008” välilehden ehdokassarakkeesta, jotta näitä kahta voitaisiin vertailla.

  • Mene ehdokassarakkeen ensimmäiseen soluun
  • Klikkaa Funktiotyökalun kuvaketta fx
  • Valitse kategoriasta tekstifunktiot CONCATENATE –niminen funktio ja klikkaa OK
  • Valitse Text1 –kenttä ja etsi taulukosta Sukunimisarakkeen ensimmäinen solu
  • Valitse Text2 –kenttä ja laita siihen lainausmerkeissä oleva välilyönti ” ” (tämä tekee Etunimen ja sukunimen väliin välilyönnin)
  • Valitse Text3 –kenttä ja etsi taulukosta Etunimisarakkeen ensimmäinen solu
  • Klikkaa OK
8. Concatenate –funktio

9. Täyttökahva

 

  • Kaksoisklikkaa ehdokassarakkeen ensimmäisen solun alakulmassa olevaa mustaa pistettä (niin sanottu täyttökahva)
  • Edellisessä vaiheessa tehty Concatenate –funktio kopioituu kaikkii alempiin soluihin
9. Täyttökahva

10. Vlookup –funktio

 

Tavoitteena on saada ”Muokattu 2012” välilehden Äänimäärä 2008 –sarakkeeseen kopioitua niiden ehdokkaiden, jotka olivat myös 2008 vaaleissa ehdolla edellisten vaalien äänimäärät, tämä tietohan löytyy ”Muokattu 2008” välilehdeltä.

  • Mene Äänimäärä 2008 -sarakkeen ensimmäiseen soluun
  • Klikkaa Funktiotyökalun kuvaketta fx
  • Valitse kategoriasta ”Lookup & Reference” VLOOKUP –niminen funktio ja klikkaa OK
  • Valitse Lookup_value –kenttä ja etsi taulukosta Ehdokassarakkeen ensimmäinen solu (tämän nimistä vuonna 2012 ehdolla olevaa ihmistä etsimme siis vuoden 2008 ehdokastiedoista)
  • Valitse Table_array –kenttä, mene ”Muokattu 2008 välilehdelle ja maallaa koko data –alue (tähän on olemassa näppärät näppäinkomennot), klikkaa vielä F4 –näppäintä, jolloin valittu alue lukittuu (funktioon ilmestyy $-merkkejä)
  • Valitse Col_index_num –kenttä ja laita siihen 5 (”Muokattu 2008” välilehdellä ehdokkaiden saama äänimäärä löytyy järjestyksessä viidennestä sarakkeesta)
  • Valitse Range_lookup –kenttä ja laita siihen 0 (tämä tarkoittaa, että nimen on oltava kahdessa taulukossa täsmälleen sama, arvolla 1 funktio löytäisi aakkosissa lähimpänä olevan ehdokkaan)
  • Klikkaa OK
  • Tee edellisestä kohdasta tuttu täyttökahvakikka
10. Vlookup –funktio

11. Taulukon järjestäminen vuoden 2008 äänimäärän perusteella

 

  • Valitse ”Sort” –työkalu
  • Klikkaa ruutuun ”My data has headers”
  • Valitse Sort by Äänimäärä 2008
  • Klikkaa OK

Tämä ei ole mikään grande finale tälle tutoriaalille, mielenkiintoisia asioita saa, jos Vlookupilla hakee esim. ehdokkaiden puolueita edellisisä vaaleissa ja vertaa nykypuolueeseen, onko ollut loikkareita? Tai myöskin ottamalla mukaan 2004 äänimäärät, niin voi katsoa, ketkä ovat olleet nosteessa ja ketkä suurimpia pudottajia.

11. Taulukon järjestäminen vuoden 2008 äänimäärän perusteella

Posted by & filed under Tutoriaali.

1. Tutoriaalin sisältö ja vaatimukset

 

Haluatko printata tutoriaalin tai ladata alkuperäisen kalvoesityksen?

Vaaditut ohjelmat / työkalut

Sisältö tiivistetysti

  • Miten siivotaan Oikeusministerion ehdokasdatan sarake, jossa on ehdokkaiden itse ilmoittama arvo/ammatti/asema -tieto?
  • Datan tuominen Google refineen
  • Facet text facet
  • Samankaltaisten klusterointi ja yhdistäminen
  • Edit cells / split multi-valued cells
  • Datan vieminen Refinesta exceliin

Tutoriaalissa käytettävä data

 

1. Datan siivousta tehokkaasti - Google Refine

2. Haaste: Mitkä ovat yleisimpiä ammatteja eduskuntavaaliehdokkaiden joukossa?

 

Tällaisen kuvaajan datasta saa melko helposti tehtyä Excelin Pivot taulukko työkalua hyödyntämällä, kun ensin on siivonnut datan Google Refinella – tässä tutoriaalissa keskitytään datan siivoamiseen.

17. Kymmenen yleisintä ammattia puolueittain

3. Datan hakeminen

 

Lataa data osoitteesta http://192.49.229.35/E2011/s/ehd_listat/kokomaa.htm
Suora linkki taulukkoon on http://192.49.229.35/E2011/s/ehd_listat/e2011ehd.xls

3. Data Vaalit.fi -sivustolta

 


4. Uusi Refine -projekti I

 

Käynnistä Google Refine koneelta, selaimeen avautuu ikkuna, lataaehdokastaulukko koneelta Refineen.

4. Uuden ”Refine Projektin” luominen

 

5. Uusi Refine -projekti II

Anna Projektille nimi, automaattiehdotuksena on Refineen ladatun tiedoston nimi.

5. Projektin nimeäminen

6. Dataan tutustuminen I

 

Klikkaa ”vaalipiiri” -sarakkeen pientä nuolta, valitse Facet ja Textfacet

6. Dataan tutustuminen

7. Dataan tutustuminen II

 

Vasempaan palkkiin avautuu ikkuna, jossa on vaalipiirit ja niiden ehdokasmäärät,klikkaa ”count”, jolloin ne järjestyvät ehdokasmäärien mukaiseen järjestykseen.

7. Vaalipiirien ehdokasmäärät

8. Pilkulla erotellut omille riveilleen

 

Valitse ”ammatti” sarakkeen nuolivalikosta ”Edit Cells” ja ”Split multi-valued cells…”. Sen jälkeen aukeaa ruutu, jossa kysytään erotinmerkkiä – pilkku onvalmiiksi paikallaan, klikkaa OK

8. Pilkulla erotellut ammatit omille riveilleen

9. ”Textfacet” ammateille

 

Toista aiempi ”Dataan tutustuminen” kalvon Textfacet -toiminto tällä kertaa ”Ammatti” -sarakkeelle. Vasemmalle avautuvasta palkista klikkaa ”Cluster”-painiketta.

9. ”Textfacet” ammateille

10. Ammattien yhdistäminen I

 

Cluster -toiminto ehdottaa, että esim. sosionomi (AMK) on sama asia, kuinsosionomi (amk). Hyväksy ehdotukset ”Select All” ja yhdistä ”Merge seleced & Re-Cluster”

10. Eri tavoin kirjoitettujen ammattinimikkeiden yhdistäminen

11. Ammattien yhdistäminen II

 

Cluster -toiminnon aiempi ”key collision” metodi ei löydä enempää samankaltaisuuksia, vaihda ”Method” pudotusvalikosta ”nearest neighbor”-metodiin.

11. Eri tavoin kirjoitettujen ammattinimikkeiden yhdistäminen

12. Ammattien yhdistäminen III

 

Metodi löytää samankaltaisuuksia. Tarkista ehdotukset (kaikki eivät välttämättä oleoikein esim. lehtori ja rehtori), hyväksy ne ja yhdistä. Tämän jälkeen voit vieläkokeilla ”Radius” -arvon muuttamista 2.0:aan, jolloin löytyy vielä lisää.

12. Eri tavoin kirjoitettujen ammattinimikkeiden yhdistäminen

13. Ammattien lukumäärät tekstinä ulos

 

Tee uudelleen Textfacet ammatti -sarakkeelle ja klikkaa ”choises” -linkkiä. Viereenaukeaa tekstinä ammatit ja niiden perässä lukumäärät, tämän voi kopioida ja liittää esim. Exceliin.

13. Ammattien lukumäärät tekstinä ulos

14. Tyhjien solujen täyttö

 

Valitse ”puolueen lhenne” -sarakkeen nuolivalikosta ”Edit cells” ja ”Fill down”.
Puolueen lyhenne täytetään niillekin riveille, joista se puuttui.

14. Tyhjien solujen täyttö

15. Tallentaminen I

 

Keltaisella pohjalla näkyy, että edellinen ”Fill down” operaatio muutti 1288 solunsisältöä. Klikkaa oikealta ylhäältä ”Export” ja pudotusvalikosta ”Custom tabular exporter…”

15. Tiedon tallentaminen Excel-muotoon

16. Tallentaminen II

 

Valitse sarakkeet, joidenka tiedot haluat Exceliin esim. vain ammatti ja puolueen lyhenne, klikkaa ”Download” välilehteä ylhäältä, valitse tallennusmuodoksi ”Excel” ja klikkaa ”Download” -nappia

16. Tiedon tallentaminen Excel-muotoon

Posted by & filed under Datavaalit.

 

Kunnallisvaalit lähestyvät, ehdokkaita vaaleissa on 37111, Hesari avasi jo vaalikoneensa vastaukset avoimena datana ja myös Yle on avaamassa vaalikonedataa kuulemma sekä CSV:nä, että API:n kautta. Edellisten vaalien tulostiedot löytyvät datana, ehdokkaiden facebook- ja twitterprofiileista saa ehdokkaiden ajatuksia datana…

Datavaalit.fi on avoimen lähdekoodin ja avoimen demokratian hanke, jossa joukkovoimalla tuodaan kaikkea vaaleihin liittyvää dataa yhteen ja tarjotaan sitä edelleen helppokäyttöisten rajapintojen kautta.

Sunnuntaina 7.10.2012 tasan kolme viikkoa ennen vaaleja klo 14 alkaen järjestetään koko Suomen laajuinen virtuaalinen Datavaalit ohjelmointisessio. Fyysisiä tapaamisia järjestetään ainakin Helsingissä ja Jyväskylässä, voit myös järjestää oman omalla paikkakunnallasi, jos haluat. Katso tapahtuman Facebook-kutsu.

 


Mitä vaalidataa on tällä hetkellä saatavilla?

Kaikkia alla olevia datasettejä ei ole vielä viety Datavaali.fi -tietokantaan, josta ne saa REST -rajapinnan kautta, mutta dataa siivotaan koko ajan lisää ja viedään kantaan lisää, tämä on päivittyvä tilanne. Jos löydät tai tiedät muita kiinnostavia vaalidata-aineistoja, vinkkaathan niistä kommenttien kautta. Datasetit, jotka on merkitty [Data Hub -linkillä löytyvät jo Data Hub Suomi -palvelusta löytyvästä Datavaalit katalogista, loputkin on tarkoitus siirtää sinne.

 

Ehdokastiedot ja vaalitulosdata:

Nykyisiin luottamushenkilöihin liittyvää dataa:

Vaalikonedataa:

Kuntiin ja vaaleihin liittyvää perusdataa:

Kuntiin liittyviä tilastoja:

Kuntien talousdataa:

Budjettidatassa kannattaisi varmaankin käyttää open-spending-yhteensopivia datamuotoja.

Paikkatietoja:

Datavaalit group Arcgis.comissa:

Vaalirahoitusdataa:

Kuntien asianhallinta / päätöksentekodataa:

Muuta:

 

Mitä voisi koodata?

Alla on mielen virkistämiseksi joitain pohjaideoita, mitä on esitetty, lisää syntyy varmasti datoja pyöritellessä ja idealistaa päivitetään tänne – jos sinulle tulee ideoita mieleen, niin vinkkaa niistä blogin kommenttiosiossa.

Idea – ehdokkaiden Facebookfiidien agregaattori: Vaalikonedatoissa on kerättynä ehdokkaiden Facebookprofiilit, kaivetaan Facebook API:n kautta tietoja, mitä profiileista saadaan (esim. tykkääjien määrä, id-numero jne.). Facebookista saa profiili ID:n perusteella generoitua RSS-syötteet, jotka tarjoavat ehdokkaiden postaukset ulkomaailmalle. Ehdokkaiden RSS-syötteistä voisi tehdä agregaattisivun, joka mahdollistaisi oman kunnan poliitikkojen tai tietyn puolueen poliitikkojen seuraamisen yhdellä silmäyksellä. Konsepti on tuttu vanhasta, mutta legendaarisesta http://edustajamme.fi/ -palvelusta. Viestivirtaa voi myös analysoida, esim. ehdokkaiden aktiivisuutta, mitkä aiheet kiinnostavat ketäkin, mitä linkkejä jaetaan eniten jne.

Idea – vaalikonedatan analyysit: Samaan tapaan, kuin eduskuntavaalien alla syntyi vaalikoneista paljon erilaisia analyyseja.

Idea – vaalitulosvisualisoinnit etukäteen: Aikaisempien vuosien vaalituslosdatoja voi käyttää vaalitulosvisualisointien tekemiseen siten, että heti, kun uudet tulosdatat on valmiina toimii visualisointi niillä.

Idea – ehdokasdatan analyysit: Paljonko on ollut loikkareita missäkin puolueessa, mitkä ovat yleisimmät ehdokkaiden ammatit, kuinka suuri osa istuvista valtuutetuista on ehdolla, kuinka suuri osa osuuskauppojen edustajistojen jäsenistä on ehdolla…

Idea – luottamushenkilörekisterin analyysit: Kuinka suuri osa ehdokkaista on jo jossain luottamustoimessa esim lautakunnassa tms. (Jyväskylästä on kattava luottamushenkilörekisteri, muista kunnista voidaan saada pyytämällä)


Kiinnostavia datoja yhdistämällä äänimäärätilastoja ja luottamustoimirekisteriä päättyvältä vaalikaudelta:

Demokraattinen refleksiivisyys luottamustehtävissä: Lautakuntapaikat jaetaan puolueiden äänimäärien suhteessa, mutta puolueet jakavat paikat itse omille ehdokkailleen ja muille aktiiveille. Kiinnostavaa olisi ryhmitellä lautakuntien ja jaostojen jäsenten ja varajäsenten vaaleissa saamat äänet ryhmiteltynä puolueittain. Jos puolueella on pieni luku tässä vertailussa, se voi tarkoittaa, että äänestämällä ei voi vaikuttaa luottamushenkilöihin. Toisaalta puolueissa katsotaan myös että tyyppi on kartalla eikä vaan saanut ääniä, joten näissä voi löytyä myös kiinnostavia ihmisiä, jotka tekevät tärkeätä työtä “kulisseissa” eivätkä näy vaaleissa. Journalistit voivat sitten haastatella näitä tilastopoikkeuksia ja kysyä, että millä meriiteillä istutaan lautakunnissa.

Demokraattinen refleksiivisyys kunnittain: Ylläoleva data ryhmiteltynä puolueiden sijaan kunnittain ja suhteutettuna äänioikeutettujen määrään kunnassa.

Demokraattinen refleksiivisyys valtuustokauden aikana: Kuinka ylläoleva data muuttuu valtuustokauden aikana. Lasketaan sama luku ajan suhteen siten, että aloitetaan valtuustokauden alusta ja edetään esim kuukausittain kohti seuraavia vaaleja ja lasketaan jokaiselle puolueelle vertailuluku. Tämä datasetti paljastaisi sen, jos puolue nimeää vaalien jälkeen ihmiset lautakuntiin äänimäärien mukaan mutta myöhemmissä nimeämisessään lipsuisi käytännöstä ja rupeaa nimeämään ihmisiä “listan ohi”. Käytännössä puolueiden käyristä tulee laskevia, koska luottamushenkilöitä muuttaa muille paikkakunnille. Mutta kiinnostavaa olisi, onko puolueet tässä erilaisia

Lautakunnat sisäänheittäjinä: Tulevatko valtuustokauden aikana lautakuntiin nimetyt ihmiset ehdolle seuraaviin vaaleihin. Jos tulevat, niin se voidaan nähdä “sisäänheittona”, eli henkilö kiinnostuu poliittisesta toiminnasta. Mikäli ei, henkilöä pitäisi tutkia tarkemmin, että miksi hän ei halua asettua ehdolle, vaan toimii “kulisseissa”.

 

 

 

 

Miten homma hoituu, missä keskustellaan?

Posted by & filed under Datavaalit.

”Moni uuden demokratian innostavimmista hankkeista perustuu avoimeen dataan. Usein tarvittava tieto on jo nyt olemassa, mutta se on hajallaan erilaisissa järjestelmissä, hankalasti saatavilla ja käyttökelvottomassa muodossa. Uuden demokratian luominen edellyttää siis demokratiasovelluksiin sopivaa tietopohjaa, jonka luomiseksi kiinnostava ajatus on Datavaalit -hanke, jossa erilaisilta julkishallinnon verkkosivuilta etsitään ja koneluetaan aineistoa demokratiahankkeissa hyödynnettäväksi.”

Sitra Uusi Demokratia -yhteenveto

 

Kaikille avoin Datavaalit -tempaus järjestetään 12.6.2012 klo 14-16 YLEn tiloissa Pasilassa. Jo pidemmän aikaa kypsytelty Datavaalit -hanke on pyörähtämässä nyt toden teolla käyntiin, kun rahoitus tarvittavan teknisen infrastrukruurin toteuttamiseen on varmistunut. Tempauksen tavoitteena on tuottaa toteuttamiskelpoinen toimintasuunnitelma siitä, miten Datavaalit kehittäjäyhteisöä kootaan, millainen pitäisi olla Datavaalit -sivuston ja sen taustalla olevan teknisen infran ja miten mediayhteistyö toteutetaan kesän ja tulevan syksyn aikana. Suunnitelmaa muokataan kädet savessa -meinigillä kolmessa rinnakkaisessa minityöpajassa, jotka rakentuvat edellisen Lasipalatsin tapaamisen keskusteluiden päälle. Ei ole kuitenkaan edellytys, että olisi osallistunut aiemmin, vaan nyt voi hypätä varsin hyvin mukaan.

 

Tarkemmat tiedot tempauksesta ja ilmoittautuminen oheisen linkin kautta: http://nettikansa.muistio.tieke.fi/datavaalit

Liittykää mysö Datavaalit keskusteluryhmään Facebookissa http://www.facebook.com/groups/218225958295625/

 

Tempauksen fasilitaattoreina toimivat:

 

 

Mitä on jo tehty?
Maaliskuun lopussa järjestettiin ensimmäinen Datavaalit -tapaaminen, jossa kirkastettiin hankkeen tavoitteita, hahmoteltiin tarvittavaa teknistä infraa ja päivitettiin kiinnostavien datasettien ja datalähteiden listoja. Vision kirkastamisen myötä Datavaalit -hankkeen tukemiseen haettiin Sitran Uusi Demokratia -foorumin kiihdyttämisrahaa. Teemo Tebest kävi pitchaamassa hankeidean Sitran osallistuvan budjetoinnin tilaisuudessa. Toukokuun lopussa saatiin hyviä uutisia, Datavaalit -hankkeen tekninen infra voidaan toteuttaa laadukkaasti Sitran tukemana.

Datavaalit oli myös toukokuussa järjestetyn HSopen -tapahtuman teemana. Sitä varten kerättiin ja julkaistiin koko joukko kuntiin ja vaaleihin liittyvää dataa. Tapahtumassa mysö lanseerattiin Datavaalit -facebookryhmä, joka toimii hankkeesta kiinnostuneiden keskustelukanavana (ainakin toistaiseksi). 

Mediayhteistyön suuntaviivat ovat selkiytyneet, Datavaalit -hankkeen puitteissa tarjotaan partnerimedioille vaalidatan käsittelyyn keskittyvää datajournalismin koulutusta. Tällä hetkellä datajournalismin koulutuskysyntä on kasvussa, mutta tarjontaa ei ole kovinkaan paljoa.