Tutoriaaleja
- 1# Taulukkolaskenta – perustyökalu datan käsittelyyn
- 2# Pienet aputyökalut – verkkoselain pintaa syvemmältä (vanhentunut tutoriaali)
- 3# Karttavisualisointeja ilman ohjelmointia – Google Fusion Tables 1
- 4# Datan siivousta tehokkaasti – Google Refine
- 5# Datajournalistin ajattelutapa (Simon Rogersin videoluento)
- 6# Karttavisualisointeja ilman ohjelmointia – Google Fusion Tables 2
- 7# Karttavisualisointeja ilman ohjelmointia – Google Fusion Tables 3 (vanhentunut tutoriaali)
- 8# Google Refine poimi alle 30_vuotiaat ehdokkaat (Videotutoriaali)
- 9# Vaalidataa tilastokeskuksesta Google taulukkoon
- 10# Pivot ison datan käsittelyyn Excel (MOT -data)
- 11# Kotitalousvähennys kunnittain per capita
Luentomateriaaleja
- A# Johdattelua datajournalismiin
- B# Mistä dataa saa?
- C# Mistä liikkeelle?
- Erilaisia tutoriaaleihin ja luentomateriaaleihin liittyviä linkkejä ja keskustelua
Kaikki Datajournalismi.fi -tutoriaalit ja luentomateriaalit on lisensoitu uudelleenkäytön ja muokkauksen sallivalla avoimella Creative Commons Nimeä 3.0 -lisenssillä. Alkuperäisenä tekijänä pyydetään ilmoittamaan Datajournalismi.fi
1# Taulukkolaskenta – perustyökalu datan käsittelyyn
Excelin käyttöä oppii tehokkaimmin Exceliä käyttämällä! Tutoriaali on Excel-tiedosto (työkirja), jonka voi ladata omalle koneelle. Opiskele asioita työkirjan taulukoiden (välilehtien) mukaisessa järjestyksessä, kokeile opiskeltavia asioita ja tee harjoitukset. Voit vaihtaa taulukkoa napsauttamalla taulukon alareunan taulukonvalitsinta (Etusivu, 1 Yleistä, jne.). Tämä tutoriaali lähtee liikkeelle Excelin perusteista, mutta kokeneempikin käyttäjä oppii todennäköisesti jotain uutta.
Tutoriaalissa käytetään suomenkielisen Excelin (2007) funkitonimiä ja Windowsissa toimivia näppäinkomentoja, mikäli teet tutoriaalia muun kielisellä tai eri vuosimallin Excelillä tai Macilla voi jotkut asiat olle hieman tutoriaalista poikkeavia. Opiskelupaketin on koonnut Harri Juutilainen (STT-Lehtikuva) ja se perustuu Aki Taanilan (Haaga-Helia) materiaaliin.
Linkki tutoriaaliin:
- Lataa tutoriaali Excel-muodossa (päivitetty 12.3.2013)
Sisältö tiivistetysti
- Siirtäminen ja kopiointi, sarakeleveydet
- Sarjat
- Sarjat
- Rivien ja sarakkeiden lisääminen
- Solujen muotoilu
- Automaattinen summa
- Kaavat
- Kaavojen kopiointi ja soluviittausten lukitseminen ($-kikka)
- Funktiot
- Lajittelu
- Lisää kaavojen kopiointia
Vaaditut ohjelmat / työkalut
- Microsoft Excel ohjelma asennettuna
Muuta
- Jyväskylän yliopiston avoin taulukkolaskentakokonaisuus
- Mikä on Excelin “täyttökahva”?
2# Pienet aputyökalut – verkkoselain pintaa syvemmältä
Haaste: Miten kopioidaan valtuutettujen sähköpostiosoitteet kätevästi kaupungin verkkosivulta?
Haluatko printata tutoriaalin tai ladata alkuperäisen kalvoesityksen?
- Lataa tutoriaali printattavassa PDF -muodossa
- Tämä sama tutoriaali Slideshare -palvelussa
Linkki tutoriaaliin: http://www.slideshare.net/apoikola/scraper-laajennuschromeen
Sisältö tiivistetysti
- Chrome Scraper “scrape similar” käyttö sivulla olevien linkkien tallentamiseen
Vaaditut ohjelmat / työkalut
- Google Chrome – selain asennettuna
- Scraper lisäosa (plugin) asennettuna Chrome selaimeen
Tutoriaalissa käytettävä data
Muuta
3# Karttavisualisointeja ilman ohjelmointia – Google Fusion Tables 1
Haaste: Miten visualisoidaan puolueen kannatus äänestysalueittain?
Haluatko printata tutoriaalin tai ladata alkuperäisen kalvoesityksen?
- Google presentation (päivitetty 28.1.2013)
- Tulostettava PDF (päivitetty 28.1.2013)
- Powerpoint (päivitetty 28.1.2013)
Sisältö tiivistetysti
- Datan vieminen Google Fusion Tablesiin
Vaaditut ohjelmat / työkalut
- Toimiva Google -tunnus (Video-opas tunnuksen luomiseen)
Tutoriaalissa käytettävä data
- Vuoden 2008 kuntavaalidata Tilastokeskuksen sivuilta
- Helsingin äänestysalueiden rajat KML-muodossa
Muuta
- Tutorial: Create an intensity map with custom boundaries
- Ohjeistus Shape -muotoisen paikkatiedon muuttamiseksi Googlen hyväksymään KML -muotoon
4# Datan siivousta tehokkaasti – Google Refine
Haaste: Mitkä ovat yleisimpiä ammatteja eduskuntavaaliehdokkaiden joukossa?
Haluatko printata tutoriaalin tai ladata alkuperäisen kalvoesityksen?
- Google presentation (päivitetty 28.1.2013)
- Tulostettava PDF (päivitetty 28.1.2013)
- Powerpoint (päivitetty 28.1.2013)
Vaaditut ohjelmat / työkalut
- Google Refine -ohjelma asennettuna (englanninkieliset asennusohjeet täällä)
Sisältö tiivistetysti
- Miten siivotaan Oikeusministerion ehdokasdatan sarake, jossa on ehdokkaiden itse ilmoittama arvo/ammatti/asema -tieto?
- Datan tuominen Google refineen
- Facet text facet
- Samankaltaisten klusterointi ja yhdistäminen
- Edit cells / split multi-valued cells
- Datan vieminen Refinesta exceliin
Tutoriaalissa käytettävä data
- Eduskuntavaalien 2011 ehdokasdata Vaalit.fi -sivustolta (suora latauslinkki Excel-tiedostoon)
5# Datajournalistin ajattelutapa (Simon Rogersin videoluento)
Haaste: Miten oppisin ajattelemaan artikkeleita tai uutisia “datajournalistisesti”?
Katso alla oleva Guardianin Simon Rogersin videoluento. Kiinnitä erityisesti huomiota tapaan, jolla Guardianin datablogi työstää ajankohtaisia uutisaiheita datatajournalistisesti esittämällä kysymyksen “Mitä dataa tämän uutisen takana on?”. Samalla tavalla omaa datavainua voi kehittää uutisia lukemalla ja katsomalla ja pohtimalla, mihin dataan uutinen pohjautuu tai olisiko olemassa jotain dataa, millä kyseistä uutista tai aihetta voisi syventää. Nykyisin mediassa ei ole tapana useinkaan käyttää lähdeviitteitä, mutta monessa tapauksessa tausta-aineisto on saatavissa esimerkiksi jostain julkisesta lähteestä.
Sisältö tiivistetysti
- Tutoriaali ohjaa ajattelemaan datajournalistin lailla – mitä dataa tämän uutisen takana on?
Vaaditut ohjelmat / työkalut
- Ei edellytä ohjelmia, eikä työkaluja – kynä ja paperi riittää.
Tutoriaalissa käytettävät lähteet
6# Karttavisualisointeja ilman ohjelmointia – Google Fusion Tables 2
Haaste: Miten tehdään samanlainen liikenneonnettomuuskartta, joka oli Hesarissa?
Haluatko printata tutoriaalin tai ladata alkuperäisen kalvoesityksen?
- Google presentation (päivitetty 12.2.2013)
- Tulostettava PDF (päivitetty 12.2.2013)
- Powerpoint (päivitetty 12.2.2013)
Sisältö tiivistetysti
- Datan hakeminen hri.fi verkkopalvelusta
- Datan muuntaminen Google Fusion Tablesin hyväksymään KML -muotoon
- Datan vieminen Google Fusion Tablesiin
- Lämpökartta -visualisointi
Vaaditut ohjelmat / työkalut
- Toimiva Google -tunnus (Video-opas tunnuksen luomiseen)
Tutoriaalissa käytettävä data
7# Karttavisualisointeja ilman ohjelmointia – Google Fusion Tables 3
Haaste: ”Ongelmani on siis tällainen: pyöritän Excelillä kunnittain järjestettyä vaalidataa, johon olen yhdistänyt kuntien sosioekonomista tietoa, kuten työttömyysprosentin jne. Teen aiheistosta erilaisia havaintoja, kuten miten 100 köyhimmässä kunnissa on äänestetty, missä kunnissa Niinistön ja Haaviston kannatus on alle valtakunnan keskiarvon jne. Onko mahdollista saada aina valitut kunnat helposti kartalle, jossa näkyy siis vain valitut kunnat, ei tarvitse olla muuta karttatietoa? Tämä helpottaisi sekä analyysia että grafiikan tilaamista.”
Linkki tutoriaaliin: Tutoriaali Slidesharessa
Sisältö tiivistetysti
- Datan vieminen Google Fusion Tablesiin
Vaaditut ohjelmat / työkalut
- Toimiva Google -tunnus (Video-opas tunnuksen luomiseen)
Tutoriaalissa käytettävä data
8# Google Refine poimi alle 30_vuotiaat ehdokkaat (Videotutoriaali)
Haaste: Alle 30-vuotiaidenkunnallisvaaliehdokkaiden poimiminen kaikkien ehdokkaiden joukosta
- Google presentation (päivitetty 28.1.2013)
- Tulostettava PDF (päivitetty 28.1.2013)
- Powerpoint (päivitetty 28.1.2013)
- Videotutoriaali Datalysaattori.fi -sivulla
Sisältö tiivistetysti
- Etsitään kuntavaaleissa valituksi tulleet alle 30-vuotiaat Keski-Suomesta
- Apuna käytetään Google Refineä, joka on tietokoneelle asennettava ohjelma, joka pyörii kuitenkin selaimessa
- Lopputuloksena saamme Excel-tiedoston, joka sisältää tiedot ainoastaan alle 30-vuotiaista ja valituiksi tulleista
Vaaditut ohjelmat / työkalut
- Google Refine -ohjelma asennettuna (englanninkieliset asennusohjeet täällä)
Tutoriaalissa käytettävä data
- Apuna käytetään Oikeusministeriön tulospalvelusta ladattavaa dataa
9# Vaalidataa tilastokeskuksesta Google taulukkoon
Haaste: Ketkä Helsingissä kunnallisvaalieissa 2012 ehdolla olleista ovat puolueloikkareita?
Haluatko printata tutoriaalin tai ladata alkuperäisen kalvoesityksen?
- Google presentation (päivitetty 12.2.2013)
- Tulostettava PDF (päivitetty 12.2.2013)
- Powerpoint (päivitetty 12.2.2013)
Sisältö tiivistetysti
- Äänestysdatan hakeminen Tilastokeskuksen sivuilta
- Google taulukon luominen ja perusasettelu
- Uuden datan lisääminen olemassaolevaan Google -taulukkoon import -toiminnolla
- SPLIT -funktio
- VLOOKUP -funktio
Vaaditut ohjelmat / työkalut
- .Tutoriaali käyttää Google spreadsheet -ohjelmaa, Google tunnus
Muuta
Selkeyttävä video VLOOKUP -funktion toimintaperiaatteesta
10# Pivot ison datan käsittelyyn Excel (MOT -data)
Haaste: Dataa on paljon yhteensä 215 993 riviä, tämän harjoituksen tarkoituksena on ison datamassan käsittely Pivot -toiminnolla ja muuttaminen vusosittaiseen summamuotoon, joka voidaan visualisoida Google motion chart -työkalulla.
Haluatko printata tutoriaalin tai ladata alkuperäisen kalvoesityksen?
- Google presentation (päivitetty 28.1.2013)
- Tulostettava PDF (päivitetty 28.1.2013)
- Powerpoint (päivitetty 28.1.2013)
Sisältö tiivistetysti
- Pivot -työkalun käyttäminen Excelissä
- Motion chart -visualisoinnin tekeminen Google taulukosta
Vaaditut ohjelmat / työkalut
- Excel
- Google spreadsheet
11# Kotitalousvähennys kunnittain per capita
Haaste: Minkä kuntien asukkaat hyödyntävät kotitalousvähennystä enemmän? Yhdistetään dataa eri lähteistä ja lasketaan näin kotitalousvähennyksen määrä kuntalaista kohden joka kunnalle. Tehdään kuntakohtaiset erot näkyviksi kartalle.
Haluatko printata tutoriaalin tai ladata alkuperäisen kalvoesityksen?
- Google presentation (päivitetty 19.4.2013)
- Tulostettava PDF (päivitetty 19.4.2013)
- Powerpoint (päivitetty 19.4.2013)
Tutoriaalissa käytettävä data
- Kotitalousvähennykset verovuodelta 2011 alueittain (Verohallinto)
- Vuoden 2011 keskiväkiluku vuoden 2011 aluejaolla (Tilastokeskus)
- Vuoden 2011 kuntarajat (valmis KML-tiedosto, alkuperäisaineisto Maanmittauslaitos)
Muuta
Tutoriaalin tuloksena syntyy allaolevan kaltainen vuorovaikutteinen kartta, josta kuntaa klikkaamalla saa näkyviin, kuinka paljon asukasta kohden tehtiin kotitalousvähennyksiä vuonna 2011. Kunnat on värjätty kotitalousvähennyksen käytön suhteen siten, että tummemmilla alueilla vähennystä on käytetty enemmän.
A# Johdattelua datajournalismiin
Sisältö: Lyhyt johdattelu datajournalismiin: mitä uutta on datajournalismissa, millainen työprosessi siihen liittyy ja muutamia esimerkkejä. Luennon sisältöä päivitetään säännöllisesti ja sovelletaan eri kohderyhmille, täällä julkaistu versio on yleinen “peruspaketti”.
Luentokalvot
- Google presentation (päivitetty 18.2.2013)
- Tulostettava PDF (päivitetty 18.2.2013)
- Powerpoint (päivitetty 18.2.2013)
B# Mistä dataa saa?
Sisältö: Neljä datajournalistille tärkeää tapaa datan hankkimiseen – avoin data, tietopyynnöt, ruudunraaputus ja joukkoistaminen. Luennon sisältöä päivitetään säännöllisesti ja sovelletaan eri kohderyhmille, täällä julkaistu versio on yleinen “peruspaketti”.
Lyhyempi versio
- Google presentation (päivitetty 18.2.2013)
- Tulostettava PDF (päivitetty 18.2.2013)
- Powerpoint (päivitetty 18.2.2013)
Pidempi versio
- Google presentation (päivitetty 18.2.2013)
- Tulostettava PDF (päivitetty 18.2.2013)
- Powerpoint (päivitetty 18.2.2013)
C# Mistä liikkeelle?
Sisältö: Käytännön vinkkejä aloittelevalle datajournalistille.
Luentokalvot
- Google presentation (päivitetty 11.3.2013)
Datajournalismin tutoriaalien kehitystä tuetaan osaltaan Avoimuudesta Voimaa Oppimisverkostoihin projektin kautta:

