Mikko Aaltonen & Sasu Tyni

Vaikuttavuuden arviointi rikosseuraamusalalla

Kuvaamme artikkelissa lyhyesti uusintarikollisuutta koskevat perustiedot sekä rikosseuraamusalalla tehdyt kotimaiset vaikutustutkimukset. Tämän jälkeen käsittelemme laadukkaan tilastollisen vaikutustutkimuksen piirteitä mutta myös ongelmia, joiden olemassaoloon on herätty viime aikoina useilla tieteenaloilla. Esitämme lopuksi joitain näkemyksiä vaikutustutkimuksen mahdollisuuksista rikosseuraamusalalla.

Kuvio 1. Vuonna 2011 vankilasta vapautuneiden uusintarikollisuus seuraavan kolmen vuoden aikana vankilakertaisuuden mukaan.

Rikosseuraamuslaitoksen vaikuttavuuden arvioimisessa keskeisin tulosmittari on uusintarikollisuus. Rikosseuraamuslaitos on seurannut järjestelmällisesti vankien ja yhdyskuntaseuraamusasiakkaiden uusintarikollisuutta vuodesta 2005 alkaen. Tarvetta on kuitenkin nähty erilaisten toimenpidevaikutusten yksityiskohtaisemmalle tilastoinnille ja seurannalle sekä uusintarikollisuusvaikutusten arvioinnille.

Vankilassa järjestettävän toiminnan tarkoituksena on edistää vangin sijoittumista yhteiskuntaan. Vankitoiminnat koostuvat työstä, koulutuksesta, ohjelmista sekä muusta vangin valmiuksia edistävästä toiminnasta kuten arkielämän taitojen kohentamisesta. Intensiivisin kuntoutus voi tarkoittaa vankeusaikana muun muassa pitkäkestoista päihdehoitoa ja päihdekuntoutusta sekä rikostaustan perusteella kohdennettuja ohjelmia. Lyhytaikaisvangeilla korostuvat sen sijaan vapauttamisen valmisteluun liittyvät toimenpiteet esimerkiksi asunnon hankkimiseksi. Uusintarikollisuuteen vaikuttaminen voidaan nähdä myös laajempana lukuisten toimijoiden, kuten eri hallinnonalojen ja kuntien sekä järjestöjen kokonaisuutena, jolloin yksittäisten toimenpiteiden tai toimijoiden vaikutusten erittely muuttuu yhä haasteellisemmaksi.

Vaikuttavuuden käsitettä käytetään valtionhallinnossa ja julkisessa keskustelussa varsin kirjavin tavoin. Näkemyksemme mukaan arvioinnin lähtökohtana tulisi olla mahdollisimman luotettava tutkimusnäyttö toimenpiteiden vaikutuksista uusintarikollisuuteen. Tässä kirjoituksessa tarkoitamme vaikutustutkimuksella sellaista tutkimusta, jonka tavoitteena on empiirisen aineiston tilastollisen analyysin avulla osoittaa arvioinnin kohteena olevan toimenpiteen aikaansaamat muutokset niissä vastemuuttujissa, joihin toimenpiteen olisi tarkoitus vaikuttaa. Tavoitteena on siten eristää yksittäisen toimenpiteen vaikutus muista uusintarikollisuuteen vaikuttavista mekanismeista.

Uusintarikollisuus ja arviointitutkimukset Suomessa

Suomessa keskimäärin joka toinen (54 %) vanki syyllistyy uusiin rikoksiin kolmen vuoden seuranta-aikana vapautumisesta. Uusimisella tarkoitetaan tässä yhteydessä rikosta, josta seuraamuksena on yhdyskuntapalvelu tai ankarampi rangaistus. Kuviossa 1 on esitetty vuonna 2011 vapautuneiden vankien (n = 3 655) uusimisosuudet vankilakertaisuuden mukaan. Ensimmäistä kertaa vapautuneiden keskimääräinen uusimisosuus (36 %) on tunnetusti pienempi verrattuna muihin kertaisuusluokkiin.

Tutkimusten perusteella tiedetään lisäksi, että vapautuneiden vankien riski syyllistyä uusiin rikoksiin on korkein vapautumista seuraavina ensimmäisinä kuukausina. Uusijoiden ryhmässä ensimmäisen kuukauden aikana vapautumisesta noin joka kymmenes (13 %), kuuden kuukauden kuluessa noin joka viides (55 %) ja vuoden aikana jo neljä viidestä (73 %) oli tehnyt vähintään yhden vankilaan tai yhdyskuntapalveluun johtaneen rikoksen. Vapautumishetken tärkeyttä kuvaa myös se, että heti vapautumispäivänä uusiin rikoksiin syyllistyneitä oli peräti 39 henkilöä.

Vankeinhoitoon liittyvät vaikutustutkimukset ovat olleet tähän mennessä harvalukuisia. Esimerkkeinä näistä voidaan mainita muun muassa Cognitive Skills -ohjelman ja seksuaalirikollisille suunnatun STOP-ohjelman uusintarikollisuusvaikutuksia selvittävät tutkimukset. (Tyni 2015.) Tällä hetkellä käynnissä on muun muassa OMA-ohjelman ja vankien koulutuksen uusintarikollisuusvaikutusten arviointi sekä vankien asunnottomuutta vähentämään pyrkivän ohjelman (osana Aune-hanketta) vaikutusarviointi.

Tarvitaan tietoa verrokkiryhmän uusintarikollisuudesta

Tilastollisen vaikuttavuusarvioinnin paras muoto on satunnaistettu kontrolloitu tutkimus, jossa kuntoutusohjelmaan osallistuva koeryhmä ja tämän verrokkiryhmä – joka voi osallistua toiseen kuntoutukseen tai jäädä kokonaan kuntoutuksen ulkopuolelle – arvotaan esimerkiksi kaikkien niiden joukosta, jotka ovat halukkaita tai kelpoisia osallistumaan arvioitavana olevaan toimenpiteeseen. Satunnaistamisella tavoitellaan lähtötilannetta, jossa koe- ja verrokkiryhmät ovat ominaisuuksiltaan keskimäärin samanlaisia lähtötilanteessa. Kun tämä saavutetaan, kertoo koe- ja verrokkiryhmien ero uusintarikollisuudessa ohjelman kausaalisen vaikutuksen. Käytännössä monenlaiset häiriötekijät voivat vaikuttaa myös satunnaistetun kokeen luotettavuuteen ja tulosten yleistettävyyteen (Deaton & Cartwright 2016), mutta periaatteellisella tasolla asetelmalla on kiistattomat etunsa.

Entä jos satunnaistaminen ei ole mahdollista? Kokeellisen tutkimuksen sijaan tällöin käännytään havainnoivan tutkimuksen puoleen ja tutkitaan koeryhmänä sitä joukkoa ihmisiä, joka osallistui jonakin ajanjaksona tiettyyn kuntoutukseen. Tämän ryhmän uusintarikollisuutta voidaan sitten verrata toiseen, mahdollisimman vertailukelpoiseen vankien ryhmään. Se, kuinka luotettavasti tällainen tutkimus voi kertoa kuntoutuksen kausaalivaikutuksesta, riippuu siitä, kuinka hyvin verrokkiryhmä onnistutaan muodostamaan.

Suomalaisten rekisteriaineistojen avulla voidaan nykypäivänä kohtalaisen helposti löytää ohjelmiin osallistuneille verrokkiryhmä, joka vastaa koeryhmää esimerkiksi iän, sukupuolen ja rikostaustan perusteella. Tällainen mitattujen ominaisuuksien perusteella tehtävä tilastollinen kaltaistus häviää satunnaistamiselle siinä, ettei se takaa koe- ja verrokkiryhmien samankaltaisuutta havaitsemattomien muuttujien suhteen. Yksi arviointeja vaikeuttava, hankalasti mitattava muuttuja on motivaatio tai halukkuus muutokseen. Kun kuntoutukseen osallistuminen on tyypillisesti vapaaehtoista, saatamme tällaisessa arvioinnissa päätyäkin tahtomattamme mittamaan motivaatioerojen vaikutusta kuntoutuksen vaikutuksen sijaan (Bushway & Apel 2012). Toinen ongelma on se, että vankeuden aikana osallistutaan tyypillisesti useampaan eri interventioon, ja näiden vaikutusten erottelu voi olla mahdotonta.

Positiivista on se, että menetelmällisen kehityksen myötä havainnoivia asetelmia on opittu hyödyntämään paremmin kausaalipäättelyn keinona. Pohjoismaissa on viime vuosina tutkittu muun muassa sähköisen valvonnan ja yhdyskuntapalvelun suorittamisen (vs. vankeus) vaikutuksia uusintarikollisuuteen ja työssäkäyntiin hyödyntämällä lainsäädännön muutosten luomia luonnollisia koeasetelmia (Andersen & Andersen 2014; Skardhamar 2013a, 2013b). "Historiallisten kontrolliryhmien" muodostaminen on helpompaa, jos valikoitumismekanismit tunnetaan. Näin on esimerkiksi silloin, kun uutta rikosseuraamusta käytetään tarkkaan rajatulle joukolle rikoksentekijöitä. Tällöin voimme poimia verrokkiryhmän ajalta ennen uuden rikosseuraamuksen käyttöönottoa, ja identifioida ne henkilöt, jotka olisivat uuden käytännön myötä päätyneet uuden seuraamuksen piiriin mutta vanhassa käytännössä päätyivät muualle.

Vaikutustutkimuksen sudenkuopat

Eräs kysymys, johon onnistuneenkin vaikutustutkimuksen tehnyt tutkija törmää, liittyy mekanismeihin. Tyypillisesti pelkkä tieto siitä, että kuntoutuksen läpikäyneet henkilöt uusivat rikoksia harvemmin, ei riitä, vaan lisäksi halutaan tietoa siitä, miksi juuri tämä kuntoutus toimii. Satunnaistettu koe on luonteeltaan "musta laatikko", eikä siten lähtökohtaisesti kerro sitä, miksi ohjelma toimi tai ei toiminut (Bullock, Green & Ha 2010). Tilastollista vaikutusarviointia voikin täydentää esimerkiksi haastattelututkimuksella, jossa pyritään selvittämään vaikuttavia mekanismeja. Laadullisen tutkimuksen keinoin voidaan myös selvittää implementaation onnistumista – on mahdollista, että vaikuttavuuden puute liittyykin intervention käytännön toteuttamisen ongelmiin, ei interventioon itseensä.

Erityisen kiinnostavaa, mutta myös monin tavoin huolestuttavaa keskustelua on käyty niin sanotun replikaatiokriisin ympärillä. Ongelmaan herättiin viimeistään elokuussa 2015, kun Science-lehdessä julkaistiin laajamittainen tutkimus, joka toisti 100 psykologian alan johtavien lehtien julkaisemaa tutkimusta (Open Science Collaboration 2015). Päähavaintona oli, että vaikutusestimaatit olivat keskimäärin noin puolet alkuperäisiä pienempiä, ja enää alle puolet tutkimuksista löysi tilastollisesti merkitsevän yhteyden. Vastaavia havaintoja on tehty myös muilla tieteenaloilla.

Replikaatiokriisin kaikkia syitä ja implikaatioita ei ole mahdollista käsitellä tämän artikkelin puitteissa, mutta yksi keskeinen ylisuuria vaikutusestimaatteja tuottava mekanismi on suhteellisen varmasti julkaisuharha. Tutkimuksen julkaisukelpoisuuden kriteerinä on valitettavan usein "positiivinen" löydös, ja nollatuloksia on vaikea saada julkaistuksi, vaikka tutkimus itsessään täyttäisi kaikki laatukriteerit. Koska tutkijoiden menestystä mitataan julkaisujen laadulla ja määrällä, luo tällainen tilanne helposti vääriä kannustimia. Välttämättä kyse ei kuitenkaan ole tietoisesta tulosten manipuloinnista vaan aineiston analyysivaiheessa tehdyistä valinnoista, jotka tehdään vasta sen jälkeen, kun aineisto on nähty ja perusyhteydet ovat jo tiedossa.

Edellä mainittuun "jälkikäteiseen teoretisointiin" (Kerr 1998) liittyy myös kysymys hoitovaikutusten heterogeenisyydestä. On varsin todennäköistä, että erilaiset kuntoutuksen muodot eivät toimi yhtä hyvin kaikille, joten vaikutustutkimuksessa olisi tärkeää arvioida myös sitä, kenelle kuntoutus sopii parhaiten. On kuitenkin tärkeä tiedostaa, että vaikutusten vaihtelun jälkikäteinen tarkastelu pienellä aineistolla saattaa johtaa helposti harhaan: mitä enemmän erilaisia interaktiovaikutuksia testataan, sitä todennäköisemmin vähintään yksi tilastollisesti merkitsevä yhteys löydetään, vaikka todellisuudessa mitään yhteyttä ei olisikaan olemassa. Sama pätee myös tarkasteltujen vastemuuttujien määrään.

Raportoinnin läpinäkyvyyteen tulee panostaa enemmän

Kuinka sitten tehdä hyvää tilastollista arviointitutkimusta? Parhaat mahdollisuudet vaikutusarvioinnin onnistumiselle taataan, jos tutkijat otetaan mukaan uusien hankkeiden alusta saakka. Viimeaikaisen keskustelun valossa tärkeää olisi ainakin päättää hyvissä ajoin arvioitavista vastemuuttujista, eli niistä lopputulemista joihin kuntoutuksen pitäisi vaikuttaa, ja raportoida systemaattisesti kaikki tulokset. Sama pätee interaktiovaikutusten tarkasteluun: pitäisi ensin pohtia sitä, millaiset taustatekijät voisivat vaikuttaa kuntoutuksen sopivuuteen, ja tarkastella näitä yhdysvaikutuksia systemaattisesti. Kaiken kaikkiaan raportoinnin kynnyksen ei pitäisi riippua siitä, ovatko tulokset oletetun kaltaisia tai "tilastollisesti merkitseviä". Kriminologian historia tuntee useita esimerkkejä hyvää tarkoittavista interventioista, jotka päätyivät lisäämään niihin osallistuneiden rikollisuutta (Welsh & Rocque 2014).

Arviointitutkimuksen tilaajat ja tekijät joutuvat väistämättä pohtimaan sitä, kuinka vahvaa näyttöä ohjelmien vaikutuksista halutaan. Jos asiaa lähestyy tilastollista tutkimusta tekevän tutkijan näkökulmasta ja ottaa edellä kuvatun valikoitumisongelman vakavasti, satunnaistamisen etuja on vaikea sivuuttaa. Satunnaistaminen tulisi olla siten olla ensisijainen tavoite arviointia suunniteltaessa. Ongelma on kuitenkin se, että mikäli kelpuutamme ainoastaan vahvimmat tutkimusasetelmat, saatamme päätyä tilanteeseen, jossa minkäänlaista tilastollista tutkimusnäyttöä ei synny. Suomessa ei ole tietääksemme tehty yhtään satunnaistettua koetta vankeinhoidon piirissä, ja ylipäätään Pohjoismaissa tällaista tutkimusta on tehty kriminologiassa hyvin vähän (Hyatt & Andersen 2016). Jos nykytilanteessa näyttötason vaatimus nostetaan liian korkealle, saattaa parhaasta tulla hyvä vihollinen. Samaan aikaan tutkijoiden on kuitenkin tunnistettava havainnoivien tutkimusasetelmien rajoitteet, ja pyrkiä vaikuttamaan jo hankkeiden alusta lähtien niin, että luotettavan arvioinnin edellytykset maksimoidaan.

Tulokset tulee suhteuttaa realistisiin odotuksiin

Kaiken sen perusteella, mitä uusintarikollisuuteen vaikuttamisesta tiedetään, tulisi odotusarvon vaikutusten suuruudelle olla varsin maltillisia. Tätä päätelmää ei pidä tulkita arvosteluna kuntoutusta toteuttavien työntekijöiden ja organisaatioiden suuntaan, vaan pikemminkin lähtökohtana, joka liittyy moniongelmaisten asiakkaiden kanssa tehtävään työhön. Kun ottaa huomioon rikollisuuden aiheuttamat merkittävät yhteiskunnalliset kustannukset, pienikin todellinen vaikutus maksaa intervention kustannukset nopeasti takaisin esimerkiksi vähentyneinä vankilavuosina.

Tutkimusten menetelmällisen laadun näkökulmasta lähtökohtainen oletus suhteellisen pienistä vaikutuksista tarkoittaa puolestaan sitä, että kovin pienillä aineistoilla ei kannata lähteä tutkimusta tekemään. Tällöin mahdollinen myönteinenkin tulos jää helposti "kohinan" alle, tai pahimmassa tapauksessa kalastelevalla analyysityylillä päädytään ylioptimistisiin arvioihin toimenpiteiden tehosta, jotka eivät replikoidu uusissa tutkimuksissa.

Vaikka korkealaatuisen vaikutustutkimuksen tekeminen on monin tavoin haastava tehtävä, ei ole kuitenkaan syytä vaipua epätoivoon. Viimeaikaiset pohjoismaiset tutkimukset osoittavat sen, että osaavissa käsissä laadukkaiden rekisteriaineistojen avulla voidaan saada luotettavaa tietoa eri seuraamusvaihtoehtojen vaikutuksista. Suomessakin olisi hyvä selvittää systemaattisesti lainsäädäntöuudistusten ja muiden politiikkamuutosten kautta jo syntyneet luonnolliset koeasetelmat, ja hyödyntää näiden tarjoamat vahvat tutkimusasetelmat. Uskomme, että olemassa olevat aineistovarannot kätkevät sisäänsä vastauksia moniin kysymyksiin, joita emme ole vielä edes osanneet esittää.

Aaltonen on yliopistotutkija ja Tyni tutkijatohtori Kriminologian ja oikeuspolitiikan instituutissa Helsingin yliopistossa. Tyni toimii myös erikoistutkijana Rikosseuraamuslaitoksessa.

LÄHTEET

Andersen, Lars H. and Andersen, Signe H. (2014) Effect of Electronic Monitoring on Social Welfare Dependence. Criminology & Public Policy, 13, 349–79

Bushway, S. and Apel, R. (2012) A Signaling Perspective on Employment-based Reentry Programs, Criminology & Public Policy, 11, 21–50

Deaton, Angus & Cartwright, Nancy (2016) Understanding and misunderstanding randomized controlled trials. NBER Working Paper 22595. Cambridge, MA: National Bureau of Economic Research

Hyatt, Jordan & Andersen, Synøve (2016) Comparing the recent development of randomized trials in criminal justice in Scandinavia and the United States: A systematic review. Esitelmä Tukholman kriminologisymposiumissa, julkaisematon artikkelikäsikirjoitus

Kerr, Norbert L. (1998) HARKing: Hypothesizing After the Results are Known. Personality and Social Psychology Review, 2, 196–217

Open Science Collaboration (2015) Estimating the reproducibility of psychological science. Science, 349, 1–8

Skardhamar, Torbjørn (2013a) Straffegjennomføring med samfunnsstraff i Norge. Konsekvenser for straffedes sysselsetting. Statistics Norway Reports 13/2013. Statistics Norway

Skardhamar, Torbjørn (2013b) Straffegjennomføring med elektronisk kontroll i Norge. Konsekvenser for straffedes sysselsetting. Statistics Norway Reports 14/2013. Statistics Norway

Tyni, Sasu (2015) Vankeinhoidon vaikuttavuus. Onko kuntoutukselle tilastollisia perusteita? Rikosseuraamuslaitoksen julkaisuja 1/2015

Welsh, Brandon C. & Rocque, Michael (2014) When crime prevention harms: a review of systematic reviews. Journal of Experimental Criminology, 10, 245–266

VTV. (2016). Uusintarikollisuuden vähentäminen rangaistusaikana ja sen jälkeen. Tuloksellisuustarkastuskertomus. Valtiontalouden tarkastusviraston tarkastuskertomukset 18/2016

 
Julkaistu 10.3.2017
Sivun alkuun |