Statistikk

statistikk – fra tysk Statistik ”studiet av politiske fakta og tall”, fra nylatin statisticus ”om politikk”, fra latin status ”stat”

De fleste store (og en god del små) beslutninger tas på grunnlag av tallmaterialer som er innsamlet. I Norge finnes det mange organer som arbeider med å samle inn, analysere og presentere slike tallmaterialer. Eksempler er Statistisk sentralbyrå, Markeds- og mediainstituttet (MMI) og Teknisk beregningsutvalg (i forbindelse med lønnsoppgjør). I tillegg brukes statistikk nær sagt overalt ellers i samfunnet – forskning på medisiner, risikoanalyser i Nordsjøen osv.
Hovedproblemstillingene innen feltet kan formuleres ganske enkelt: hvordan samle inn, analysere og presentere et tallmateriale?

For en bra innledning om hva statistikk er for noe, se Matematiske Sammenhenger: Statistikk og sannsynlighetsregning kap 1. Matematikk for allmennlærerutdanningen 2 kap. 9 har også en brukbar innledning.

Litt om statistikkens historie

En av røttene til statistikken kan man finne i flommen av trykte tall på slutten av napoleonstiden. Mange slags menneskelig aktivitet, spesielt gale ting som kriminalitet og selvmord, ble telt. Det viste seg at de var oppsiktsvekkende stabile fra år til år. Ut fra denne stabiliteten fikk man ideen om at det fantes naturlover for også slike ting. Utregnede gjennomsnitt og variasjonsmål ga rom for ideen om det ”normale” menneske og dermed rom for nye måter å forsøke å modifisere uønskede klasser.
Allerede på 1800-tallet ble det samlet mengder av statistiske data for skattlegging, rekruttering til hæren og for å bestemme hvor sterk staten var. Disse dataene var strengt hemmelige – de ville være av stor interesse for fienden. Samtidig samlet amatører og akademikere en masse statistikk som ofte ble publisert men aldri systematisk samlet.

Etter napoleonskrigene etablerte de europeiske statene institusjoner for å samle og publisere statistikk om liv og administrasjon. Dette skapte en flodbølge av trykte tall fra 1820 til 1840.
Et tidlig eksempel på bruk av statistikk i medisinens tjeneste kom i rundt 1830, da Jean Civiale sammenliknet to typer operasjoner mot nyrestein ved bruk av offentlig statistikk. Han kom fram til at med den gamle metoden omkom 1024 av 5443 pasienter, mens med den nye metoden omkom kun sju av 307 (samt tre av andre årsaker). Konklusjonen om at den nye metoden derfor var overlegen den gamle, ble møtt med en viss skepsis.

Et mye senere eksempel på det samme, som kan være greit å bruke i skolen for å få fram hvor nyttig statistikken er, gjelder Florence Nightingale (1820-1910). Gjennom sitt arbeide som sykesøster i Krimkrigen mente hun å ha oppdaget at mye av årsaken til de store dødstallene var usanitære forhold. Men for å overbevise politikere og andre skulle det mer til enn et troverdig ansikt – Florence samlet inn statistikk og utviklet selv nye typer diagrammer for å få tydelig fram argumentene.
Mer avansert bruk av matematikk for å trekke slutninger ut fra statistiske materialer, kom først i gang på slutten av 1800-tallet. Sentrale figurer her er Francis Galton (1822-1911) og Karl Pearson (1857-1936).

På 1900-tallet gjorde etter hvert datamaskinene det mulig å gjøre analyser og tester som ville vært utenkelige å gjøre for hånd, enten på grunn av at formlene var for kompliserte eller fordi datasettene var for store.

Det står mye mer om statistikkens historie i boken The taming of chance av Ian Hacking, hvor mye av det ovenstående er tatt fra.

Statistikks plassering i forhold til andre fagområder

Statistikk har tilknytningspunkter til mange andre deler av matematikken.
På et nivå jobber man i statistikken med tallbehandling; sortering av tall, telling av tall, å finne det midterste tallet osv.

Når man framstiller statistikk grafisk, støtter man seg sterkt på geometrien. Videre er det forbindelser med framstilling av funksjoner grafisk (de sammenhengene man studerer ved hjelp av statistikk vil jo ofte selv være eksempler på funksjoner). På et mer avansert nivå vil man prøve å finne funksjonsuttrykk for sammenhenger man har funnet ved hjelp av statistikk.
Til algebraen er det sammenhenger blant annet ved at man framstiller de forskjellige målene (spredningsmål og sentralmål) i algebraisk språk.

Til sannsynlighetsregningen er det sammenhenger særlig i forbindelse med hypotesetesting. På sett og vis kan man si at statistikk og sannsynlighetsregning ser på de samme situasjonene fra to forskjellige synsvinkler. Hvis vi kjenner sammensetningen av en befolkning og ønsker å vite noe om hva som skjer hvis vi tar en stikkprøve, bruker vi sannsynlighetsregning. Hvis vi derimot har en stikkprøve, og ønsker å finne ut hva vi kan si om befolkningen ut fra denne stikkprøven, bruker vi statistikk.

Barns forståelse av statistikk

Clifford Konold m. fl. har sett fire forskjellige perspektiver hos barn i deres forståelse av statistikk:

  1. Data som assosiasjonsredskap. Dette innebærer at barna assosierer rundt det tallmaterialet forteller om, i steden for å konsentrere seg om selve tallmaterialet.
  2. Data som casebeskrivelse. Dette innebærer at barna ser på enkeltopplysninger i tallmaterialet - for eksempel det som angår dem selv.
  3. Data som grupperingsredskap. Dette innebærer at barna ser på de opplysningene som er mest vanlige, og ikke interesserer seg for resten av materialet.
  4. Data som en samlet gruppe observasjoner. Dette innebærer blant annet at man er opptatt av hvor store andeler de enkelte svar har av hele antallet, og at man sammenlikner undergrupper med hverandre (gutter/jenter, for eksempel).

Det er tegn til at det å skulle sammenlikne to datasett bidrar til at man beveger seg mot mer avanserte perspektiver på dataene.
For mer om dette, se epsilon s. 378-386.

Undervisningsopplegg

60-meter
Avstand til posthuset
Hverdagsstatistikk
Statistikk med mobiltelefoni
Temperaturmålinger

Litteratur

Historie: statistikk

Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-ShareAlike 3.0 License