Vurdering av statistiske analysemetoder brukt i Læringslabens undersøkelser i videregående skole i Rogaland.

Slides:



Advertisements
Liknende presentasjoner
Organisering og roller i Lp modellen PPT sine roller
Advertisements

STATISTISK KVALITETSSTYRING
Trebåt for alle.
Oppfølging og vurdering som grunnlag for læring
Statistikk på 50 5 minutter
Noen utfordringer for skolene
Fra prøving og feiling til
Rapport av markedsundersøkelse
- Avslutningsseminar prosjekt Fallende gjenstander
Tema 6 VURDERING OG DOKUMENTASJON
Forskerspiren Åpne forsøk: nye læringsmål?
Tron E. Ingebrigtsen (BSc, BEc)
Enhalet og tohalet hypotesetest
ART: Dokumentasjon av behandlingseffekt
Grunnleggende spørsmål om naturfag
STATISTISK GENERALISERING
PISA Litt om resultatene bak overskriftene - og noen fortolkninger Halden 14. februar 2008 Svein Lie ILS, Universitetet i Oslo.
Meta-analyse Frode Svartdal UiTø April 2014 © Frode Svartdal.
Forskerskoler – nøkkelen til en bedre PhD-utdanning?
Innhold Resultat fra holdningsundersøkelse om bomringen og Oslopakke PROSAM-rapport 120.
Eksperiment for TDT25 Tor Stålhane.
Fagtekst i pedagogikk Arbeidskrav
Kvalitativ metode i markedsforskning
Verktøy i arbeid med kvalitetsvurdering
Undersøkelse om studiegjennomføring og faglig og sosial tilhørighet ved UiB Torunn Valen Mikalsen, 6. november 2009 Torunn Valen Mikalsen.
Prognose av framtidig etterspørsel
Kunnskapsløftet - forskningen Organisering: prosjekter og programstyre Resultater: det store bildet Veien videre: er økt variasjon et problem?
Elevundersøkelsen 2008 Resultater Sauda Vidaregåande skule.
Lærerne og prosjektet Tilpasset norskopplæring med felles læreplan i norsk Spørreundersøkelse til lærere ved noen utvalgte skoler i Oslo høsten 2005.
SATS PÅ DE ANSATTE! LA DEM FÅ BRUKE SINE FERDIGHETER!
Utdypende om design & statistikk Frode Svartdal UiTø April 2012.
Utdypende info, design & statistikk
ANOVA: Litt om design & statistikk
Statistikk på 20 2 timer PSY-1002
Utforskeren.
Didaktiske analysekategorier
Bærekraftig utvikling - forskerspiren
HVOR VIKTIGE ER PISA- RESULTATENE? HVOR STOR VEKT SKAL VI LEGGE PÅ DEM? Jan Ubøe, professor i matematikk NHH.
Aggression Replacement Training
PROSJEKT: UADRESSERT REKLAME Omnibus: 23. august – 30 august 2006
Noen sentrale kjennetegn ved plan- og budsjettprosessen: Det ble jobbet lite med mål og strategier. Kortsiktighet, dårlig sammenheng mellom planer, budsjett.
FLiK Forskningsbasert læringsmiljøutvikling i barnehager og skoler i Kristiansand.
SINTEF-undersøkelsen om salting og trafikksikkerhet
SCIENCE SHOPS – Innlegg på studiekvalitetsdagene 6. oktober 2014 ved Anne Bregnballe, APS.
Gruppe for seponering av B-preparater
m arkedsføringshuset Birkebeinerrennet 1 Evaluering StafettBirken 2010.
Oslo kommune Kommunerevisjonen KOMMUNEREVISJONEN - INTEGRITET OG VERDISKAPING Rapport 9/2009 Avgangskarakterer i grunnskolen - Likebehandles elevene i.
Presentasjon av data: deskriptiv statistikk
Praksisseminar 31.oktober Henvendelse til praksisstedet. Taushetsløfte Praksisperioden Målsetting Formelle krav - roller Forventninger Veiledning Evaluering.
BARNAS BARNEVERN 2020.
Forskning – 3 grupper (OECD 1981) Grunnforskning Originale undersøkelser som har til hensikt å skape ny kunnskap og forståelse Karakteriseres ved at den.
Hypotesetesting, og kontinuerlige stokastiske variable
Siste forelesning er i morgen!
Lesing og lesestrategier
Ny barnehage – ny førskolelærerrolle?
Stian Grønning Master i samfunnsøkonomi Daglig leder i Recogni.
RELASJONELT PERSPEKTIV PÅ ARBEID MED PROBLEMATFERD I SKOLEN
Lekser – et viktig bidrag til elevenes læring, eller en unødvendig byrde for unge mennesker? Tom KlepakerKnut Alne, Tor Ivar Neppelberg Universitetet i.
Om å undervise, tilrettelegge veilede, kartlegge, teste, prøve og vurdere elever i en læringsaktivitet Berit Bratholm:
19-Sep-16 ALLE TELLER Jakten på elevenes tenkning (når ”svaret” er feil) Gerd Nilsen Bergen 9.mars.
3.14 X AXIS 6.65 BASE MARGIN 5.95 TOP MARGIN 4.52 CHART TOP LEFT MARGIN RIGHT MARGIN Tracking av digitalradio-andel i Norge © TNS Tracking.
Statistikk Forkurs Hva er statistikk? undersøke registrere lage oversikt→ Presentasjon av informasjon formidle Arbeidet med statistikk kan vi dele.
Høye lederambisjoner blant Econas medlemmer Econa Arbeidsmarkedsbarometer Ønske om å bli leder i fremtiden % %
Studiebarometeret 2013 Regresjonsanalyser HiST-avdelinger Utført av Norfakta på oppdrag fra HiST Basert på rådata stilt til disposisjon av NOKUT.
Holdninger til konkurranseutsetting av velferdstjenester Befolkningsundersøkelse gjennomført i juni 2017 på oppdrag for NHO.
Laboratoriebruk ved diabetes. Kan vi stole på resultatene
MAT0100V Sannsynlighetsregning og kombinatorikk
Plan for økten - Hva er Dembra? - Hva er «den ideelle skole»»?
Oslo Havn Risikokartlegging Ytre Miljø
Utskrift av presentasjonen:

Vurdering av statistiske analysemetoder brukt i Læringslabens undersøkelser i videregående skole i Rogaland

Rogaland Fylkeskommune Oppdragsgiver for prosjektet: Rogaland Fylkeskommune Bakgrunn: støy omkring Læringslaben (LL) sine arbeider

Bjørn Henrik Auestad Førsteamanuensis i statistikk Universitetet i Stavanger Hovedfag i statistikk (UiB, 1988) Dr.grad i statistikk (UiB 1991), Lang erfaring med bruk av statistiske metoder; forskning og undervisning

Arbeidsform i prosjektet utgangspunkt i ”Grunnlagsrapport 2007”; også arbeid LL har gjort tidligere for Rogaland fylk. dialog med LL; bl.a. møte i Stavanger den 15. mars; nyttig kontakt Metodene som beskrives i grunnlagsrapporten er de samme som brukes i rapport til Rog. fylk. for 2007

Grunnlagsrapport 2007 Pedagogisk teori, vurderinger og analyser Vitenskapsteori (!) Statistiske analyser enkle beskrivende avanserte (korrespondanse, prinsipal komponent, faktor, ...) sammensatte, ikke-standard-metoder

Grunnlagsrapport 2007 korrespondanseanalyse, prinsipal komponent analyse, faktoranalyse, ... Det er flott å kunne håndtere slike avanserte metoder! Utfordring ved formidling? Unødvendig komplisert? Kunne det vært gjort enklere?

Statistisk usikkerhet Når vi skal trekke konklusjoner på bakgrunn av statistiske data, må vi ta høyde for det vi kaller statistisk usikkerhet i resultatene våre. Skoledataene er data med statistisk usikkerhet. Dette må forstås og håndteres ordentlig!

Statistisk usikkerhet Eksempel: Skolegjennomsnittene for variabelen ”motiverende lærer”:

Statistisk usikkerhet Eksempel: Skolegjennomsnittene for variabelen ”motiverende lærer”: Figur viser skolesnittene og grenser. Statistisk usikkerhet?

Statistisk usikkerhet Modell for statistisk usikkerhet; s. 62 i gr.rapp.: observert skåre = valid skåre + systematisk feil + tilfeldige feil BRA! Beskrivelsen av leddet tilfeldige feil mangler individuell variasjon.

Statistisk usikkerhet Individuelle variasjoner (Ulike elever opplever skolens/skolesystemets egenskaper ulikt. Neste kull sine svar på de aktuelle spørsmålene vil neppe gi eksakt samme fordeling.) Omfanget av denne variasjonen dominerer de tilfeldige feilene. Omfanget av tilfeldige feil totalt kommer til uttrykk i spredningen i svarene som vi ser i figurene Motiv. lærer for en skole i Rog.

Statistisk usikkerhet Omfang av tilfeldig variasjon kan simuleres:

Statistisk usikkerhet Omfang av statistisk usikkerhet i skolesnittene:

Statistisk usikkerhet Det er ikke tatt hensyn til denne usikkerheten i forbindelse med "Kriteriebasert vurdering" F.eks. vil skolesnittene ha en viss spredning utelukkende forårsaket av individvariasjonen, mens LL nærmest forutsetter virkelige forskjeller. (ANOVA-liknende metode aktuell)

Statistiske tester Det brukes t-tester, effektstørrelse og ki-kvadrat-tester i forbindelse med "Kriteriebasert vurdering" t-test: sammenligning av to gjennomsnitt der man tar hensyn til foreliggende statistisk usikkerhet (”statistisk signifikant forskjell”) effektstørrelse: mål på praktisk interessant forskjell. KUN DERSOM DET ER STATISTISK FORSKJELL!!!

Statistiske tester t-tester og effektstørrelse brukes feil i forbindelse med grenseverdiene, kp. 10.4, ... (f.eks. s 273)

Statistiske tester Ki-kvadrat-tester; i forbindelse med grensene feil bruk

Statistiske tester Ki-kvadrat-tester; i forbindelse med grensene feil bruk, 2

Statistiske tester Videre brukes effektstørrelse i feil (for å teste statistisk forskjell) i kp. 8.2, 9.2

Kriteriebasert vurdering Bra å komme bort fra rangeringen av skolegjennomsnittene! En del har sikkert opplevd analysene fra LL som gode beskrivelser som har vært til hjelp – konklusjonene synes å stemme. Det er svært mange konklusjoner i en typisk fylkesrapport. Mange av dem stemmer nok!

Statistiske tester Generelt problem med at det gjøres mange statistiske tester (sammenligninger): forventet forekomst av feile konklusjoner øker!!! Flere metoder for å gjøre noe med dette finnes. LL har ikke berørt problemet i det hele tatt.

Frafall/representativitet

Frafall/representativitet

Frafall/representativitet

Frafall/representativitet Personalundersøkelsen, Rogaland 2006, kp. 2: ca. 1550 deltar av ca.3300 er utvalget representativt?? Hvem er de som ikke svarte? Kan det tenkes noe mønster i holdninger? Dette er ikke berørt i det hele tatt i rapporten.

Regresjonsanalyser I kp. 8.4, 9.4 og 10.3 (miljø- og motivasjonsvariablene) Eksempel på regresjonsanalyse:

Regresjonsanalyser Forutsetninger for bruk ..... ”Residualene” bør se noenlunde slik ut:

Regresjonsanalyser Residualene for modell beskrevet på s. 261:

Spurv med kanon?!?! Hensikt med analysene: grunnlag for kvalitetsutvikling av skolesystemene Viktig: grunnlaget må være udiskutabelt Enkle analyser er en stor fordel og brukes klart mest! kan tenkes å være tilstrekkelig til de viktigste formålene grunnlag for eierskap og engasjement komplekse og omfattende analyser er resurskrevende Skeptisk til bruk av de avanserte metodene på denne bakgrunn

Avslutning Ikke enkelt å finne ut hvilke metoder som har vært brukt og hvordan de har vært brukt. Den delen har vært dårlig dokumentert, etter min mening. Hva konsekvenser feil eller dårlig bruk av statistiske metoder har i disse arbeidene, er uoversiktlig. kvalitetssikringsarbeid trenges, etter min mening.