Psykometriske analyser Et verktøy for eksamenskvalitet Per Grøttum

Slides:

Advertisements

Liknende presentasjoner

Vurderingskriterier og oppgaver

Advertisements

Digital eksamen Fra behov til gjennomføring

Digital eksamen Et pedagogisk prosjekt Per Grøttum Seksjon for medisinsk informatikk.

Se mulighetene!. Bygdekompasset Basert på det svenske suksessprosjektet Bondeföretagaren. Kom til Norge som et pilotprosjekt i Trøndelag i Er tatt.

Om skolekonkurranser i Nordland Informasjon ved koordinator seniorrådgiver Gunnar Pedersen

Litt høyttenking på slutten av årsmøtet.  Digital kompetanse er på offentlige agenda  Bruk av verktøy er gøy  Jeg kan noe, du kan noe. ◦ Sammen kan.

Medarbeiderkartlegging Driftsenhet / Avdeling Dato Foto: Rune Nilsen/News on Request.

UNGDOM OG ØKONOMI - ØKONOMILAPPEN Hilde E. Johansen

Uib.no UNIVERSITETET I BERGEN Spørsmål i undervisningen – Hvordan påvirker ulike typer elevenes læring? Samling for veilederne i realfagspartnerskap 7.

DigiEx – digital eksamen på BI Presentasjon Nasjonalt erfaringsseminar: digital eksamen 9. september 2015 Marianne Schei Direktør Digital studentforvaltning,

PROSJEKTOPPGAVE gruppe 2 FASE 3 – Høsten Presentasjon av gruppe 2: Herbjørn Henningsen – Finnmark Linda Ellingsen – Nordland Arvid Storegjerde –

Dagens læringsmål: Tar du en master i fysikk vil du delta i prosjekt i den internasjonale forskningsfronten. Gjennom å være en integrert del av en spesialisert.

Eksterne epikriser – hvordan sikre at de når frem til rett mottaker Digital samhandling, OUS –

Kandidatundersøkelsen 2013  Undersøkelsen ble sendt til kandidater som avla en grad ved NTNU i perioden 2009 –2012, og som hadde en registrert post- og/eller.

Digital vurdering og eksamen Juridiske rammer Læringsfestivalen 2015 Maren Magnus Jegersberg Juridisk rådgiver IT-direktørens stab Universitetet i Oslo.

VURDERING FOR LÆRING Forskrift til Opplæringsloven, § 3

Inntakskvalitetsundersøkelsen Høsten 2008 Presentasjon LMU

Erfaringer som Skyggesensur ved ISP

Tips til gjennomføring av «Temakveld: Ungdomsidrett»

Skrivekurs Innhold: Analyse av oppgavetekst Begrepsavklaring

Jan Frich, professor/prosjektleder Det medisinske fakultet, UiO

Kvalifikasjonsrammeverket

Prosjekttittel Ditt navn | Lærerens navn | Skolen din

Familieråd En for alle, alle for en

VIS DETTE LYSBILDET: INTRODUKSJON

Hvilket planstadie er klubben på?

Seleksjonsprosessen Kap 4

Muntlig vurdering – å veilede andre

Frafall i ingeniørutdanningene

Stefan Schauber Helsevitenskapelig utdanningssenter (HUS) & CEMO

SAK 6: Oppdatering av bilag 3 til Samarbeidsavtalen Krav til tjeneste

BTI-handlingsveileder barnehage

Oppsummering – FINF1001 Departementer Direktorater / tilsyn Kommuner

Karin Helle og Gro Beate Vige

Forskningsprosjekt, tittel

Norsk e-helsebarometer 2017

Hva fungerer og hva fungerer ikke?

Foreldremøte 10. trinn Kannik skole!

Forskningsopplegg og metodekombinasjon Tommy Tranvik, AFIN

Foreldreundersøkelsen 2018

Studiebarometeret – bruk og videreutvikling

Formål og vurdering i høyere utdanning

Evaluering k18-k /2018. Evaluering k18-k /2018.

Gangen i en undersøkelse Prosjektplan og problemformulering

Utforskende undervisning A – Forarbeid

Status lærlingordning

EKSAMENSINFORMASJON VÅR 2018.

Matematikk på ungdomstrinnet

Modul 2 – Undersøke skolens vurderings- og oppfølgingspraksis

Psykologiske tester Frode Svartdal, UiTø 26/12/2018 FSv.

Studiebarometeret 2017 Den nasjonale undersøkelsen av studentenes oppfatning om kvalitet i utdanningen.

Lokal brukerundersøkelse 2015 NAV-kontorer i Hordaland

Forskningsmetoder Data: Måling og målefeil Frode Svartdal UiTø

Kvalifikasjonsrammeverk og karakterskala: sammenheng eller motsetning?

Forslag til Muntlig eksamen LK06 i faget ”Fremmedspråk”

Klubbutvikling oppfølging

Krav om sensorveiledninger – bakgrunn og intern oppfølging

La elevene løse oppdraget B – Samarbeid

Forslag til Muntlig eksamen LK06 i faget ”Fremmedspråk”

Foreldremøte 10. trinn, Sofienberg

Brukergruppemøte Vann og Avløp

Aktiv lytting gjennom fem steg.

Morten H. Abrahamsen BI Stavanger,

Sensorveiledninger – anbefalinger og eksempler

Overgangen barnetrinn - ungdomstrinn B – Samarbeid

Avdeling for utdanning seniorrådgiver Hege Skarsfjord

Læringsmål og rubrikker i Canvas

Utskrift av presentasjonen:

Psykometriske analyser Et verktøy for eksamenskvalitet Per Grøttum

Mål på eksamenskvalitet Validitet Reliabilitet

Validitet Måler testen det den er ment å måle?

Faglig bredde

Kognitiv dybde Faglig bredde

Huske Forstå Anvende Analysere Evaluere Skape Kognitiv dybde Faglig bredde

Faglig bredde Kognitiv dybde Læringsmål Huske Forstå Anvende Analysere Evaluere Skape

Spørsmålene skal dekke læringsmålene Huske Forstå Anvende Analysere Evaluere Skape Kognitiv dybde Læringsmål Faglig bredde

Hvordan avdekke lav validitet? Primært en faglig vurdering Fordelingen av score på enkeltspørsmål kan gi «mistanker»: - overvekt av høy score ª overvekt av enkle faktaspørsmål? - overvekt av lav score ª curriculum overload? - slengere med lav score ª utenfor læringsmål, mangelfullt undervist, feil? Faglig bredde Kognitiv dybde Læringsmål

Eksempel: Gjennomsnittscore 13% Hvilket område i medulla oblongata gir opphav til aktivitet i perifere sympatiske nerver? Så lav item facility (gjennomsnittscore) er fakultetets problem, ikke studentenes: enten er spørsmålet utenfor læringsmålene, eller så er det undervist for dårlig, eller så er det et feil/for avansert læringsmål.

Eksempel: Gjennomsnittscore 99% Hvilken funksjon har purkinjefibre i hjertet? Høy item facility (gjennomsnittscore) gir ingen diskriminerende verdi. Det er OK hvis spørsmålet er kjernepensum som studentene da viser at de faktisk kan meget godt.

Reliabilitet Er resultatet (fortolkingen) stabilt og konsistent?

Hvordan avdekke lav reliabilitet? Gjennom psykometriske analyser

Feilkilder - essay Spørsmål eq Kandidat fortolker ek Forfatter fortolker ef Sensurveiledning Svar Sensor fortolker es Karakter

Reliabilitet - sensur Eksternsensor - LærerA = 13.3% Spørsmål eq Kandidat fortolker ek Forfatter fortolker ef Sensurveiledning Svar 2 sensorer fortolker es Karakter Inter-rater bias: Eksternsensor - LærerA = 13.3% Eksternsensor - LærerB = 3.3% Eksternsensor - LærerC = -1.7%

Reliabilitet - sensur Spørsmål eq Kandidat fortolker ek Forfatter fortolker ef Sensurveiledning Svar 2 sensorer fortolker es Karakter Inter-rater bias: Denne differansen i sensur fordrer rekalibrering av sensor A’s nivåkrav. Eksternsensor - LærerA = 13.3% Eksternsensor - LærerB = 3.3% Eksternsensor - LærerC = -1.7%

Feilkilder - avkryssingsspørsmål Spørsmål eq Kandidat fortolker ek Forfatter fortolker ef Svaralternativ Svar Karakter

Reliabilitet - avkryssingsspørsmål Spørsmål eq Kandidat fortolker ek Forfatter fortolker ef Svaralternativ Svar Karakter Item analysis: Delspørsmål 2: Er denne pasientens CHA2DS2 score 5 (2 for hjerneslag, 1 for alder, 1 for kvinne, 1 for karsykdom)? Ja/Nei

Psykometriske analyser – implementasjon Inter-rater analyse (sensorer) Item analyse (spørsmål) Klassisk test teori IRT Rasch Innført ved alle digitale eksamener på med.fak. fra høst 2015 Sensurering av essayoppgaver fullføres 3 dager før kommisjonsmøte Psykometrisk rapport lages og sendes eksamenskommisjonen Sensurmøtet innledes med gjennomgang av rapport, eventuell eksklusjon av spørsmål, nedvekting av oppgaver eller håndtering av bias mellom sensorer Sensurmøtet avsluttes med karaktersetting og eventuelt individuelle justeringer

Høy kvalitet ’ gjenbruk av spørsmål ’ innsynsbegrensning Oppgaver som skal gjenbrukes, kan unntas offentliggjøring Retten til innsyn i besvarelser må opprettholdes, men innsyn kan skje i kontrollerte former Offentliggjøring begrenset fra høsten 2015 Ca 20% av eksamensoppgavene offentliggjøres = treningsoppgaver Ca 80% går inn i gjenbruksbank etter revisjon Kommentert utdrag av de psykometriske analysene offentliggjøres Eget datasystem for kontrollert innsyn er utviklet

Konklusjon: Erfaringer med psykometriske analyser: stor verdi for å bedre kvalitet på sensur stor verdi for å bedre kvalitet på framtidige oppgaver sikrer gjenbrukbare spørsmål av høy kvalitet meget populært blant lærerne Forslag: Benytte CEMOs kompetanse og tilby psykometriske analyseverktøy til hele universitetet