Automatisering av tester

Slides:



Advertisements
Liknende presentasjoner
Kvalitative studier Trond Hatling Sintef Unimed Helsetjenesteforskning
Advertisements

Visible Learning av John Hattie
Teknologi i klasserommet
Hva slags spørsmål skal man stille på hvilke nivåer?
Fra prøving og feiling til
Pedagogiske krumspring med flervalgstester (multiple choice) NVU 2006 Svend Andreas Horgen Høgskolelektor Avdeling for Informatikk og e-Læring (AITeL)
Oppfølging og vurdering som grunnlag for læring
Brukertesting •Lærefil fra •© 2004 Nina Furu.
Veiledning i gevinstrealisering ved innføring av elektronisk handel
Eksamen og andre vurderingsformer. ”Kvalitetsreformen”
Flervalgsoppgaver – bedre kvalitet og mer effektiv undervisning?
Programmering i ActionScript - hva er det, og hvordan undervise?
Evaluering som kvalitetsforsterker i undervisningen Svend Andreas Horgen Høgskolelektor Avdeling for Informatikk og e-Læring (AITeL) Høgskolen i Sør-Trøndelag.
1 Stort elæringsprosjekt ved AITeL SELP. 2 SELP = 5 delprosjekt  Erfaringsbasert e-læring  Læring på arbeidsplassen  Lærestoff  Kvalitetsreformen.
Truls Fretland - Seminar 29.november 2005 Flervalgsøvinger og tester I diskret matematikk og algoritmer høsten 2005.
NVU – aktører De som presenteres her er: •HiA •HiB •HiNT •HiST •UiS.
Enhalet og tohalet hypotesetest
Flervalgstester – introduksjon Hvordan lager vi gode tester?
Ideutvikling - Problemdefinisjonen. Hva gjør de erfarne problemløserne? •Samler og analyserer informasjon og data •Snakker med mennesker som kjenner problemet.
Prosjekt: Presentasjon Av Elin Blikra
”Vurdering av hjemmesider” ”Vurdering av hjemmesider” en undersøkende oppgave om førsteklassenes hjemmesider. Av Fouzia, Benedicte og Svein.
Gøy med grammatikk Kurs på Elvebakken vgs 12. 2
Presentasjon av forskningsprosjektet Styring mot gevinst -
1 Oppgave gjennomgang Kap Oppgaver -Kap 12: 1, 2, 3, 5, 7, 8, 11, 18, 19.
Tiltaksplan for studiekvalitet: Status og videre utvikling Avdeling for IT Høgskolen i Østfold.
Testverktøy for å forbedre kvaliteten på flervalgstester Svend Andreas Horgen Høgskolelektor Avdeling for Informatikk og e-Læring (AITeL) Høgskolen i Sør-Trøndelag.
AITeL Studentaktivitet, raske tilbakemeldinger og åpenhet - er WIKI løsningen? Øyvind Hallsteinsen Svend Andreas Horgen Avdeling for Informatikk og e-Læring.
AITeL erfaringer fra et alternativt LMS-system Svend Andreas Horgen Avdeling for Informatikk og e-Læring (AITeL) Høgskolen i Sør-Trøndelag Blogg:
Thomas Johan Eggum & Sindre Williksen
Kreativ bruk av testverktøy
Registrering av kjemikalier i Kromatografigruppa, Fürst Medisinsk laboratorium. Database laget med bruk av teknologiene PHP, MySQL og Apache Prosjektoppgave.
AITeL Bruk av e-læring i undervisningssituasjonen for å øke læringseffekten Svend Andreas Horgen Høgskolelektor Avdeling for Informatikk og e-Læring (AITeL)
Svend Andreas Horgen Avdeling for Informatikk og e-Læring (AITeL)
Inspirasjonsdagen 2009 Veiledet oppgaveskriving og studentaktivisering via digitale tester i Blackboard Eirill Bø, Institutt for strategi.
Kunnskapsløftet - forskningen Organisering: prosjekter og programstyre Resultater: det store bildet Veien videre: er økt variasjon et problem?
AITeL Bruk av e-læring i undervisningssituasjonen for å øke læringseffekten Svend Andreas Horgen Høgskolelektor Avdeling for Informatikk og e-Læring (AITeL)
Kokebok for nettbasert undervisning NVU-konferansenGrimstad mars 2006.
Statistikk på 20 2 timer PSY-1002
Hjelp! Jeg skal undervise i IT 2!
Hvordan ivareta ”særskiltelever” på Design og håndverk Vg1 2007/08?
GØY MED GRAMMATIKK: KURS FOR LÆRERE
GØY MED GRAMMATIKK: KURS FOR LÆRERE 1. og 2. MARS 2004
Kvalitative og kvantitative metoder
Eziz Annagurban Veiledere: Sven-Olai Høyland Carsten Helgesen
Spørsmål og aktiviteter på ulike nivåer
3) Analyse (SoPK) for dypere kunnskap
ENDRINGER I NASJONALE PRØVER ― Ny skala og måling av utvikling over tid Per Kristian Larsen Vurdering 2.
Eksamensordninger Ordinær eksamen Ny eksamen. Ordinær eksamen 1.Vurdering underveis i studiet. Hele, eller en vesentlig del av, prøvingen skjer underveis.
Ingeborg Amundrud og Åshild Vassend Holm
Digitalt prosjektrom og samarbeidsteknologi Muligheter for meningsskaping og relevans i et «kombinert klasserom» Jorunn Thortveit og Hans Erik Bugge IGIS.
Using the personalized system of instruction in an introductory programming course Hallgeir Nilsen Universitetet i Agder.
TERMIN: 2011-HØST ORD EMNEKODE: UG1PEL15110 KANDIDAT NR DATO: 13/12-11 PEDAGOGIKK OG ELEVKUNNSKAP EKSAMEN.
Professor Guttorm Sindre Institutt for datateknikk og informasjonsvitenskap Programmering i Python.
Videobasert materiale Atle Nes Quality Hotel Oppdal Fredag 13. mars 2009 Kunnskapen du glemmer.
Vurdering for læring i Fysikk 1
Innleveringsoppgaver i forskningsmetode
FORSKERSPIREN Skolelaboratoriet 9. mars 2007
Elevintervju B – Samarbeid
Elevintervju B – Samarbeid
Hvorfor utvide klasserommet? B – Samarbeid
Modul 1 – Dynamisk kartlegging
La elevene løse oppdraget B – Samarbeid
Gøy med grammatikk Kurs på Elvebakken vgs 12. 2
Emneevaluering og referansegrupper – forbedringer, supplement, alternativer Guttorm Sindre.
Hvorfor utvide klasserommet? B – Samarbeid
Gjennomgang før eksamen
Sensorveiledninger på MN
Dybdelæring – regneark B – Samarbeid
Modul 2 – Undersøke skolens vurderings- og oppfølgingspraksis
Utskrift av presentasjonen:

Automatisering av tester Greta Hjertø Jarle Larsen Svend Andreas Horgen

Effektmål Målet er å fremskaffe et grunnlag for å ta i bruk automatiserte tester ved AITeL, slik at: de i størst mulig grad kan erstatte tradisjonelle prøver og eksamener vi måler studentens faktiske kunnskap på en tilfredsstillende måte lærerressurser til utvikling, gjennomføring og etterarbeid reduseres vesentlig i forhold til dagens praksis studenten får et arbeidsredskap som motiverer og støtter i læringsprosessen Øke forståelse for og kompetanse i bruk av automatiserte tester i høgere utdanning

Resultatmål Identifisere en beste praksis gjennom litteraturstudium utvikling og utprøving av tester analyse av testresultatene syntese – beste praksis Utvikling av verktøy med funksjonalitet basert på resultater fra analysene Formidling av resultatene Paper til Educa Berlin (des 2005). Abstract april 2005. Verktøy/prototyp, HiST, its L, andre? Presentasjon for ansatte i HiST Instruksjonshefte for å lage gode tester – legg ut på NVU-web? Kanskje bidra i Høgskolepedagogikk-undervisningen

Presentasjon av resultater Teorigrunnlag Utprøving av teori Utvikling av verktøy Formidling av resultat Foredrag Paper Rapport Guide/oppslagsverk

Teorigrunnlag – litteratur M. Bush: ”A Multiple Choice Test that Rewards Partial Knowledge”, Journal of Further and Higher Education, Vol. 25 no 2, 2001 Sylvia Encheva, Sharil Tumin: “On multiple choice tests in a computer added assessment system” W. Horton: Designing web-based training Wiley, 2000 T. Buchanan: “Using the world wide web for formative assessment”, Jorunal of Educational Technology Systems, 27, 1998-1999

Automatiserte tester – beste praksis? Valg av spørsmålstype Formulering av spørsmål Valg av tilbakemeldingsstrategi Utforming av tilbakemelding Design test Forbedre test Gi test Evaluer resultat Spør studentene Vurder test mot kursmål Valg av teststrategi Bygging av tester Utforming av informasjon Hindring av juks Gi skår Valg av skårstrategi

Spørsmålstyper Ja/nei Flervalg – varianter Fritekst Sammenligne to lister Fyll inn blanke Klikk og dra Simulering

Formulering av gode spørsmål Enkle og komplette formuleringer, eksempel: Pass på dobbelt nekting Ikke la ja bety noe negativt Ikke bruk pronomen Ikke bruk understrekning, betyr lenke på Internet La alle alternativer være like sannsynlige Ikke avslør svaret Varier vanskelighetsgraden

Effektive tilbakemeldinger – eksempel på design Start test Spørsmål Neste spørsmål Hint ? Tilbakemelding feil svar Tilbakemelding riktig svar Evaluer svaret Når? Hvem? Innhold? Riktig svar Lenke til fagstoff ? Beregn skår

Effektive tilbakemeldinger

Valg av teststrategi Skal studenten teste seg selv? Skal lærer se hvordan studenten ligger an? Skal lærer gi karakter? Eksempel på bruk av tester Selvevaluering Obligatorisk test Midtveiseksamen

Bygging av tester Statiske / Dynamiske Lærerstyrt / Studentstyrt Eksempel på bygging: Testen bygges når studenten ber om den Testside, spørsmålssett velges tilfeldig fra pool Hvis testen tas flere ganger, neste test har ny side med nye spørsmål og/eller svaralternativer For hvert spørsmål, fem svaralternativer, ett riktig, ett vet ikke Hvis ny test med nye svaralternativer – ett galt svar det samme Studentens sider lagres Alle versjoner sammenlignbare i vanskelighetsgrad og tema

Om å informere om testen Får jeg karakter? Hvilken del av pensum dekkes? Er det tidsbegrensning? Når må jeg ha tatt testen? Hvor mange spørsmål består den av? Hvor mange poeng får jeg for rett svar, feil svar ingen svar? Hva slags spørsmål er det? Kan jeg ta testen senere? Kan jeg ta testen flere ganger? Kan jeg avbryte og fortsette senere? Hvilke hjelpemidler kan jeg bruke? Når får jeg vite resultatet? Må spørsmålene besvares i sekvens? Hva skjer om jeg får tekniske problemer?

Informasjon til studentene Testregler for kurset Testside for hver test Spesifikk informasjon for hvert spørsmål Vanlige spørsmål og svar

Beregning av skår Mål: Måle faktisk kunnskap Strategier: Hindre gjetting Måle delvis kunnskap Strategier: Normalisering Høy grunnverdi Negative skår for feil svar Hvor sikker er du? Velg mer enn ett alternativ Eliminer feil svar

Stadig bedre tester Evaluer resultatet basert på statistikk Spør studentene Vurder mot kursets mål

Utprøving av teori Kildemateriale – tester i flere fag til nå Analyse Internett og Sikkerhet Prosjektrettet systemarbeid Kontorautomasjon Webprogrammering med PHP Visual Basic BADR høsten 2004 Analyse Syntese

Utprøving av teori Kildemateriale Analyse Syntese

Utprøving av teori Teori Kildemateriale Analyse Syntese Verktøy Beste praksis

Hypotese 1 Poengberegningen som brukes spiller inn på resultatet av tester Poengberegningen må velges med omhu og tilpasses fagets egenart.

Kildemateriale hypotese 1 Øving høsten 2004, BADR, it's Learning Programmering 75 studenter 20 spørsmål, ett av fire kryss, 60% riktig for å stå Hvor sikker er du på om svaret er riktig? Del av eksamen, fjernundervisning Et kryss av tre mulige, minuspoeng for galt svar (Internett og Sikkerhet, Kontorautomasjon) Et kryss av fire mulige (Visual Basic, Kontorautomasjon) Sett kryss for 0,1,2,3 eller 4 riktige (PHP, Visual Basic)

Strategi hypotese 1 Fra its’ Learning til regneark Analyse Ingen eksportstøtte per i dag Stor manuell jobb Analyse Ulike formler for poengberegning Forskjell, mønstre, eller annet å trekke ut Andre forslag?

Forventet resultat hypotese 1 Hvilke formler egner seg best til denne type test? Mulig å generalisere konklusjonen? Guide til hvordan formler må settes opp i regneark

Hypotese 2 Hvis læreren kan noe teori om flervalgstester og legger flid i formuleringene, vil studentene akseptere testene. Tester kan erstatte tradisjonell eksamensform og ressurser spares. Det kreves derimot trolig mer arbeid for å lage en god nok flervalgstest.

Kildemateriale hypotese 2 Eksamen FU i Visual Basic desember 2004 flervalgstest (40%) programmeringsdel (60%) Eksamen BADR januar 2005 eksamen talte 60% på totalkarakteren (prosjekt siste 40%) 20 spørsmål fra IT-Intro, 10 fra Publisering på Internett, 10 fra Visual Basic og 10 fra Databaser. Kvalitetssjekk: faglærerne løste alle spørsmålene i plenum. Muntlig tilbakemelding om at flere av spørsmålene var utvetydige og at de kunne svaret, men krysset av feil pga formuleringene.

Strategi hypotese 2 Er det en sammenheng mellom resultatene fra flervalgstesten (40%) kontra programmeringsdelen (60%) av VB-eksamen? Kunne flervalg vært brukt alene på denne eksamen? Uklare formuleringer: Spørsmål som også flinke får 0 poeng på Lag evalueringsskjema for BADR-studentene??? Lag flervalg til eksamen i Opsys til våren med sterkere fokus på teori Gjenta evalueringsskjemaet etter eksamen i mai???

Forventet resultat hypotese 2 Kan lære mye om hva som må til for at tester kan brukes i utstrakt grad Kan avdekke typiske uheldige formuleringer Kan lære om studentenes oppfatning av tester

Hypotese 3 Underveistesting i semesteret kan øke læringen for studentene, ivareta fleksibiliteten og sikre jevn progresjon i faget. Testingen kan automatiseres

Kildemateriale hypotese 3 Generell observasjon: Det er ofte et nokså stort frafall av studenter i fjernundervisningen Mange studenter føler at eksamen ble mye vanskeligere enn først antatt. Resultatene fra Visual Basic over en årrekke avslører at en stor andel stryker eller er i bunnen av karakterskalaen. Har ikke brukt flervalgstester underveis i semesteret i fjernundervisningen før, selv om det ofte er flervalgstester på eksamen.

Strategi hypotese 3 Lag 2-3 frivillige tester i Visual Basic, FU Plasser disse etter vanskelige tema (matriser, funksjoner, filbehandling) Lag og gjennomfør 1 obligatorisk flervalgstest i Opsys (BADR) Bruk its’ Learning nå Eget verktøy til høsten?

Forventet resultat hypotese 3 Vanskelig å måle om slike underveis-tiltak har noen direkte effekt Kan se på om gjennomføringsraten øker, samt om karakterene forbedres sammenliknet med tidligere karakterfordeling Kan spørre om de er tilfredse med faget, og kanskje sammenlikne med andre fag de tar hvor slik testing ikke gjennomføres? Kan gjenbruke testene over flere semestre og slik forbedre det pedagogiske opplegget

Status Litteraturstudier Gjennomførte tester Behov for nytt verktøy - hovedprosjekt Demo ved studentene Thomas Eggum og Sindre Williksen

Videre arbeid – Vår 2005 Følge opp hovedprosjektet Komme fram til metoder for å kvalitetssikre tester Utvikle tester basert på litteraturstudiene Gjennomføre tester i noen fag Som selvtest Som vurderingsgrunnlag Vurdere om det er noen signifikant forskjell mellom test og vanlig eksamen Implementere IMS QTI i hovedprosjektoppgaven? Undersøke hvordan studenter og lærere oppfatter verdien av tester i læringsprosessen

Videre arbeid – Høst 2005 Evaluere resultatet av vårens undersøkelser Skrive foreløpig rapport Studere problematikken omkring autentisering av tester Utføre nødvendige forbedringer og kvalitetssikre arbeidet Nye undersøkelser Analysere resultatene Foredrag

Videre arbeid – Vår 2006 Fortsette analysearbeidet Rapportskriving Utarbeide instruksjonshefte for å lage gode tester Avslutningsfest!!!