Forelesning Bruk av maskinlæring i saksbehandlingen i Lånekassen

Slides:



Advertisements
Liknende presentasjoner
Rapportering til Lånekassen
Advertisements

SuperOffice - Visma Global ERP link - Tilbud/Ordre SuperOffice - Visma Global integrasjonen består av 3 produkter. ERP link SuperOffice - Visma Global.
Dag Wiese Schartum, Senter for rettsinformatikk,
Utlandsprosessen Studiestøtteonferansen i Stockholm 1. – 3. juni 2014.
Informasjon fra Lånekassen v/ seniorrådgiver Torleif Einarsen, Bergenskontoret Rådgiverseminar
Fornyelse i Lånekassen Nordisk Studiestøttekonferanse 2008.
Februar 2010 v/ Siv Frost Rapportering til Lånekassen.
Elektronisk forvaltning og jus Dag Wiese Schartum, AFIN.
Jus som ramme for beslutningssystemer i forvaltningen Aktøranalyse og systemavgrensing Dag Wiese Schartum.
Oversikt over systemer med jus i, og grunnleggende perspektiver og hensyn Dag Wiese Schartum.
Vibeke Bjarnø, Avdeling for lærerutdanning og internasjonale studier
Semantisk interoperabilitet i det offentlige
Datavarehus i skatteetaten -
Fra virksomhetsmål til prioritert produktkø
Orientering om automatisk tilgangsstyring
Lånekassen Rapportering til Lånekassen Fagskoler Februar 2011 v/ Gretha Sakshaug og Siv Frost.
Effektivisering av ansettelsesprosessen
Medlemskap i folketrygden ved opphold i utlandet
FOKUS: SØK Byggesaksseminar
Dokumentasjon av rettslige beslutningssystemer Dag Wiese Schartum, AFIN.
Brukerundersøkelse for Etat for byggesak og private planer
Informasjon fra Lånekassen v/ rådgivere Ann-Mari Bønæs og Sissel Skymoen, Bergenskontoret Rådgiverseminar
Rapportering til Lånekassen Fagskoler 30. og 31. januar 2013
BUCS Utfordringer og valg av fokus Tor Stålhane. Rammebetingelser Første spørreundersøkelse viser at det vi gjør må kunne: Brukes sammen med UML Passe.
Gruppearbeid til bolk I for emnet Digital forvaltning (DRI 1001)
Om personopplysningslovens betydning for systemutvikling Dag Wiese Schartum, Avdeling for forvaltningsinformatikk (AFIN), UiO.
Studiefinansiering for funksjonshemmede - Et eksempel på lobbyarbeid.
Elektronisk forvaltning og jus Dag Wiese Schartum, AFIN.
Ny likepersonsordning
GAUS Planleggingsgruppemøte Agnethe Sidselrud.
Retts- og systemutvikling Kan systemutvikling være nyttig for regelverksutvikling? Underdirektør Marius Mølmen Moen 14. september 2011.
Dokumentasjon av rettslige beslutningssystemer Dag Wiese Schartum, AFIN.
Fra lovtekst til programkode -hva er det saken gjelder? Dag Wiese Schartum.
Bruk av IKT i ulike beslutningsprosesser og arbeidsoppgaver i offentlig sektor (II) - Spesielt om representasjon av rettsregler i datamaskinprogrammer.
Regresjon Petter Mostad
Innpassing/godkjenning IHR studentutveksling Leangkollen.
Gruppearbeid til bolk I for emnet Digital forvaltning (DRI 1001) Frist for levering av skriftlig rapport fastsettes av hver enkelt gruppelærer med seneste.
Om personopplysningslovens betydning for systemutvikling -grunnkrav Dag Wiese Schartum, Avdeling for forvaltningsinformatikk, AFIN.
Studentbetalinger FS-seminar 25. nov Studentbetalinger -rutiner ved en privat høyskole Bakgrunn Hvordan bruker Westerdals betalingsløsninger Utfordringer.
Offentlige anskaffelser 7 A vslutning av konkurranser Endringer i kontrakten og oppsigelse Administrasjon og ledelse og organisasjon og forvaltning Høst.
Automatisering av rettslige beslutninger, særlig enkeltvedtak
“Lov på boks” -hva er mulig å automatisere?
Automatisering av rettslige beslutninger, særlig enkeltvedtak
Gruppearbeid til bolk I for emnet Digital forvaltning (DRI 1001)
Personvern som del av enkeltsaksbehandling i offentlig forvaltning
Automatisering av rettslige beslutninger, særlig enkeltvedtak
Dokumentasjon av rettslige beslutningssystemer
Oppsummering – DRI1001 Departementer Direktorater / tilsyn Kommuner
Oversikt over lovgivning med stor betydning for digital forvaltning
Innebygget personvern
EDAG og a-ordningen Besøk Universitetet i Bergen Britt Visedo - Bluegarden 12. Mai 2014.
Dag Wiese Schartum, AFIN
Gruppearbeid til bolk I for emnet Digital forvaltning (DRI 1001)
Gruppearbeid til bolk I for emnet Digital forvaltning (DRI 1001)
Administrasjon og ledelse og organisasjon og forvaltning Høst 2017
Erfaringer med biobankloven. Seniorrådgiver Vibeke Dalen
Trine Melheim, juridisk seksjon
Automatiseringsvennlig lovgivning
Krav til rettslig grunnlag for behandling av personopplysninger
Oversikt over lovgivning med stor betydning for digital forvaltning
Digitalt doktorgradsopptak – august 2018
Dag Wiese Schartum, Avdeling for forvaltningsinformatikk
Oppsummering – FINF1001 Departementer Direktorater / tilsyn Kommuner
Hva er saken? Vi ser for ofte at legeattester leveres de siste dagene før innlevering av masteroppgave og ber om forlenget frist med uker eller måneder.
Oppsummering FINF4021 Dag Wiese Schartum.
I: Jus som ramme for beslutningssystemer i
Utskrift av presentasjonen:

Forelesning 11.10.2018 Bruk av maskinlæring i saksbehandlingen i Lånekassen Robin Sande Yulia Vibe Tom-Stian Berntsen

Visjon Lånekassen skal bli oppfattet som Norges mest moderne offentlige virksomhet. Mål Vi skal levere den beste kundeopplevelsen i offentlig sektor. Strategi Kundeopplevelse skal prioriteres, utvikles og leveres som følge av at driften effektiviseres.​

1 087 500 kunder 672 900 tilbakebetalere 173, 8 mrd utestående

Lånekassen En stor saksportefølje, men relativt få saksbehandlere! 75% av kundenes søknader om utdanningsstøtte er automatiserte. 85% av kundenes søknader om betalingsutsettelse er automatiserte. Hvordan?

Regelmotor: fra forskriftstekst til systemkode Alle saksområder har et sett med regler som potensielt automatiserer en sak. Felt Verdi Regel-ID RV-BU-2003 Opprettet 06.07.2017 Gjelder for ordningsvariant Betalingsutsettelse Regelstatus Implementert Beskrivelse Regel som beregner antall mulige betalingsutsettelser for det enkelte år basert på estimert inntekt fra A-ordningen Forutsetning Det er estimert inntekt fra A-ordningen for minst ett kalenderår. Ukuranstekst til saksbehandler Hver regel har en unik ID. Denne brukes i flere sammenhenger, blant annet i datavarehuset, så vi kan finne igjen alle saker som har blitt behandlet med denne regelen og det gir oss grunnlag når vi jobber med videre automatisering. Vi ser at denne regelen ble opprettet 24.05.2016, så det var tilbake i den perioden vi drev med systemutviklingen, og så er den endret en del ganger siden. Jeg kan ikke ta alle feltene her, men disse ordningsvariantene er verdt å nevne. Det er de ulike ytelsene, eller «produktene» som vi har. Her ser vi at en regel treffer flere ytelser. LOG33 - Omgjøringslån - opptrapping 11 md LUT33 - Ordinært lån del 3 - opptrapping 11 md SFS33 - Forsørgerstipend del 3 - opptrapping 11 md SFH53 - Stipend nedsatt funksjonsevne - opptrapping 11 md SFH54 - Fullstipend nedsatt funksjonsevne - opptrapping 11 md SFO53 - Foreldrestipend - opptrapping 11 md SSY53 - Sykestipend - opptrapping 11 md LOG36 Omgjøringslån eksamen ved grad, 11 mn LOK33 Omgjøringslån grad, 11 mnd

Forretningsproblem Utvikling av regelmotor har vært et viktig verktøy for effektivisering og faglig kvalitet. Høy automatiseringsgrad betyr fallende nytte for hvert nytt tiltak. Nye automatiseringstiltak på regelmotor er kostnadskrevende og gir relativt liten nytte. Økt automatisering krever også mer detaljerte regler, og dermed også økt risiko for feil og økte forvaltningskostnader. Forskriftsendringer er politisk styrt, og en usikker kilde til forenkling. Utfordringer: Hvordan finne nye verktøyer som bidrar til kortere behandlingstid? Hvordan finne nye verktøyer som kan sikre likebehandling, økt faglig kvalitet og effektive arbeidsprosesser?

Business Case: Betalingsutsettelse I Hva: Alle kunder i Lånekassen har rett til tre år med betalingsutsettelse uten å oppi noen årsak. Alle slike saker blir automatisk behandlet av regelmotor. Kunder som har brukt opp denne rettigheten, men ønsker flere utsettelser, må sannsynliggjøre rett til rentefritak. Hvordan: Kunden søker først om rentefritak, og får et midlertidig svar dersom årsaken er tilstrekkelig dokumentert. Det endelige svaret på søknaden om rentefritak får kunden når likningen for året er klar (altså året etter). Kunden har også søkt om betalingsutsettelse, og må sannsynliggjøre at søknaden om rentefritak blir innvilget. Vi henter kundens inntekt fra A-ordningen (skatteetaten) for å finne den sannsynlige inntekten, og vurderer rett til betalingsutsettelse ut fra den.

Regelmotor Alle saksområder har også et sett med ukuransregler som fanger opp saker som må vurderes manuelt Felt Verdi Regel-ID RV-BU-2009 Opprettet 06.07.2017 Gjelder for ordningsvariant Betalingsutsettelse Regelstatus Implementert Beskrivelse Når kunden er bosatt i utlandet skal saksbehandler vurdere inntektsesimatet før det gis betalingsutsettelse Forutsetning Det innvilges minst en betalingsutsettelse OG Saken inneholder inntekt fra A-ordningen Kunden har registrert utenlandsk adresse Ukuranstekst til saksbehandler Sjekk rett til betalingsutsettelse. Kunden har adresse i utlandet. Vurder om kunden må sende inntektsdokumentasjon. Hver regel har en unik ID. Denne brukes i flere sammenhenger, blant annet i datavarehuset, så vi kan finne igjen alle saker som har blitt behandlet med denne regelen og det gir oss grunnlag når vi jobber med videre automatisering. Vi ser at denne regelen ble opprettet 24.05.2016, så det var tilbake i den perioden vi drev med systemutviklingen, og så er den endret en del ganger siden. Jeg kan ikke ta alle feltene her, men disse ordningsvariantene er verdt å nevne. Det er de ulike ytelsene, eller «produktene» som vi har. Her ser vi at en regel treffer flere ytelser. LOG33 - Omgjøringslån - opptrapping 11 md LUT33 - Ordinært lån del 3 - opptrapping 11 md SFS33 - Forsørgerstipend del 3 - opptrapping 11 md SFH53 - Stipend nedsatt funksjonsevne - opptrapping 11 md SFH54 - Fullstipend nedsatt funksjonsevne - opptrapping 11 md SFO53 - Foreldrestipend - opptrapping 11 md SSY53 - Sykestipend - opptrapping 11 md LOG36 Omgjøringslån eksamen ved grad, 11 mn LOK33 Omgjøringslån grad, 11 mnd

Business case: Betalingsutsettelse II Problem: Data fra A-ordningen gir ikke alltid et korrekt bilde av kunden. Vi har utviklet fem ukuransregler i regelmotoren som fanger opp slike tilfeller. Årsaken kan være at det er store svingninger i inntekten, mistanke om at kunden er bosatt i utlandet, eller at kunden har næringsinntekt. Saker som blir ukurante må vurderes av saksbehandler. På bakgrunn av en skjønnsmessig vurdering av ulike variabler på kunden, enten innvilger eller avslår saksbehandler søknaden. Mulig løsning: Kan vi bruke maskinlæring for å automatisere behandlingen av sakene som blir ukurante?

Fra skjønn til statistikk Betalingsutsettelse er et lite og ukomplisert saksområde hvor saksbehandlers skjønn er begrenset. Statistisk metode er ikke det samme som utøvelse av skjønn basert på faglig kompetanse. Utfordring I: Hvordan skal vi ved hjelp av maskinlæring løse forretningsproblemet? Utfordring II: Hvordan sikrer vi god forvaltning og etterprøvbarhet?

Klassifiseringsproblem Ideen er å klassifisere kunder : Kunder som kvalifiserer for betalingsutsettelse Kunder som ikke kvalifiserer for betalingsutsettelse basert på forskjellige kriterier som vi setter

Hvem er disse kundene? 15477 kunder har brukt opp 36 måneders regelen

Hvem er disse kundene? 15477 kunder har brukt opp 36 måneders regelen

Vår kundegruppe Hvor mange kunder med usikker inntektsdata fikk ekstra betalingsutsettelse i manuell behandling? 2017 2018 Innvilget Ikke innvilget Mangler estimert inntekt 136 4 584 77 Fikk avslag på betalingsutsettelse pga. høy inntekt tidligere 20 1 122 Kunden er bosatt i utlandet 16 63 Stor varians i inntekten 356 13 1530 2 Inntekt er basert på opplysninger for forrige år 35 8

Hvilke data har vi tilgjengelig og hvordan vil vi angripe problemet? Interne data Eksterne data Personlige kundedata (Alder, Kjønn, Flyktningsdata, Opprinnelsesland, osv.) Utdanningsdata (Utdanningsnivå, Fagretning Studieprogresjon, osv.) Data om støtte og kommunikasjon med LK (Gjeldstørrelse, Terminbeløp, Antall år med støtte, Sykestipend, Forsørgerstipend, osv.) NAV (Registrert arbeidssøker, Trygdeytelser) Nettstatistikk fra andre offentlige etater? SSB Hvilke data er det fornuftig å bruke?

Hva skiller ut kundene som ikke fikk betalingsutsettelse fra dem som fikk? Utdanningsnivå Hvordan finner vi riktige klassifiseringsattributter?

Løsningsmuligheter Supervised learning Modell trenes på eksisterende eksempler Valg av algoritme Vi kan kjøre flere algoritmer for å finne den som presterer best Et eksempel av algoritme er beslutningstrær Beslutningstrær er minst knyttet til det black box problemet siden det er mulig å følge med logikken de bruker * * Delibašić, Boris & Vukicevic, Milan & Jovanovic, Milos & Suknovic, Milija. (2013)

Klassifiseringsalgoritme – beslutningstrær root node rule rule internal node internal node rule rule rule rule leaf node leaf node leaf node leaf node

Klassifiseringsalgoritme – beslutningstrær alder ung gammel gjeldstørrelse gjeldstørrelse stor liten stor liten avslag innvilgelse innvilgelse avslag

Databasen Personlige data Utdannings data Kundehistorikk data

Databasen Personlige data Utdannings data Kundehistorikk data Kunde ID Alder Kjønn Antall søsken Statsborgerskap Sivil Status Antall barn Formue historisk Partners formue Registrert Land Adresse (Postnummer) Personlige data Utdannings data Kundehistorikk data

Databasen Personlige data Utdannings data Kundehistorikk data Siste utdanningsnivå Utenlandsk lærested? Antall skoler Tatt pause i utdanning Eksamensresultat Fagretning Kundehistorikk data

Databasen Personlige data Utdannings data Kundehistorikk data Gjeldstørrelse Type støtte Terminbeløp Antall purringer Tid etter avsluttet utdanning Pensjon

Databasen Personlige data Utdannings data Kundehistorikk data Kunde ID Alder Kjønn Antall søsken Statsborgerskap Sivil Status Antall barn Formue historisk Partners formue Registrert Land Adresse (Postnummer) Personlige data Utdannings data Siste utdanningsnivå Utenlandsk lærested? Antall skoler Tatt pause i utdanning Eksamensresultat Fagretning Kundehistorikk data Gjeldstørrelse Type støtte Terminbeløp Antall purringer Tid etter avsluttet utdanning Pensjon

Hvordan sikrer vi god forvaltning og etterprøvbarhet? Hjemmelsgrunnlag/regelverk Utdanningsstøtteloven med forskrifter Gir hjemmel for behandlingen Tilbakebetalingsforskriften § 7-2 andre ledd: § 7-2. (…) Dersom det er sannsynleg at låntakaren vil få innvilga ein søknad om sletting av renter for ein periode, kan det bli gitt betalingsutsetjing for denne perioden. Dette gjeld sjølv om formues- og inntektsskatten for perioden ikkje er fastsett. Er statistikkbasert vurdering skjønnsutøvelse?

Hvordan sikrer vi god forvaltning og etterprøvbarhet? Hjemmelsgrunnlag/regelverk Forvaltningsloven/Offentleglova Taushetsplikt Begrunnelse Klage – kontradiksjon Innsyn

Hvordan sikrer vi god forvaltning og etterprøvbarhet? Hjemmelsgrunnlag/regelverk Personvernforordningen Behandlingsgrunnlag Samtykke istedenfor hjemmel i lov? Innebygget personvern og vurdering av personvernkonsekvensene Retten til å motsette seg automatisert behandling Rettferdighet Formålsbegrensning Dataminimering Gjennomsiktighet Innsyn

Hvordan sikrer vi god forvaltning og etterprøvbarhet? Dokumentasjonskrav Begrunnelse for valg av opplysninger Hvordan algoritmen er trent opp Testing og revidering av systemet Dynamisk forvaltning Kontradiksjonsprinsippet Legalitetskontroll

Hvordan sikrer vi god forvaltning og etterprøvbarhet? Collibra som forvaltningsverktøy Oversikt over features/attributter Med vekting? Forsøke å sette opp beslutningstre Knytning mot ukurans i regelmotor

Hvordan sikrer vi god forvaltning og etterprøvbarhet?

Hvordan sikrer vi god forvaltning og etterprøvbarhet? Informasjonskrav Krav fra lovgiver Innsyn En enkel forklaring på logikken som ligger bak, og betydningen og forventede konsekvenser av den automatiserte behandlingen Informasjonen må gis før den automatiske behandlingen starter

Hvordan sikrer vi god forvaltning og etterprøvbarhet? Informasjonskrav Krav vi stiller oss selv Beslutningstrær Vektlegging av opplysninger Kobling mellom opplysninger Informasjon på lanekassen.no, personvernerklæring, informasjon på tildelingstidspunktet? Egen info i vedtak, eller kun ved forespørsel/klage?

Inn i black box eller ut av black box?