Prosjekt Talegjenkjenning på Norsk

Slides:



Advertisements
Liknende presentasjoner
hva betyr universell utforming i utvikling av gode lokalsamfunn?
Advertisements

Hvordan skrive en vitenskapelig artikkel?
YouTube Amerikansk nettside Gratis Video og musikk
Nytt fra IF Innhold • Justeringer på • Messer • Aftenposten-bilag • Studentum • Studiestart • Folkehøgskolekatalogen.
Del 2: Personlig økonomi.
5 Kultur.
Opprinnerlser, språk debatt, forskjeller og likheter.
Datakortet / Norsk Test
Høsten 2011 Laget av Gunvor Lund Solvang og Svein Einarsbøl
Arbeidsliv og rus. Generell del Grunnopplæring Januar/februar 2011 Bedriftssykepleier/HMS rådgiver Bodil Elise Gilje Tumyr.
Bryllupsgaver 2011 Christine Warloe, forbrukerøkonom Nordea
GREP (Kompetanseutvikling Grenland AS)
Lag film. Lag video •Videoteknologien har utviklet seg raskt de siste årene. Digital video er i ferd med å avløse analoge systemer. Med digital video.
Krabbe sesongen høsten 2011 Havbris jr
”Jeg reiser smart”-kampanjen 26. april – 12. juni 2010
PRESENTASJON. IFØLGE DISSE MÅLINGENE BRUKTE JEG MEST DATA OG TV, MEN DE BLE IKKE ELT NØYAKTIGE OG HELGEN VAR IKKE HELT VANLIG SIDEN JEG HADDE BURSDAG,
44 Hector om skikk og bruk I Norge
Det du nå vil se er en nyhet som kommer til å få store følger for hele verden...
Del 2: Personlig økonomi.
MS kap 61 Nye trender  Vi skal se på  Virtualisering  ”Cloud computing”
Sleepsafe DA - "never mind the bugs"
Senter for IKT i utdanningen Sylvi Barman-Jenssen.
Trond Nymark Siviløkonom NHH
Resultater Kundesenter
Arbeidsgivers losteam Arbeid og psykisk helse
STASJONSUNDERVISNING
Kommunestyremøte Levanger 21. mai 2008 Jan Arve Strand NAV Partnerskap.
Evaluering av J&Ds kommunikasjon mot målgruppa. Problemstilling Gruppen skal evaluere dagens kommunikasjon mellom Jenter og Data og mulige søkere i den.
Hvordan skrive en god utredning?
Bjørn Erik Sørli og Tore Tanem Talegjenkjenning Radiologi Gjøvik Fredag 3. desember 2010.
Berit Bratholm : BREDBÅNDSPROSJEKTET DIGITALE MAPPER OG SAMARBEIDSLÆRING.
LESER SØKER BOK LESER SØKER BOKS LESEÅRSPROSJEKT.
Et inkluderende arbeidsliv - en utnyttelse av individets ressurser Statssekretær Jan Erik Støstad Arbeids- og inkluderingsdepartementet 27. mars 2007.
Biblioteksentralens medietilbud
Kompensasjonsordninger for merverdiavgift Seilflyseksjonens ledermøte 10. april 2010 Arne Mathisen.
Jarl Formo: IKT i førskolealder UiA IKT I FØRSKOLEALDER: Fokus på barn med spesielle behov OVERSIKT  Hvilke barn snakker vi om?  Behov for.
Teknologisk påvirkning av barns oppvekst
Kvalitetsutviklingsplanen Oppsummering
De 100 mest brukte ordene i bøker i klasse..
Det digitale nettsamfunnet og helse. Kan vi skape morgendagens helseplan med gårsdagens løsninger?
MediaLT fagseminar 21 november IKT og universell utforming – måleindikatorer og status Rudolph Brynn Seniorrådgiver Nasjonalt dokumentasjonssenter.
10 regler for å skrive for web
100 lure ord å lære.
Einar Gudmundsson Smidig 2010 Et smidig prosjekt i England med et offshore team i India.
KVALITET I LÆRING MED DIGITALE MEDIER I TILPASSET OPPLÆRING Obligatorisk fremlegg IKT 2 4 mai 2011 Lise Meier 1.
Universell utforming i offentlige anskaffelser
Kapittel 36 Reza forteller om sin arbeidserfaring.
Informasjonssentral for fakta om norske massemedier
Tenk deg en landsby der det bor 100 mennesker. Tenk deg også at disse representerte verdens befolkning slik den er i dag i alle sine variasjoner. Da ville.
De 222 mest brukte ordene i det norske språket..
Evaluering av utbruddsvarslingssystemet Berit Tafjord Heier Avdeling for infeksjonsovervåking, FHI Smitteverndagene 2007.
Telenors satsing på fri programvare Paul Skrede - GoOpen 2009.
X10 webservices/IM -> mobilklient. Oppdragsgiver:
22. Mars  Hva er formålet med lesingen?  Lesing i alle fag.
IKT for funksjonshemmede Eksempler fra MediaLTs prosjektarbeid.
ByggSøk – fra papirmølle til tastetrykk
Studiebarometeret 2014 Resultater, metodikk og anvendelse Helge Sigurd Hansen 17.mars 2015.
Trafikantens mobile sanntidssystem Presentasjon INF5261.
Kap. 9 – Computer Intelligence How Information Technology Is Conquering the World: Workplace, Private Life, and Society Professor Kai A. Olsen,
Argumenterende tekster
Målgruppe Kjetil Aukland - BI Kristiansand. Kjetil Aukland Faglig leder BI Kristiansand PhD stipendiat Aalborg Universitet –Merkevare og Opplevelsesøkonomi.
Desimaltall.
FRiidrett 01/ Tamil sangam i Norge.
Universellforum 2016.
Digital startpakke kurs 3
Universellforum 2016.
Nye trender Vi skal se på Virtualisering ”Cloud computing”
Hvor går NAV i Hedmark? Satsinger i NAV, konsekvenser for forventninger til fastlegene 13.September 2017 Bjørn Lien, direktør NAV Hedmark.
RASKESTE VEI FRA TALE TIL TEKST!
Utskrift av presentasjonen:

Prosjekt Talegjenkjenning på Norsk Et Inkluderende arbeidsliv med talegjenkjenning 1

Prosjekt i regi av NAV Deltakere : Bengt Kjellså, InfoShare Solutions AS Daniel Scheidegger, NAV Kompetansesenter for tilrettelegging og deltakelse (NAV Tilde) Britt Ormaasen, Brukerrepresentant 2

Formål : Kartlegge behov Samfunnsmessig – Samfunnsøkonomisk Hva skal til for å få talegjenkjenning på Norsk 3

Målgruppen 78 000 funksjonshemmede står uten arbeid på tross av at de er arbeidssøkere NAV mål: flere med funksjonsnedsettelser i arbeid Personer med omfattende bevegelses- og synsvansker som ikke kan betjene PC med tastatur og mus I 2009 finner vi 46 550 personer med uføretrygd innen aktuelle diagnosegruppene. (se vår rapport) Muskel og skjelettlidelser er den hyppigste årsaken til en rekke trygdeytelser. De utgjorde 36 % av sykefraværstilfellene. Disse utgjorde til sammen 13 927 tapte årsverk i 2010.

Målgruppen fortsettelse Ut fra dette beregningsgrunnlaget vil 13 927 tapte årsverk utgjøre 9,4 milliarder kroner. Om talegjenkjenning på norsk kunne ha hindret bare 10 % av disse årsverkene, ville besparelsen på ett år utgjøre 941 millioner NOK. Lese- og skrivevansker Forum for lese og skrivevansker: Vi vet ikke hvor mange, men dersom en av fire som leser dårlig har nytte av talestøtte, utgjør det ca. 220 000 personer. Selv om bare en av 10 har nytte av talestøtte, utgjør det likevel om lag 90 000 personer i Norge. Kildene til ovennevnte tall finnes i rapporten til forprosjektet ”Norsk talegjenkjenning”. http://sikte.no/tg

Målgruppen fortsettelse Personer som ikke kan bruke tastatur og/eller mus Dysleksi Synshemninger Personer for eksempel fremmedspråklige med manglende skriveferdigheter Personer som trenger å skrive raskere enn de kan på tastaturet Forebygging mot belastningsskader Bruken av datamaskin i bil og andre steder hvor et tastatur er uhensiktsmessig mm.

Nuance Teknologifirma, programvare Mer enn 8.000 ansatte på verdensbasis Produkter Innovativ Kjøper opp mange selskaper 7

Nuance Stor satsning på taleteknologi Standard programvare Automatisk telefontjeneste TV teksting Interaktiv tale

Nuance viser at de kan Dragon Naturally Speaking (På mange språk) Dragon Dictate Dragon Search 9

Språkbanken Frigivelse av materiale fra NST (konkurs i 2003) : Datafiler Dokumentasjon 10

Vi ville Ikke finne opp hjulet på nytt Prøve å nyttiggjøre materialet fra NST 11

Språkmaterialet fra NST Pakket ut og systematisert Dokumentasjon oversatt til Engelsk Harddisk med data sendt til Nuance i USA 12

Tilgjengelig materiale for talegjenkjenning fra NST Norsk/Svensk/Dansk Leksikalske databaser Akustiske databaser 13

Materialet fra NST Opptak ligger som én lydfil pr. manuskriptlinje Forskjellige formater Mange forskjellige personer ble benyttet (18-70 år) Opptak for : Talegjenkjenning (ASR/diktering) Diktering Telefoni Med «nølelyder» 14

Materialet fra NST Dokumentasjonen viser at en stor del av innsamlingen av data er basert på direksjon fra L&H, som senere ble kjøpt opp av Nuance HVA BETYR DETTE ? 15

Nuance konklusjon Nuance i USA har undersøkt talekorpuser for de 3 skandinaviske språkene (norsk, svensk, dansk). Deres funn og anbefalinger er : Treningsdata : Audio data er av høy kvalitet, den oppleste talen kan brukes til å trene akustiske modeller for talegjenkjenning. Mengden av data er lik den datamangden som ble brukt for bygging av Dragon Naturally Speaking v10 for spansk, italiensk og nederlandsk. Testdata : Nuance har ikke de nødvendige data for å teste sine akustiske/språkmodeller. Det må innhentes ekstra korpuser som er aktuelle. 16

Kriterium Lydkvaliteten : Nuance undersøkte signal-til-støy forhold og fant at talekvaliteten var ganske god og egnet til våre formål. Fonetisk variasjon : Vårt mål er å bygge akustiske modeller for dikterings oppgaver. Det er viktig at den akustiske variasjonen i dataene er realistisk for dikterings bruk og ikke domineres av ord/uttrykk som er mindre vanlig i diktering. Eksempler på sistnevnte inneholder bokstaver, tall eller gjentakelser av samme ord/setning av flere personer. Basert på tidligere erfaring har vi lært at man trenger å luke ut slike ytringer for å kunne bygge opp realistiske trenings korpuser. Test utvalg : Et vanlig tema i den medfølgende korpus er bruken av «fonetisk balanserte setninger». Dette er et kunstig krav i bygging av dikterings systemer. Selv om vi kan filtrere vår trenings korpus til å bygge et sett med akustiske modeller, er det mye vanskeligere å bygge et test sett fra et slikt korpus. Derfor konkluderer vi med at det foreliggende materialet ikke er egnet for dette formålet. 17

Veien videre Skaffe penger 18

Samfunnsnytten Kostnaden for å videreutvikle dagens ledende programvare på markedet, er estimert til ca 13 millioner NOK. Dette utgjør omtrent det samme som uføretrygdkostnadene til 50 personer i ett år.

(under nyhets seksjonen). Rapport www.infoshare.no (under nyhets seksjonen). 20