Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

Prosjekt Talegjenkjenning på Norsk Et Inkluderende arbeidsliv med talegjenkjenning.

Liknende presentasjoner


Presentasjon om: "Prosjekt Talegjenkjenning på Norsk Et Inkluderende arbeidsliv med talegjenkjenning."— Utskrift av presentasjonen:

1 Prosjekt Talegjenkjenning på Norsk Et Inkluderende arbeidsliv med talegjenkjenning

2 Prosjekt i regi av NAV Deltakere :  Bengt Kjellså, InfoShare Solutions AS  Daniel Scheidegger, NAV Kompetansesenter for tilrettelegging og deltakelse (NAV Tilde)  Britt Ormaasen, Brukerrepresentant

3 Formål :  Kartlegge behov Samfunnsmessig – Samfunnsøkonomisk  Hva skal til for å få talegjenkjenning på Norsk

4 Målgruppen  funksjonshemmede står uten arbeid på tross av at de er arbeidssøkere  NAV mål: flere med funksjonsnedsettelser i arbeid  Personer med omfattende bevegelses- og synsvansker som ikke kan betjene PC med tastatur og mus  I 2009 finner vi personer med uføretrygd innen aktuelle diagnosegruppene. (se vår rapport)  Muskel og skjelettlidelser er den hyppigste årsaken til en rekke trygdeytelser. De utgjorde 36 % av sykefraværstilfellene.  Disse utgjorde til sammen tapte årsverk i 2010.

5 Målgruppen fortsettelse •Ut fra dette beregningsgrunnlaget vil tapte årsverk utgjøre 9,4 milliarder kroner. Om talegjenkjenning på norsk kunne ha hindret bare 10 % av disse årsverkene, ville besparelsen på ett år utgjøre 941 millioner NOK. •Lese- og skrivevansker •Forum for lese og skrivevansker: Vi vet ikke hvor mange, men dersom en av fire som leser dårlig har nytte av talestøtte, utgjør det ca personer. Selv om bare en av 10 har nytte av talestøtte, utgjør det likevel om lag personer i Norge. Kildene til ovennevnte tall finnes i rapporten til forprosjektet ”Norsk talegjenkjenning”.

6 Målgruppen fortsettelse  Personer som ikke kan bruke tastatur og/eller mus  Dysleksi  Synshemninger  Personer for eksempel fremmedspråklige med manglende skriveferdigheter  Personer som trenger å skrive raskere enn de kan på tastaturet  Forebygging mot belastningsskader  Bruken av datamaskin i bil og andre steder hvor et tastatur er uhensiktsmessig  mm.

7 Nuance  Teknologifirma, programvare  Mer enn ansatte på verdensbasis  Produkter  Innovativ  Kjøper opp mange selskaper

8 Nuance  Stor satsning på taleteknologi  Standard programvare  Automatisk telefontjeneste  TV teksting  Interaktiv tale

9 Nuance viser at de kan  Dragon Naturally Speaking (På mange språk)  Dragon Dictate  Dragon Search

10 Språkbanken Frigivelse av materiale fra NST (konkurs i 2003) :  Datafiler  Dokumentasjon

11 Vi ville  Ikke finne opp hjulet på nytt  Prøve å nyttiggjøre materialet fra NST

12 Språkmaterialet fra NST  Pakket ut og systematisert  Dokumentasjon oversatt til Engelsk  Harddisk med data sendt til Nuance i USA

13 Tilgjengelig materiale for talegjenkjenning fra NST  Norsk/Svensk/Dansk  Leksikalske databaser  Akustiske databaser

14 Materialet fra NST  Opptak ligger som én lydfil pr. manuskriptlinje  Forskjellige formater  Mange forskjellige personer ble benyttet (18-70 år) Opptak for :  Talegjenkjenning (ASR/diktering)  Diktering  Telefoni  Med «nølelyder»

15 Materialet fra NST Dokumentasjonen viser at en stor del av innsamlingen av data er basert på direksjon fra L&H, som senere ble kjøpt opp av Nuance HVA BETYR DETTE ?

16 Nuance konklusjon Nuance i USA har undersøkt talekorpuser for de 3 skandinaviske språkene (norsk, svensk, dansk). Deres funn og anbefalinger er : Treningsdata : Audio data er av høy kvalitet, den oppleste talen kan brukes til å trene akustiske modeller for talegjenkjenning. Mengden av data er lik den datamangden som ble brukt for bygging av Dragon Naturally Speaking v10 for spansk, italiensk og nederlandsk. Testdata : Nuance har ikke de nødvendige data for å teste sine akustiske/språkmodeller. Det må innhentes ekstra korpuser som er aktuelle.

17 Kriterium Lydkvaliteten : Nuance undersøkte signal-til-støy forhold og fant at talekvaliteten var ganske god og egnet til våre formål. Fonetisk variasjon : Vårt mål er å bygge akustiske modeller for dikterings oppgaver. Det er viktig at den akustiske variasjonen i dataene er realistisk for dikterings bruk og ikke domineres av ord/uttrykk som er mindre vanlig i diktering. Eksempler på sistnevnte inneholder bokstaver, tall eller gjentakelser av samme ord/setning av flere personer. Basert på tidligere erfaring har vi lært at man trenger å luke ut slike ytringer for å kunne bygge opp realistiske trenings korpuser. Test utvalg : Et vanlig tema i den medfølgende korpus er bruken av «fonetisk balanserte setninger». Dette er et kunstig krav i bygging av dikterings systemer. Selv om vi kan filtrere vår trenings korpus til å bygge et sett med akustiske modeller, er det mye vanskeligere å bygge et test sett fra et slikt korpus. Derfor konkluderer vi med at det foreliggende materialet ikke er egnet for dette formålet.

18 Veien videre Skaffe penger

19 Samfunnsnytten Kostnaden for å videreutvikle dagens ledende programvare på markedet, er estimert til ca 13 millioner NOK. Dette utgjør omtrent det samme som uføretrygdkostnadene til 50 personer i ett år.

20 Rapport (under nyhets seksjonen).


Laste ned ppt "Prosjekt Talegjenkjenning på Norsk Et Inkluderende arbeidsliv med talegjenkjenning."

Liknende presentasjoner


Annonser fra Google