Intro
Datalingvistikk i IT – språk, logikk, psykologi Jan Tore Lønning
To visjoner AI-visjonen (kunstig intelligens) –Språkforståing, –”Natural Language Understanding” Nyttevisjonen –Språkteknologi –”Language Technology”
Kan datamaskiner forstå? Visjon: –Intelligente maskiner –Maskiner som forstår –Roboter En slik maskin må: –Kunne snakke –Og lytte
Turingtesten
AI-visjonen Turingtesten, 1950 Eliza, Weizenbaum, 1967 SHRDLU, Winograd, 1971 Maskiner som kopierer/modellerer mennesker
Nyttevisjonen Mobiltelefoner –Stemmestyring –SMS (T9)
12 ABC3 DEF 4 GHI5 JKL6 MNO 7 PQRS8 TUV9 WXYZ *0 +# Å
12 ABC3 DEF 4 GHI5 JKL6 MNO 7 PQRS8 TUV9 WXYZ *0 +# År
12 ABC3 DEF 4 GHI5 JKL6 MNO 7 PQRS8 TUV9 WXYZ *0 +# Ære
12 ABC3 DEF 4 GHI5 JKL6 MNO 7 PQRS8 TUV9 WXYZ *0 +# Åpen
12 ABC3 DEF 4 GHI5 JKL6 MNO 7 PQRS8 TUV9 WXYZ *0 +# Åpen
12 ABC3 DEF 4 GHI5 JKL6 MNO 7 PQRS8 TUV9 WXYZ *0 +# Åpen f
12 ABC3 DEF 4 GHI5 JKL6 MNO 7 PQRS8 TUV9 WXYZ *0 +# Åpen få
12 ABC3 DEF 4 GHI5 JKL6 MNO 7 PQRS8 TUV9 WXYZ *0 +# Åpen dag
Nyttevisjonen Mobiltelefoner Ordprosessorer –Stavesjekking –Grammatikksjekking –Språkvalg
Nyttevisjonen Mobiltelefoner Ordprosessorer Maskinoversettelse –Forskningsområde siden ca 1950 –1949, Warren Weaver, 1950 Y. Bar-Hillel –Vekslende suksess og interesseVekslende suksess –Stort behov –Hjelpemiddel, om ikke helautomatisk
Nyttevisjonen: tekst Mobiltelefoner Ordprosessorer Maskinoversettelse Spørsmål-svar systemer Søking med forståelse
Nyttevisjonen: tale Dikteringssystemer Dialogsystemer Oversettelse
Språkteknologi – hva trengs? Maskinen må ha kunnskaper om språket. Disse må være representert i et format maskinen kan behandle. Maskinen utfører operasjoner på disse representasjonene.
Fra visjon til virkelighet Datalingvistikk (computational linguistics): –Grammatikk –Semantikk Informatikk: –Algoritmer –Programmering Logikk Statistikk
Grammatikk Chomsky, Syntactic structures, 1957Chomsky Generativ grammatikk:Generativ grammatikk –Endelig vokabular og endelig grammatikk –Beskriver uendelig mange setninger Viktig for programmeringsspråk Chomsky (og etterfølgere) gikk bort fra dette i lingvistikk
Grammatisk analyse Morfologi og taggingtagging Syntaktisk analyse (erg)erg
Semantikk Montague, 1970, formell semantikk Sammenhengen språklig mening – logikk: Logiske metoder sentrale i datalingvistikk (fra 80-tallet) Ordsemantikk (word net)word net Sokrates er et menneske Alle mennesker er dødelige Sokrates er dødelig
Statistikk Sentralt i taleteknologi Sentralt i anvendelser på 90-tallet Beskrivelse av store datamengder Hvordan skal statistikk og symbolske metoder forenes?
Fremtiden Vi vil se flere anvendelser Det er vanskelig å forutse hvor raskt utviklingen vil gå AI-tenkning vil komme tilbake i datalingvistikk og språkteknologi: –maskinlæring
Språkteknologi – hva trengs? Datateknologi - informatikk Hardware elektronikk Software Programmer Representasjoner Logikk
Språkteknologi – hva trengs? Datateknologi - informatikk Hardware elektronikk Software Programmer Representasjoner Logikk Språkvitenskap Grammatikk Statistiske språkmodeller Språkteknologi
Oppbygning
Oppbygning V3 H3HUMIT 3720 V2HUMIT 2720LING 1102 H2HUMIT 1750 V1Ex.FacINF 1010INF 1050 H1Ex.philHUMIT 1700HUMIT 1730
Eksempler på studieløp Eksempler på studieløp