1 Språkteknologiske løsninger for norsk og engelsk n prosjekter ved Institutt for moderne fremmedspråk/engelsk seksjon i samarbeid med Institutt for nordistikk.

Slides:



Advertisements
Liknende presentasjoner
1 NTNUs Multimediesenter 1.Integrasjon 2.Produksjon 3.Framtidsvisjon NTNUs Multimediesenter REN Medlemsmøte Trondheim 31. August 2005.
Advertisements

Etablering av effektiv produksjon på tvers av landegrenser
Fremtidens IKT-løsninger i plan og byggeprosessen en demonstrasjon.
Forskning.no: Erfaringer med et emnekart-basert nettsted Rådgiver Jon Solberg Norges forskningsråd.
Institutt for samfunnsforskning | Institute for social research | Hvordan lage gode surveyspørsmål? En kommentar Rune Karlsen.
Content Management på en ny måte Stian Danenbarger Creuna as.
Forskning og utvikling Hva bidrar biblioteket med?
B IBLIOTEKSKURS 2 INFORMASJONSSØK KILDEKRITIKK. ATEKST Du finner ATEKST i Fronter eller på bibliotekets forside. Kun datamaskiner på skolen har tilgang.
Systematisk bruk av klasseregler Introduksjon av klasseregler for å fremme konsentrasjon og god arbeidsinnsats Gunn Kragseth & Henry Liamo. Utadrettet.
2 Europass… åpner dører til utdanning og arbeid i Europa Bergen, Kjersti Skjervheim.
Samhandling: Metonymi, metafor og aspekt
Oppgaveløsning Metode og tilnærming.
Teknologiledelse 1 Hvordan utvikle produkter med høy designfokus Kristine Holbø SINTEF Teknologiledelse.
Gruppe 6 Gunnar Henrik Mathias Morten Ronny Svein Ivar.
Ikke kulturer møtes, men mennesker med ulik kulturell bakgrunn
Yrkesretting Seminar på Askøy videregående skole Tirsdag 20. august 2002 Innlegg ved Stein Dankert Kolstø, Institutt for praktisk pedagogikk.
Forskerskoler – nøkkelen til en bedre PhD-utdanning?
Gjør rede for relevante språklæringsteorier
Intro Datalingvistikk i IT – språk, logikk, psykologi Jan Tore Lønning.
Gjenfinningssystemer og verktøy II
Fremtidens elektriske energisystem er et Smart Grid
The Asgaard project: A task-specific framework for the application and critiquing of time- oriented clinical guideline (1998)
Modellbruk i Referansekatalogen Øyvind Aassve NorStella.
Språksystem og språkbruk
Tilpasset opplæring i en lærende skole
«Samhandlende lederskap for tjenester til utsatte barn og familier»: Hvem, hvordan og hvorfor? Hans A. Hauge Høgskolen i Telemark.
“Metonymi i orddannelse: russisk, tsjekkisk og norsk”
KJEMIKEREN: Utforsker Utforsker Bestemmer og beskriver hvordan stoffene er oppbygd Bestemmer og beskriver hvordan stoffene er oppbygd Forklarer stoffenes.
SAMFUNNSVITENSKAPELIGE PROBLEMSTILLINGER
Arbeid med bistand Rapportering.
© UNIVERSITETETS SENTER FOR INFORMASJONSTEKNOLOGI UNIVERSITETET I OSLO USIT Side 1 HOUSTON Planene fremover.
Statistikk på 20 2 timer PSY-1002
Velkommen til Medisinsk bibliotek
Språk og samfunn Saussures ”parole” - hva folk faktisk sier.
1 Organisering av kode (Kapittel 5). 2 Mål ● Forstå inkludering er og hvilken gevinst det gir ● Lære å utvikle egne funksjoner ● Forstå variablenes virkemåte.
MetaLib og SFX Demonstrasjon 16 oktober Program Utfordringer for bibliotek og brukere Hva er MetaLib og SFX? Live-demo Systemene i bruk Produkter.
Figur 1 Behov. Figur 2 Behov Figur 3 Prioritering/ressursinnsats.
NOKUT evaluering 2008 Ingeniørdidaktisk kurs Marte Bratseth Johansen Seksjon for universitetspedagogikk Program for lærerutdanning
Kvalitative og kvantitative metoder
Natalya Fridman Noy and Carole D. Hafner The State of the Art in Ontology Design Av Ida Kokkersvold.
Beskrivelse av gjennomføringsprosessen
Samhandling og informasjon Kunnskaps- utvikling og refleksjon Menings- danning og over- talelse Skrive- kompetanser Handlinger og formål Kunn- skaps- lagring.
Agenda: Kort gjennomgang av ARK, innhold og teori Gruppearbeid
Inflation og produktion 11. Makroøkonomi Teori og beskrivelse 4.udg. © Limedesign
Arbeidsmiljø- og klimaundersøkelser (ARK)
1 Universitetsbiblioteket i Trondheim Innlegg på Nordisk sommerskole for informasjonskompetanse Finland, Tusby, Gustavelund, 29. juni 2005 Anne L. Lorange,
Arbeidsmiljø- og klimaundersøkelser (ARK)
1 Øystein Nytrø Department of computer and information science Norwegian University of Science and Technology TDT4210 Helseinformatikk Kursintroduksjon.
1 GeoPortal – Rammeverk Introduksjon. 2 Teknisk rammeverk - Interoperabilitet Interoperabilitet evne til å kommunisere, kjøre programmer, eller overføre.
Introduksjon Pensum: Olsen, K.A. The Internet, the Web and eBusiness, Formalizing applications for the real world, Scarecrow Press, 2005.
Kapittel 1, oppgave i) Sett inn preposisjoner eller adverb som passer.
Kunstig intelligens (MNFIT-272) - høst Forelesning 11 Emner: Forskningsmetodikk innen Kunstig intelligens - Revidert definisjon - AI som empirisk.
Befolkning og arbejdsmarked 7. Mikroøkonomi Teori og beskrivelse © Limedesign
Emner: Kunstig intelligens (IT-2702) Forelesning 11 •
Aktør-nettverk  Kort intro  Marc Berg (1997): On Distribution, Drift and the Electronic Medical Record  Margunn Aanestad (2003): The Camera as an Actor.
Personlighetspsykologi - PSY 2600
Organisasjoner setter oss i en spesiell kontekst (sammenheng) som gjør at vi tenker og handler på spesielle måter. Dette kalles organisasjonsatferd.
Matematikkens Hva? Hvordan? Hvorfor?
1 Kap. 59 – Automatic Translation How Information Technology Is Conquering the World: Workplace, Private Life, and Society Professor Kai A. Olsen, Universitetet.
Verbal kommunikasjon Nina Bell Rui Aadna,
Emnebeskrivelse Matematikk spiller en stor rolle i moderne samfunnsliv. Kunnskaper i matematikk er ofte avgjørende for yrkesvalg og senere karriere.
Introduksjon til kognisjonsvitenskaper 5. forelesning
Videregående matematikkopplæring Matematikk og minoritetselever Tverrfaglig prosjekt Lisbet karlsen.
Kvalitative og kvantitative metoder
Litt om å skrive forvaltningsinformatikk
Organisasjonsteorier i et historisk perspektiv
Praksisnærforskning – perspektiv og metoder
- . ' ' INFORMATIKK KUNSTIG INTELLIGENS (AI) STUDIE AV INTELLIGENTE
Litt om å skrive forvaltningsinformatikk
Utskrift av presentasjonen:

1 Språkteknologiske løsninger for norsk og engelsk n prosjekter ved Institutt for moderne fremmedspråk/engelsk seksjon i samarbeid med Institutt for nordistikk og litteraturvitenskap

2 Oversikt n n Medvirkende/ressurspersoner n n Hovedmål n n Litt førhistorie - EDIT-prosjektet n n Problemstillinger omkring kunnskaps- /leksikalske databaser n n Tankegangen (ideologien) bak dette prosjektet

3 Oversikt n n Lignende systemer Potensielle anvendelser/bruk av det kontrastive leksikonet Framtidige perspektiver

4 Medvirkende/ressurspersoner Mila Vulchanova, IMFS, Engelsk seksjon n n Tor Anders Åfarli, INL n n Dawn Behne, IMFS, Engelsk seksjon n n Anja Angelsen, vit.ass. EDIT- prosjektet, IMFS, Engelsk seksjon n Ann Jorid Klungervik Greenall, post.dok., IMFS, Engelsk seksjon n Helene Hauge, NFR-stipendiat, IMFS, Engelsk seksjon n Kristin Mellum Eide, post.dok., Institutt for datateknikk og informasjonsvitenskap n Kristian Skarbø, vit.ass. EDIT- prosjektet

5 Hovedmål F lingvistikk kunnskap konkrete språk datalingvistikkKunstig Intelligens kognitiv vitenskap nevrolingvistikk, statistikk F etablere en bred tverrfaglig samarbeidskonstellasjon, med deltakere med bakgrunn i lingvistikk (f.eks. syntaks og semantikk og grensesnittet mellom syntaks og semantikk) samt kunnskap om strukturen til konkrete språk (engelsk og norsk), datalingvistikk, Kunstig Intelligens (KI-), kognitiv vitenskap (Cognitive Science), nevrolingvistikk, statistikk

6 Hovedmål   evaluere og utrede løsninger innen leksikalske databaser og deres anvendelse i maskinoversettelse og språkteknologi F F utvikle et kollokasjonsbasert kontrastivt leksikon for norsk og engelsk

7 Litt førhistorie F F EDIT-prosjektet, fundert på praktisk språkarbeid og komparativ språkforskning og terminologiforskning F F Prosjektet er selvfinansierende gjennom språkarbeide, oversettelse av vitenskapelige artikler fra norsk til engelsk og språkvask/korrekturlesing

8 EDIT-prosjektet   Hovedmålsettinger i EDIT: søkbar webgrensesnitt konkordanseverktøy på avsnittsnivå å bygge en søkbar database over oversatte paralelle tekster med et webgrensesnitt der man ved hjelp av et konkordanseverktøy kan søke etter ord og fraser i begge språkene og finne ekvivalenter mellom de to språkene på avsnittsnivå. Databasen er publisert på nettet ( og materiale suppleres kontinuerlig.

9 EDIT-prosjektet n tospråklig terminologidatabase n på sikt å bygge ut Edit-basen til en tospråklig terminologidatabase for norsk og engelsk, med hovedvekt på humaniora og samfunnsvitenskapene, bl.a. basert på egne oversettelsesarbeider

10 n TerminologiNet hierarkisk struktur n på langt sikt å utvikle videre terminologidatabasen til en slags TerminologiNet for enkelte tverrfaglige områder der begrep og termin er representert i en hierarkisk struktur

11 EDIT-prosjektet F F EDIT kan defineres som et prosjekt av typen translation workstation (lignende prosjekter i Norge: Magnar Brekke sitt KUNSTI project Kunnskapsbase for norsk økonomisk- administrativt fagdomene (KB-N))

12 Problemstillinger omkring kunnskaps/leksikalske databaser F F Hvorfor er leksikonet en viktig ressurs? g g leksikalsk kunnskap ligger til grunn for all slags naturlig språkprosessering (lexical access, comprehension tasks, production tasks)

13 Problemstillinger omkring kunnskaps/leksikalske databaser g g ingen grammatikk uten leksikon (ord), moderne psykolingvistiske og kognitive studier (Bates & Goodman 1997) peker på en sterk korrelasjon mellom ”vocabulary size and grammar competence” i språktilegnelse

14 Problemstillinger omkring kunnskaps/leksikalske databaser F Hva slags informasjon skal inngå i et leksikon? g Morfologi (enten med mulighet for generering av potensielle ordformer eller som en liste av ordformer, eller begge to) g Ordkategori, semantiske trekk, kollokasjonspotensiale

15 Problemstillinger omkring kunnskaps/leksikalske databaser FProblemer og behov g Storskala leksikalske ressurser (Large- scale lexical resources) som kan anvendes og gjenbrukes i forskjellige applikasjons rammeverk g tilgjengelighet   How sophisticated can a system afford to be?

16 Tankegangen (ideologien) bak dette prosjektet komplekst system størst mulig kunnskap om de komplekse prosessene som ligger til grunn i språklig prosessering og produksjon generelt i naturlig språk Språk er et komplekst og sammensatt system. For å kunne utvikle hensiktsmessige og godt fungerende teknologiske verktøy for språklig prosessering og generering i enkeltspråk er det nødvendig å ha størst mulig kunnskap om og forståelse for de komplekse prosessene som ligger til grunn i språklig prosessering og produksjon generelt i naturlig språk (som f.eks. ‘real-time’ prossesser og lignende; langtids- og korttidshukommelsens rolle)

17 Tankegangen (ideologien) bak dette prosjektet hvordan kunnskap og ferdigheter er representert og strukturertkunnskapsdomener tilgangtil eksisterende kunnskap Legge vekt på og integrere moderne kognisjonsvitenskapelige perspektiver på hvordan kunnskap og ferdigheter er representert og strukturert (f.eks. i kunnskapsdomener og hvordan man får tilgang (access) til eksisterende kunnskap når man trenger det (f.eks. gjennom problembaserte prosesser, analogisk tenkning osv.) Slike tilnærminger er svært viktige i representasjonen av språkkunnskaper og ferdigheter.

18 Tankegangen (ideologien) bak dette prosjektet n nettverk nevrale nettverkssystemer n Modelleringen av språkkunnskapsbaser som nettverk som innebærer at ord f.eks. er enheter i et nettverk med lenker mellom de individuelle enhetene og aktiveringen av en enhet (ord) forårsaker aktivering av en del andre som er assosiert med den gjennom lenker (denne tilnærmingen er lik den som brukes i nevrale nettverkssystemer)

19 Tankegangen (ideologien) bak dette prosjektet n Nettverksperspektivet inheritance networks n Nettverksperspektivet ligger til grunn for mange moderne teorier om språkkunnskaper der leksikalsk og grammatisk kunnskap er strukturert i inheritance networks (f.eks. Koenig et al.2002, Kay & Fillmore 1997, Fillmore et al FrameNet project ( Croft 2001)

20 Tankegangen (ideologien) bak dette prosjektet n dynamiske teorierom kategorisering variasjon mellom individer hos samme individ kontekstfrekvens n Utforske anvendelsen av dynamiske teorier om kategorisering (f.eks. Barsalou 1999) som ser på konsepter som dynamiske fenomen med potensiale for variasjon mellom individer (intersubjektivitet) og hos samme individ (intrasubjektivitet) der kontekst og frekvens spiller en viktig role.

21 Tankegangen (ideologien) bak dette prosjektet n ekvivalenser mellom språk over ordnivå minimale konteksten umiddelbare kollokosasjonen n Dynamiske teorier er svært viktige for beskrivelsen av ekvivalenser mellom språk over ordnivå. Av avgjørende betydning i språk der betydning varierer fra en kontekst til en annen. Den minimale konteksten kan defineres som den umiddelbare kollokosasjonen for enhver ord/frase.

22 Kontekst: et eksempel a tall man/tree/glass *a tall wall a high wall/block of flats *a high man/tree

23 Materiale til leksikonprosjektet F F datasamlinger fra kontrastive studier som allerede er utført F F eksisterende datakorpuser

24 Lignende systemer the WordNet project (an electronic lexical database, with nouns, verbs, adjectives and adverbs organized into synonym sets, each representing a lexicalized concept; the synonym sets are linked by different relations); CogPrime; Fra parallellkorpus til ordnett, UiB

25 Potensielle anvendelser/bruk av det kontrastive leksikonet F F tesaurus i translation workstations (arbeidsbenker for oversettelse) F F i maskinoversettelse (machine translation systems) F F som redskap for å utføre søk i kunnskapsdatabaser

26 Perspektiver fremover n n kontrastiv grammatikk: kontrastiv studie på setningsnivå