Automatisk gjenkjenning av vanskelige navn

Slides:



Advertisements
Liknende presentasjoner
Skjønnlitterær fortelling
Advertisements

Hva slags spørsmål skal man stille på hvilke nivåer?
Riktig eller galt? Eller nesten riktig?. Det var elskere som skiltes seg med den største vanskeligheten. (2 feil) Jentene fikk ingen eller veldig litt.
EndNote Referanser i faglige arbeider Kristiansand Arthur N. Olsen.
Tillsetningstoffer – en verden ADDITIVE BROWSER. Aims of the project  Why did we choose this project ?  What kind of ideas we had ?  What did we want.
Kvinner Ser seg i speilet..
Verbal a) Form Verbalet blir dannet av verbene i setningen.
Hvordan utvikle og gjøre kandidater og parti kjent? - å drive kampanje.
Sett inn riktig tid/form av verbet
Lars Anders Kulbrandstad Høgskolen i Hedmark
44 Hector om skikk og bruk I Norge
Janne Bondi Johannessen Tekstlaboratoriet Universitetet i Oslo
LEDDSETNINGER Vedlejší věty.
Oppgave 42 Finn feilene i setningene, og gi forslag til riktige setninger. Her finnes det selvsagt mange muligheter og ikke én fasit.
Det er ganske underlig med disse sentrale salmene. Selv om du ikke er religiøs burde du lese dette.
Automatisk gjenkjenning av subjekt – og objektsfunksjon i norsk
Fra læreplanen i norsk:
Gøy med grammatikk Kurs på Elvebakken vgs 12. 2
Grammatikkspill for elever på Internett - bokmål og nynorsk
Om å skrive om litterære tekster
Kvalitetssikring av analyser til forskningsbruk
Member Access Ny prosedyre for registrering og innlogging på RI’s medlemsdatabase Member Access. Denne prosedyren gjelder ALLE rotarianere.
Prosjekt 45e - WebConcret
8.mars 09 Barnegudstjeneste Velkommen til
© UNIVERSITETETS SENTER FOR INFORMASJONSTEKNOLOGI UNIVERSITETET I OSLO USIT Side 1 HOUSTON Planene fremover.
PRONOMEN.
Kapittel 42 Religioner i Norge.
Lag leddsetninger med som
Kapittel 6 c Sett inn substantivene og adjektivene i riktig form
Pressekonferanse 6. mars 2009 Holdning til psykisk helsevern og tvangsbehandling Landsomfattende undersøkelse 5. – 16. februar 2009.
Hvordan lage seg en wikispaces Gå til bestem deg for hvilket wikispaces du vil ha (public, protected, private).
Piano og Klarinett Ragnar Freyr Olsen.
UNIVERSITETET I OSLO © TEKSTLABORATORIET Fefor 2003 Navnegjenkjenning for norsk med Constraint Grammar (CG) Andra Björk Jónsdóttir og Kristin Hagen Tekstlaboratoriet.
GØY MED GRAMMATIKK: KURS FOR LÆRERE 1. og 2. MARS 2004
Et møte med Gud og andre troende
Oppgave 12 side 117 – 121 i arbeidsboken
Ordklasser Inndelingen
Noregs teknisk-naturvitskaplege universitet Fakultet for xxxxxxxxxxxxxxxxxxxxxxxx xxxxxx xx xxxxxxxxxxxxxxxxxxxxxxx Institutt for xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx.
De 222 mest brukte ordene i det norske språket..
EN LITEN IDE SOM VOKSTE SEG STOR Som så ble til en aldri så liten kalender med jenter og kvinner... ”Pikekalenderen”
9. Product information Produktinformasjon. Online kjøp Som vi har sett har vi ikke noe produkt å se på, holde i, prøve ut, … Da må vi ta igjen på andre.
Object  Klassen i java  Alle klasser arver fra denne om ikke noe annet blir spesifisert  ArrayList.add(Object instans)  Alle elementer formes til Object.
Slik lager du sjablonger med Gimp!
Kapittel 15 På litteraturgruppe
Labov og Waletzky Narrativ analysis
Nettverk: Connect to success! Anne Gretland Partner Business and Development Lead, Microsoft Norway Leder og medgrunnlegger av Oda-Nettverk.
Kapittel 38 Petters familie.
Kapittel 11 Dåp og konfirmasjon i Den norske kirke
S TILLER TØFFERE KRAV TIL SKOLEELEVENE Side
Fattigdommen ingen ser
Janne Bondi Johannessen Tekstlaboratoriet Universitetet i Oslo
The Thompson Schools Improvement Project Process Improvement Training Slides (Current State Slides Only) October 2009.
Runar J. Liodden – prest i Modum Kristine Aksøy – seksjonsleder Kirkerådet Svend Klemmetsby – prost i Nordre Sunnmøre prosti.
SUBSTANTIV Mål: Kunne forklare hva et substantiv er.
Mappevurdering Mappe innebærer at elevene tar vare på ulike former for arbeid, slik at de kan dokumentere både den kompetansen de Definisjon Mappevurdering.
Oppgave 10 Sett inn riktig form av substantivet. Du må også sette inn bestemt / ubestemt artikkel der det er nødvendig. Torbjørn Egner - en folkekjær barnebokforfatter.
Relevant questions for the Reference Group
Mulig.
Ingerid S. Straume Akademisk Skrivesenter, UiO
Kapittel 1 Du og jeg I dette kapittelet skal du lære:
Welcome to an ALLIN (ALLEMED) workshop!
Kapittel 7 oppgave b b. Sett inn riktig form av substantivene og adjektivene, med artikkel hvis nødvendig.
Brukstips! Tekstfeltene i denne filen er vanlige tekstbokser. Du kan endre skrifttype, størrelse, flytte dem rundt og kopiere dem hvis du vil. Jeg syns.
Gøy med grammatikk Kurs på Elvebakken vgs 12. 2
Ved å stille spørsmålet får vi nyttig informasjon og innsikt i brukernes ønsker og behov.  Vi ønsker å gi brukerne en bedre hverdag ved å tilby tjenester.
Responsibility The purpose of the tutor reflections are to
Janne Bondi Johannessen Tekstlaboratoriet Universitetet i Oslo
V Tilpass dette banneret med din egen melding. Merk bokstaven og legg til egen tekst. Bruk ett tegn per lysbilde.
Sett inn substantivene og adjektivene i riktig form
Ord som beskriver En stor hatt Ei skummel rotte
Utskrift av presentasjonen:

Automatisk gjenkjenning av vanskelige navn Janne Bondi Johannessen, Universitetet i Oslo Paul Meurer, Universitetet i Bergen

Arbeidet inngår i to pågående prosjekter: Oslo-Bergen-taggeren (forbedring og videreutvikling) Nomen Nescio - En navnegjenkjenner for norsk, svensk og dansk (Samarbeid mellom UiO,UiB, GU, CST og Syddansk Universitet)

Innhold Nomen Nescio Gjenkjenning av lette navn Gjenkjenning av vanskelige navn Gjenkjenning av navn som består av fraser Dokumentbaseringsmetoden Navn først i setningen Kortversjoner av navn Implementeringi taggeren

Nomen Nescio Mål: Sette riktig navnekategori på navn i løpende tekst Navnekategorier: Person, sted, organisasjon, hendelse, verk, ting Måter: Regelbasert metode (Andra Björk Jonsdottir) Statistisk metode: (Åsne Haaland)

Navns flertydighet (i): Navnehomonymi: Arthur Andersen, Jens Evensen, (person- eller firmanavn?) Bondi, Asker, Guriby, Hanevold (person- eller stedsnavn?) Odin (Guds- eller firmanavn?)

Navns flertydighet (ii): Navnepolysemi: Aftenposten (ting, verk, firma eller sted?) Jeg kastet Aftenposten i søppelkassa. Jeg leste i Aftenposten at det er krig i Afghanistan. Jeg kjenner en som jobber i Aftenposten. Jeg går forbi Aftenposten hver dag.

Gjenkjenning av lette navn: I dag snør det. Snø er kaldt. Bjørn liker ikke snø. Kvist er det mye av t.v. Berg og fjell er typisk norsk. T.v. står Berg.

Oslo-Bergen-taggeren har gjettet riktig med ett unntak: "<I"<I>" "i" prep "<Snø>" "snø" subst mask appell ub ent "<Bjørn>" "Bjørn" subst mask prop "bjørn" subst mask appell ub ent "<Kvist>" "kvist" subst mask appell ub ent "<Berg>" "Berg" subst prop "<T.v.>" "t.v." fork adv prep+subst @adv

Gjenkjenning av vanskelige navn: Navn som består av fraser: Navn som er nominalfraser - bare første bokstav er stor: a. Den norske stat b. Institutt for lingvistiske fag c. Direktoratet for naturforvaltning d. Det historisk-filosofiske fakultet Navn som er nominalfraser - ett av leddene er et egennavn med stor bokstav: a. Mjær ungdomsskole b. Gjerdrum likningskontor og folkeregister c. Hungerholt gruppebolig d. Universitetet i Oslo e. Sentralsykehuset i Akershus

Navn som er nominalfraser - uforutsigbare store forbokstaver: a. Karihaugen Lakk og Karosseri b. Rens På Timen c. Den norske Kirken d. Kvebek Bygg og Fornyelse A/S

Navnemønstrene som regulære uttrykk (i) Bestemte krav til rekkefølge, morfosyntaktisk kategori, og leksem: Universitetet i Bergen: Substantiv i bestemt form og stor bokstav - "i" - Egennavn Den store oktoberrevolusjonen: Determinativ med stor bokstav - (adjektiv(er)) - substantiv Store Norske kullkompani: ((Adjektiv)er med stor bokstav) - substantiv

Navnemønstrene som regulære uttrykk (ii) Tåsen barnehage, Tåsen senter- og periferibarnehage, Bærum herredsrett: Egennavn - (Adjektiv(er)) - (substantiv - "og") - "*barnehage", "*råd", "*kontor", "*rett"..., Anne Grete Jensen: Egennavn - (Egennavn(pl)) Bærum Ved og Brensel A/S: Egennavn - Egennavn - "og" - Substantiv med stor bokstav - ("A/S", "AS")

Dokumentbaseringsmetoden McDonald (1996) Mikheev et al (1999, 2000…)

Gjenkjenning av frasenavn først i setningen Hvordan vite hva som er navn? Den lille jenta tenkte. Den norske kirkes ritualer var ganske tiltalende. Den lille jenta tenkte. Den norske kirkes ritualer var ganske tiltalende. Kanskje hun skulle melde seg inn i Den norske kirke?

Gjenkjenning av kortversjoner av frasenavn Den norske Lægeforening Lægeforeningen De store oktoberrevolusjonen Oktoberrevolusjonen Store Norske Kullkompani Kullkompaniet Norsk sykepleierforbund Sykepleierforbundet

Konteksten hjelper Petra er medlem i Den norske Lægeforening. Hun vil gjerne melde seg ut. Lægeforeningen gjør ikke nok for de svakeste i samfunnet.

Prøvetekst "Her er Gjerdrum likningskontor. Likningskontoret ligger rett ved Universitetet i Oslo. Rens På Timen er også i nærheten. Jeg liker Rens På Timen. Den norske lægeforening har mange medlemmer. Men Lægeforeningen er ikke så aktiv. Jeg synes Den norske lægeforening snart bør bli mer aktiv."

Web-grensesnitt .

Resultat 1: "<Gjerdrum likningskontor>" "Gjerdrum likningskontor" subst noeyt prop "<Likningskontoret>" "likningskontor" subst noeyt prop be ent "<Universitetet i Oslo>" "Universitetet i Oslo" subst prop "<Rens Rå Timen>" "Rens Rå Timen" subst prop "<Rens På Timen>" "Rens På Timen" subst prop

Resultat 2: "<Den norske lægeforening>" "<Lægeforeningen>” "Den norske lægeforening" subst prop "<Lægeforeningen>” "Lægeforeningen" subst prop "<Den norske lægeforening>”

What This Means Add a strong statement that summarizes how you feel or think about this topic Summarize key points you want your audience to remember

Next Steps Summarize any actions required of your audience Summarize any follow up action items required of you