Automatisk indeksering

Slides:

Advertisements

Liknende presentasjoner

Astrid Øksenvåg Rådgiver EKOR AS

Advertisements

Erfaring fra parallellrapportering Kapitaldekningsrapportering i 2007

Klikk Aktiver redigering i meldingsfeltet,

v/Tormod Engebu, IKAVA KDRS 13. november 2013

Veiledning i gevinstrealisering ved innføring av elektronisk handel

Kostnadsbilder i pleie og omsorg

Vurdering av nettstedet ”Paper online” Et midt på treet greit nettsted om resirkulering av papir!

ISO 9000:2000 Prosessorientering v/Per L. Berge Excellence Norway

Markeder med asymmetrisk informasjon

Artikkeldatabaser - fellestrekk • Enkel/simpel search og et avansert søkebilde • Feltsøk • Operatorene and – or – not • Nærhetsoperatorene same- near(nX)-

BIBSYS Brage. BIBSYS Brage – kort fortalt BIBSYS Brage gjør det lett å publisere og formidle institusjonens forsknings- og studentarbeider. Hver institusjon.

1 Populasjonsgenetikk BI3010-H05 Halliburton Kap.1 TERMINOLOGI  Populasjonsgenetikk er læren om genenes fordeling i tid og rom, og om de evolusjonære.

1 Hva så vi på når vi vurderte system for nettbasert læring? •a) Terskel for bruk •b) Terskel for gjenbruk •c) Kommunikasjon og samarbeidsmuligheter i.

Visma Enterprise introduksjonspresentasjon Hvordan bruke ny meny i Visma Enterprise HELHETLIG LØSNING FOR NORSKE VIRKSOMHETER Moderne og effektiv tjenesteproduksjon.

1 Arbeidsgruppens forslag til klassifikasjon av læringsobjekter Berit Rolandsen, 2003.

Gøy med grammatikk Kurs på Elvebakken vgs 12. 2

Gjenfinningssystemer og verktøy II

1 Nasjonale retningslinjer for indeksering Jon Anjer

Android-Programmering Våren Oversikt – PendingIntents Rollen til PendingIntents Vanlig bruk Deling Sending.

In 102 – Innføring i informasjonsbehandling Tekstbehandling forelesning V2005 Ola Bø.

BS emneord Kjersti Feiring Myrtrøen Bibliotekmøtet Hamar 2010.

1 Skal vi snakke sammen? Jan Håvard Skjetne SINTEF / University of Melbourne

Forside/oversikt Fag / tema Forming, matematikk, symmetri, geometri

Kodegjennomgang Thommy Bommen & Jarle Søberg Computas AS.

High Five Driven Development! Peder Søholt. Øk motivasjonen din! Vi speiler oss selv ofte i andres følelser Øk motivasjonen til andre, og du vil øke din.

Statistikk på 20 2 timer PSY-1002

Agenda Velkommen til nye medlemmer!

HØGSKOLEN I AGDER Agder University College © Bjørn Olav Hogstad, HiA, 2002 HØGSKOLEN I AGDER Agder University College Word - maler 1 DAT100 TEMA: Maler.

Digitaliserer papirflyt

Taksonomi: Klassifikasjon; indeksering

Å forklare sosiale fenomener

Telefonresponstid ved fastlegekontorene i Tromsø november 2005 Kommuneoverlege Anne Helen Hansen Anne Helen Hansen, kommuneoverlege i Tromsø.

Ny læreplan, nye utfordringer

Gjenbruk av data fra elektroniske pasientjournaler Foreløpige erfaringer fra Regionsykehuset i Trondheim m.h.t. lokalisering og ekstraksjon av informasjon.

Finne og gå til et chatterom Bruk søk i Lync til å finne rom som du har tilgang til. 1.I hovedvinduet i Lync klikker du kategorien Chatterom. 2.I søkeboksen.

Ett skritt foran 3 © Iréne Johansson 1 Ett skritt foran 3 Velkommen! Kursmøte 1-1 – den enkle setningen og samtalen.

 Kursholder: Lars Jøraas  3 timers basiskurs..  Hva er forskjellen mellom å skrive for web og skrive for papirutskrifter?  Det er slitsomt å lese.

Erfaringer med forebyggende helsearbeid og effekter av tiltak i bydel

Høgskolen i Oslo Nettbasert samarbeidslæring Deltid studieår Felles forfatterskap på nettet ved hjelp av Task 2.0 En kort innføring laget av Sissel.

Stilistikk 3 en del av den klassiske retorikken:.

Generell avl og genomisk seleksjon

Tekstbehandleren som planleggingsverktøy Basert på opplegg av VB For A /06.

DRI2020 Rettskilder og informasjonssøking -oppsummering Dag Wiese Schartum.

Fra database til kart Joel Priestley og Anders Nøklestad Seminar om kartproduksjon ved HF Universitetet i Oslo 27. januar 2015.

Internasjonale menneskerettigheter

Kapittel 4: Den kognitive modellen. Innhold  Dynamic memory  MOP  TOP  Indeksering av cases  To eksempelprogrammer  CYRUS  CELIA  Oppsummering.

Masterskolen 2012 : Introduksjon Opplegget for Masterskolen –Opplegget, timeplan med mer Elementene i en masteroppgave –Teori, metode og empiri (data)

Forskningsopplegg og metoder

2003 Ontopia AS1 Tanker om standarder for e-læring Emnekart og published subjects Lars Marius Garshol, utviklingsleder Ontopia,

STRATEGIPROFILEN VED NHH

BEDRE Å KUNNE LITT ENN INGENTING

Se hvordan jeg smart bruker Outlook 2010

Krav til sikring av personopplysninger Prof. Dag Wiese Schartum, AFIN.

Utvalg og datainnsamling Typer av data: Data innhentet for å belyse en spesiell problemstilling (egne data)‏ Data frambrakt uavhengig av problemstillingen.

Språklig variasjon LUT 2 HØST Oversikt over emnet  Språklig variasjon – hva er det?  Språk og dialekt  Språk og identitet  Språklig variasjon.

RIS-metoden for prosessforbedring

DRI2020 Rettskilder og informasjonssøking -oppsummering

Presentere en teknisk rapport

SiriLundinKeller-ILS-Universitetet i Oslo

UBOs frokostmøte 12. juni 2015 Are Gulbrandsen & Dan Michael O. Heggø

Prosjekt og forskningsrapport

DRI2020 Rettskilder og informasjonssøking -oppsummering

Fra det ene til det andre -

Kostnadsbilder i pleie og omsorg

Inntektsbestemmelsen i en åpen økonomi. Multiplikatorprinsippet

Gøy med grammatikk Kurs på Elvebakken vgs 12. 2

Vurderingskriterier enkel versjon

Inntektsbestemmelsen i en åpen økonomi. Multiplikatorprinsippet

DRI2020 Rettskilder og informasjonssøking -oppsummering

Utskrift av presentasjonen:

Automatisk indeksering Grunnlag: dokumentets eget vokabular Prinsipp statistisk lingvistisk Ulike seleksjons- og vektingsprinsipper fjern høy- og/eller lavfrekvente termer gi vekt i henhold til termforekomst i dokumentet termforekomst i hele dokumentsamlingen dokumentlengde

Ulike grader av automatisering Seleksjon av felter for indeksering ”Relevance feedback” Verdi-angivelse for eksempel via lenkeinformasjon

Lingvistisk kunnskap Fraser Syntaktiske roller Homonym-avklaring

Automatisk vs. manuell Dokumentbasert indeksering Spørsmålsbasert indeksering

Automatisk vs. manuell Cranfield I Cranfield II Ulike beskrivelser (emneord, Klass.) jevngode liten forskjell på erfaren og uerfaren indekserer liten effekt ved tidsbruk over 4 min/dok Cranfield II enkelttermer hentet fra dok.tekst mest effektive bare enkel synonymkontroll og ordform-sammenføring viste litt forbedring

Automatisk vs. manuell SMART / MEDLARS 40% av relevante dok. funnet med begge system Automatisk og manuell jevngode

Kunnskap om automatisk indeksering Svært forskjellige gjenfinningsmetoder gir jevngodt resultat Typisk søkeresultat: 10-13 relevante blant 30 først gjenfunne Lingvistiske metoder ikke bedre enn statistiske Raffinerte metoder ikke bedre enn enkle

Kunnskap om automatisk indeksering Liten effekt ved bruk av tesauri eller andre indekseringshjelpemidler Effekt oppnås ved gjennomtenkt frekvensvekting sammenføring av grammatikalske varianter automatisk (eller manuell) spørsmålsutvidelse ”Query development the most critical factor in retrieval”

Utvikling av automatisk indeksering Automatisk kategorisering Subdokumenter (avsnittsindeksering)

Formål med manuell indeksering Samle ulike vokabularer / terminologi / språk Tilpasning til spesielle brukergrupper Vokabularassistanse til bruker Styrt spesifisitetsnivå Gjenfinning over tid Navigering i beslektede emner

Problemer med manuell indeksering Konsistens i indeksering Pris og kapasitet Tilpasning til brukerbehov og - språkbruk Prinsippet om ”konstant intellektuell kapital”