Automatisk indeksering

Slides:



Advertisements
Liknende presentasjoner
Astrid Øksenvåg Rådgiver EKOR AS
Advertisements

Erfaring fra parallellrapportering Kapitaldekningsrapportering i 2007
Klikk Aktiver redigering i meldingsfeltet,
v/Tormod Engebu, IKAVA KDRS 13. november 2013
Veiledning i gevinstrealisering ved innføring av elektronisk handel
Kostnadsbilder i pleie og omsorg
Vurdering av nettstedet ”Paper online” Et midt på treet greit nettsted om resirkulering av papir!
ISO 9000:2000 Prosessorientering v/Per L. Berge Excellence Norway
HVA ER ?.
Markeder med asymmetrisk informasjon
Artikkeldatabaser - fellestrekk • Enkel/simpel search og et avansert søkebilde • Feltsøk • Operatorene and – or – not • Nærhetsoperatorene same- near(nX)-
BIBSYS Brage. BIBSYS Brage – kort fortalt BIBSYS Brage gjør det lett å publisere og formidle institusjonens forsknings- og studentarbeider. Hver institusjon.
1 Populasjonsgenetikk BI3010-H05 Halliburton Kap.1 TERMINOLOGI  Populasjonsgenetikk er læren om genenes fordeling i tid og rom, og om de evolusjonære.
1 Hva så vi på når vi vurderte system for nettbasert læring? •a) Terskel for bruk •b) Terskel for gjenbruk •c) Kommunikasjon og samarbeidsmuligheter i.
Visma Enterprise introduksjonspresentasjon Hvordan bruke ny meny i Visma Enterprise HELHETLIG LØSNING FOR NORSKE VIRKSOMHETER Moderne og effektiv tjenesteproduksjon.
1 Arbeidsgruppens forslag til klassifikasjon av læringsobjekter Berit Rolandsen, 2003.
Gøy med grammatikk Kurs på Elvebakken vgs 12. 2
Gjenfinningssystemer og verktøy II
1 Nasjonale retningslinjer for indeksering Jon Anjer
Android-Programmering Våren Oversikt – PendingIntents Rollen til PendingIntents Vanlig bruk Deling Sending.
In 102 – Innføring i informasjonsbehandling Tekstbehandling forelesning V2005 Ola Bø.
BS emneord Kjersti Feiring Myrtrøen Bibliotekmøtet Hamar 2010.
1 Skal vi snakke sammen? Jan Håvard Skjetne SINTEF / University of Melbourne
Forside/oversikt Fag / tema Forming, matematikk, symmetri, geometri
Kodegjennomgang Thommy Bommen & Jarle Søberg Computas AS.
High Five Driven Development! Peder Søholt. Øk motivasjonen din! Vi speiler oss selv ofte i andres følelser Øk motivasjonen til andre, og du vil øke din.
Statistikk på 20 2 timer PSY-1002
Agenda Velkommen til nye medlemmer!
HØGSKOLEN I AGDER Agder University College © Bjørn Olav Hogstad, HiA, 2002 HØGSKOLEN I AGDER Agder University College Word - maler 1 DAT100 TEMA: Maler.
Digitaliserer papirflyt
Taksonomi: Klassifikasjon; indeksering
Å forklare sosiale fenomener
Telefonresponstid ved fastlegekontorene i Tromsø november 2005 Kommuneoverlege Anne Helen Hansen Anne Helen Hansen, kommuneoverlege i Tromsø.
Ny læreplan, nye utfordringer
Gjenbruk av data fra elektroniske pasientjournaler Foreløpige erfaringer fra Regionsykehuset i Trondheim m.h.t. lokalisering og ekstraksjon av informasjon.
Finne og gå til et chatterom Bruk søk i Lync til å finne rom som du har tilgang til. 1.I hovedvinduet i Lync klikker du kategorien Chatterom. 2.I søkeboksen.
Ett skritt foran 3 © Iréne Johansson 1 Ett skritt foran 3 Velkommen! Kursmøte 1-1 – den enkle setningen og samtalen.
 Kursholder: Lars Jøraas  3 timers basiskurs..  Hva er forskjellen mellom å skrive for web og skrive for papirutskrifter?  Det er slitsomt å lese.
Erfaringer med forebyggende helsearbeid og effekter av tiltak i bydel
Høgskolen i Oslo Nettbasert samarbeidslæring Deltid studieår Felles forfatterskap på nettet ved hjelp av Task 2.0 En kort innføring laget av Sissel.
Stilistikk 3 en del av den klassiske retorikken:.
Generell avl og genomisk seleksjon
Tekstbehandleren som planleggingsverktøy Basert på opplegg av VB For A /06.
DRI2020 Rettskilder og informasjonssøking -oppsummering Dag Wiese Schartum.
Fra database til kart Joel Priestley og Anders Nøklestad Seminar om kartproduksjon ved HF Universitetet i Oslo 27. januar 2015.
Internasjonale menneskerettigheter
Kapittel 4: Den kognitive modellen. Innhold  Dynamic memory  MOP  TOP  Indeksering av cases  To eksempelprogrammer  CYRUS  CELIA  Oppsummering.
Masterskolen 2012 : Introduksjon Opplegget for Masterskolen –Opplegget, timeplan med mer Elementene i en masteroppgave –Teori, metode og empiri (data)
Forskningsopplegg og metoder
2003 Ontopia AS1 Tanker om standarder for e-læring Emnekart og published subjects Lars Marius Garshol, utviklingsleder Ontopia,
STRATEGIPROFILEN VED NHH
BEDRE Å KUNNE LITT ENN INGENTING
Se hvordan jeg smart bruker Outlook 2010
Krav til sikring av personopplysninger Prof. Dag Wiese Schartum, AFIN.
Utvalg og datainnsamling Typer av data: Data innhentet for å belyse en spesiell problemstilling (egne data)‏ Data frambrakt uavhengig av problemstillingen.
Språklig variasjon LUT 2 HØST Oversikt over emnet  Språklig variasjon – hva er det?  Språk og dialekt  Språk og identitet  Språklig variasjon.
RIS-metoden for prosessforbedring
DRI2020 Rettskilder og informasjonssøking -oppsummering
Presentere en teknisk rapport
SiriLundinKeller-ILS-Universitetet i Oslo
UBOs frokostmøte 12. juni 2015 Are Gulbrandsen & Dan Michael O. Heggø
Prosjekt og forskningsrapport
DRI2020 Rettskilder og informasjonssøking -oppsummering
Fra det ene til det andre -
Kostnadsbilder i pleie og omsorg
Inntektsbestemmelsen i en åpen økonomi. Multiplikatorprinsippet
Gøy med grammatikk Kurs på Elvebakken vgs 12. 2
Vurderingskriterier enkel versjon
Inntektsbestemmelsen i en åpen økonomi. Multiplikatorprinsippet
DRI2020 Rettskilder og informasjonssøking -oppsummering
Utskrift av presentasjonen:

Automatisk indeksering Grunnlag: dokumentets eget vokabular Prinsipp statistisk lingvistisk Ulike seleksjons- og vektingsprinsipper fjern høy- og/eller lavfrekvente termer gi vekt i henhold til termforekomst i dokumentet termforekomst i hele dokumentsamlingen dokumentlengde

Ulike grader av automatisering Seleksjon av felter for indeksering ”Relevance feedback” Verdi-angivelse for eksempel via lenkeinformasjon

Lingvistisk kunnskap Fraser Syntaktiske roller Homonym-avklaring

Automatisk vs. manuell Dokumentbasert indeksering Spørsmålsbasert indeksering

Automatisk vs. manuell Cranfield I Cranfield II Ulike beskrivelser (emneord, Klass.) jevngode liten forskjell på erfaren og uerfaren indekserer liten effekt ved tidsbruk over 4 min/dok Cranfield II enkelttermer hentet fra dok.tekst mest effektive bare enkel synonymkontroll og ordform-sammenføring viste litt forbedring

Automatisk vs. manuell SMART / MEDLARS 40% av relevante dok. funnet med begge system Automatisk og manuell jevngode

Kunnskap om automatisk indeksering Svært forskjellige gjenfinningsmetoder gir jevngodt resultat Typisk søkeresultat: 10-13 relevante blant 30 først gjenfunne Lingvistiske metoder ikke bedre enn statistiske Raffinerte metoder ikke bedre enn enkle

Kunnskap om automatisk indeksering Liten effekt ved bruk av tesauri eller andre indekseringshjelpemidler Effekt oppnås ved gjennomtenkt frekvensvekting sammenføring av grammatikalske varianter automatisk (eller manuell) spørsmålsutvidelse ”Query development the most critical factor in retrieval”

Utvikling av automatisk indeksering Automatisk kategorisering Subdokumenter (avsnittsindeksering)

Formål med manuell indeksering Samle ulike vokabularer / terminologi / språk Tilpasning til spesielle brukergrupper Vokabularassistanse til bruker Styrt spesifisitetsnivå Gjenfinning over tid Navigering i beslektede emner

Problemer med manuell indeksering Konsistens i indeksering Pris og kapasitet Tilpasning til brukerbehov og - språkbruk Prinsippet om ”konstant intellektuell kapital”