Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

Automatisk indeksering Grunnlag: dokumentets eget vokabular Prinsipp –statistisk –lingvistisk Ulike seleksjons- og vektingsprinsipper –fjern høy- og/eller.

Liknende presentasjoner


Presentasjon om: "Automatisk indeksering Grunnlag: dokumentets eget vokabular Prinsipp –statistisk –lingvistisk Ulike seleksjons- og vektingsprinsipper –fjern høy- og/eller."— Utskrift av presentasjonen:

1 Automatisk indeksering Grunnlag: dokumentets eget vokabular Prinsipp –statistisk –lingvistisk Ulike seleksjons- og vektingsprinsipper –fjern høy- og/eller lavfrekvente termer –gi vekt i henhold til termforekomst i dokumentet termforekomst i hele dokumentsamlingen dokumentlengde

2 Ulike grader av automatisering Seleksjon av felter for indeksering ”Relevance feedback” Verdi-angivelse –for eksempel via lenkeinformasjon

3 Lingvistisk kunnskap Fraser Syntaktiske roller Homonym-avklaring

4 Automatisk vs. manuell Dokumentbasert indeksering Spørsmålsbasert indeksering

5 Automatisk vs. manuell Cranfield I –Ulike beskrivelser (emneord, Klass.) jevngode –liten forskjell på erfaren og uerfaren indekserer –liten effekt ved tidsbruk over 4 min/dok Cranfield II –enkelttermer hentet fra dok.tekst mest effektive –bare enkel synonymkontroll og ordform- sammenføring viste litt forbedring

6 Automatisk vs. manuell SMART / MEDLARS –40% av relevante dok. funnet med begge system –Automatisk og manuell jevngode

7 Kunnskap om automatisk indeksering Svært forskjellige gjenfinningsmetoder gir jevngodt resultat Typisk søkeresultat: relevante blant 30 først gjenfunne Lingvistiske metoder ikke bedre enn statistiske Raffinerte metoder ikke bedre enn enkle

8 Kunnskap om automatisk indeksering Liten effekt ved bruk av tesauri eller andre indekseringshjelpemidler Effekt oppnås ved –gjennomtenkt frekvensvekting –sammenføring av grammatikalske varianter –automatisk (eller manuell) spørsmålsutvidelse ”Query development the most critical factor in retrieval”

9 Utvikling av automatisk indeksering Automatisk kategorisering Subdokumenter (avsnittsindeksering)

10 Formål med manuell indeksering Samle ulike vokabularer / terminologi / språk Tilpasning til spesielle brukergrupper Vokabularassistanse til bruker Styrt spesifisitetsnivå Gjenfinning over tid Navigering i beslektede emner

11 Problemer med manuell indeksering Konsistens i indeksering Pris og kapasitet Tilpasning til brukerbehov og - språkbruk Prinsippet om ”konstant intellektuell kapital”


Laste ned ppt "Automatisk indeksering Grunnlag: dokumentets eget vokabular Prinsipp –statistisk –lingvistisk Ulike seleksjons- og vektingsprinsipper –fjern høy- og/eller."

Liknende presentasjoner


Annonser fra Google