Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

Hva er mapping? Og hva er poenget?

Liknende presentasjoner


Presentasjon om: "Hva er mapping? Og hva er poenget?"— Utskrift av presentasjonen:

1 Hva er mapping? Og hva er poenget?
Seminar om mapping til Dewey

2 Hva er mapping? kildevokabular målvokabular begrep begrep(er)
(Vokabular kan være en tesaurus, en annen form for emneordssystem, et klassifikasjonssystem, en ontologi…) I de fleste av eksemplene vi bruker i dag, er målvokabularet Deweys klassifikasjonssystem. Men det er viktig å presisere at prinsippene vi diskuterer gjelder for alle mulige vokabularer. 1) Mapping kan defineres som forholdet mellom et begrep i et kildevokabular og et eller flere begrep i et målvokabular 2) Retningsbasert: Fra et kildevokabular til et målvokabular 3) Eksempler: Her har vi to prekoordinerte begrep (begge representert med en term) fra fiktive emneordsystemer Arbeidarklasse (nynorsk) mappes til (Deweyklasse for arbeiderklassen) Voldektsdop mappes til (Deweyklasse for voldtekt) (syntetiske legemidler) 4) Spørsmålene vi skal diskutere i dag gjelder i stor grad hvordan og hvorfor man mapper, samt hvilke semantiske relasjoner det kan være viktig å belyse i mappingen. Først, skal Ellen diskutere teoretiske aspekter å ta hensyn til når kildevokabularet har en hel annen struktur enn målvokabularet, som i mappinger mellom tesauri og klassifikasjonssystemer Deretter skal jeg belyse noen av de viktigste valgene man må ta når man tenker på å mappe. Så skal Ingebjørg presentere hvilke vokabularer som allerede er mappet til Dewey + hva vi har her i Norge? Og til slutt skal Lisbeth snakke litt om mapping + Linked data Men aller først skal Ingebjørg si litt om hva poenget er. arbeidarklasse voldtektsdop 615.31

3 Hva er poenget med mapping?
Flere innganger til et emne for den som indekserer Flere innganger til et emne for sluttbruker Norge har ikke noe nasjonalt emneordssystem, mens vi bruker store ressurser på å utvikle en webDewey. En av begrunnelsene for å satse på webDewey, er muligheten for kunne utnytte klassebetegnelser og registertermer i søk, og gjennom samarbeid med andre bibliotekaktører mappe aktuelle norske emnevokabularer til Dewey.

4 Hvorfor mapping til Dewey?
Internasjonalt Språkuavhengig Termer på flere språk kan mappes til Dewey Mapping kan gjøres mellom Dewey og andre klassifikasjonssystemer Mapping kan gjøres mellom Dewey og emneord Mapping kan gjøres mellom Dewey og autoritetsregistre for navn

5 Mapping til Dewey -for klassifikator
Hjelp til klassifikasjon -flere termer å søke på Hjelp til å sette emneord - flere termer å søke på Letter gjenbruk og utveksling av data Mapping mellom Dewey og emneord på flere språk Registertermer er også en eneklt form for mapping. En hjelp for den som klassifiserer til å finne riktig klassifikasjonsnummer hvis man har flere ord å vleg mellom. Men det vil også kunne være en hjelp for de som finne emneord. Særlig pga Dewey mappet ti lLCSH, som er mappet ti lRameau, som er mappet ti lSWD, osv. Formen for mapping alle som klassifiserer kjenner til: «Mappingen» mellom registerterm og klassifikasjonsnummer. (kan vi kalle dette mapping?) Biblioteksentralens emneord. Lokale emneregistre. Mapping mellom emneord på flere språk - hjelp ved kopikatalogisering.

6 Mapping til Dewey -for sluttbruker
Utvidelse av et søk: Muliggjør søk med eget vokabular i samlinger med ulike vokabularer Ved en underliggende mapping, kan man søke med emneord også i samlinger som bare har Dewey. Ved en underliggende mapping mellom vokabularer på flere språk, kan man søke med eget språk i poster på andre språk Kan søke i eget språk (eks. : Utenlandske studenter ved norske universiteter). Hvis det blir laget sluttbrukertjenester basert på vokablarer som er mappet til hverandre, Si

7 Noen valg som bør tas før man begynner å mappe…

8 1. Hvorfor mapper jeg*? For å konvertere eller supplere et målvokabular med termer fra mitt eget vokabular «Særnorske» begrep i utenlandske vokabularer Feks: særbo, kransekaker, dugnad Nynorske / samiske termer i «bokmålske» vokabularer --> Begrep og termer som ikke finnes i målvokabularet! Når vil jeg konvertere/supplere? Til hjelp i indekseringsprosessen? Til hjelp i søkeprosessen? Begge? Her er det viktig å presisere at det kommer til å være jeg (som eier kildevokabularet) som eier mappingen. Dvs, jeg registrerer mappingen direkte i emneposten i autoritetsformatet. Men før jeg setter i gang, bør jeg ha tenkt hvordan jeg evt. kan bruke denne mappingen. Det finnes hovedsakelig to situasjoner der en mapping kan komme til nytte: i indekseringsprosessen og i søkeprosessen. Vi skal se litt nærmere på disse situasjonene nå. *jeg, som eier eller drifter et vokabular

9 Hjelp i indekseringsprosessen
Hvordan skal jeg klassifisere denne artikkelen om voldtektsdop? Bibliotekar som skal klassifisere en artikkel om voldektsdop (eng= Date rape drugs) Underliggende mapping (lastet inn i webDewey) Kommer rett inn i klassen for «Rape». Legg merke til at det ikke finnes registertermer på voldtekstsdop her– termen måtte inn via mapping. Også legg merke til at de som har mappet LCSH-termer til Dewey har vurdert at det kun er hensiktsmessig å mappe «date rape drugs» til klassen for voldtekt– ikke til klassen for syntetiske legemidler. Det er en vurdering som må tas. Man kan for eksempel godt tenke seg vitenskapelige artikler som fokuserer på de kjemiske egenskapene ved forskjellige former for voldektsdop…

10 Hjelp i søkeprosessen Legg inn relasjonstyper!
Underliggende mapping mellom voldektsdop og Dewey klasse og Dewey klasse Søk på «voldtektsdop» i bibliotekkatalogen gir treff på «voldtektsdop» + dokumenter klassifisert med eller Men: både (voldtekt) og (syntetiske legemidler) er mye videre begreper enn voldtektsdop! Dersom koblingen er automatisk, vil det føre til mye støy i trefflisten! Hvordan utnytte mappingen på mest effektiv måte?? Hvordan finner jeg alt biblioteket har om voldektsdop? Legg inn relasjonstyper! Dermed kan vi lage systemer der brukeren selv velge om han/hun vil utvide søket når mappingen ikke er ekvivalent eller snevrere! Nå har jeg tatt av meg bibliotekarkapsen og er en sluttbruker som vil finne alt biblioteket har som handler om voldtektsdop. Underliggende mapping (i bibliotekssystemet mitt!) Hva skjer dersom man automatisk konverterer eller supplerer? Hva kan vi gjøre for å utnytte mappingen på bedre vis? 1) Legg inn relasjonstyper!!

11 2. Hvilke relasjonstyper skal jeg bruke?
Kun til hjelp i indeksering? A. “Tilknyttet-klasse” Ett begrep er knyttet til et eller flere begrep fra målvokabularet Feks) voldektsdop «tilknyttet-klasse» voldektsdop «tilknyttet-klasse» Ingen semantiske relasjoner definert! Enkleste måte å mappe Innebygd i MARC 21 Authorities (når målvokabularet er et klassifikasjonssystem) Det kommer an på hvorfor man skal mappe!

12 2. Hvilke relasjonstyper skal jeg bruke? (forts.)
Til indeksering og/eller søking? B. “Tilknyttet-klasse” med overensstemmelsesgrad Ett begrep er knyttet til et eller flere begrep fra målvokabularet, og det er gitt en overensstemmelsesgrad som definerer likheten mellom begrepene Feks) Overensstemmelsesgrad 1-4 (4 = helt ekvivalent) voldektsdop «tilknyttet-klasse» B1 voldektsdop «tilknyttet-klasse» B1 Krever at man selv definerer gradene – vanskelig! Kan bruke lokale løsninger i MARC 21 Authority Men ingen standard format for å registrere gradene Kommer an på hvorfor man skal gjøre det!

13 2. Hvilke relasjonstyper skal jeg bruke? (forts.)
Til indeksering og/eller søking? Og kanskje til og med for å publisere som Linked data?  C. ISO-standarden for mapping (ISO/DIS ) Ett begrep er knyttet til et eller flere begrep fra målvokabularet, og den semantiske relasjonen mellom begrepene er definert Ekvivalens relasjoner (=EQ, ~EQ) Hierarkiske relasjoner (BM, NM) Assosiative relasjoner (RM) Feks) voldektsdop «RM» voldektsdop «BM» Kan bruke lokale løsninger i MARC 21 Authority Og lett konvertere til SKOS Kommer an på hvorfor man skal gjøre det!

14 3. Hvordan skal jeg gå frem?
Automatisk? Intellektuelt Automatisk + intellektuelt Hva innebærer det intellektuelle arbeidet? God kjennskap til kildevokabularet og målvokabularet Analysere, analysere, analysere (parse, parse, parse) Jeg vet hvorfor jeg vil mappe, og har valgt relasjonstype jeg vil bruke. Hvordan går jeg frem nå? Automatisk: Statistisk mapping av termer fra kildevokabularet som forekommer sammen med termer fra målvokabularet i bibliografiske poster. Må telle frekvens, og bør ha et minimumsfrekvens. Eksempelet fra NORART + Dewey Nevn Bibsys Analysere: innebærer at man analyserer begrepet i kontekst av vokabularet  Hva betyr dette begrepet her?

15 Eksempel: HUMORD + Dewey
Kunst 700 (Kunst og underholdning) BM eller ~EQ Arkitektur Bildekunst Dans Film Folkekunst Improvisasjon Kalligrafi Kunstforståelse Kunsthistorie Kunsthåndverk Kunstnerisk virksomhet Kunstpsykologi Kunstsosiologi Levende bilder Musikk Stil (Uttrykksmåte) Teater (Scenekunst) Her: Konseptkunst, arkitektur, billedkunst, kunsthåndverk, offentlig kunstpolitikk 710 Arealplanlegging og landskapsarkitektur 720 Arkitektur 730 Skulptur og lignende kunstformer 740 Grafiske kunstarter og kunsthåndverk 750 Malerkunst og malerier 760 Trykkekunst og grafiske blad 770 Fotografering, datakunst, kinematografi, videografi 780 Musikk 790 Fritidsaktiviteter, sport, utøvende kunst Hvorfor: Hjelp til indekserer + hjelp til søker Relasjoner: ISO/DIS Koding: MARC 21 / SKOS Hvordan: Intellektuelt

16 Eksempel: HUMORD + Dewey, forts.
MARC 21 Authority 040 $aUiO $bnor $fHUMORD $a700 $223/nor $9~EQ eller $9BM $aKunst SKOS <skos:Concept rdf:about=" <skos:prefLabel>kunst</skos:prefLabel> <skos:closeMatch rdf:resource=" eller: <skos:broadMatch rdf:resource=" </skos:Concept>

17 BISAC ? MeSH LCSH WebDewey Geo Names http://www.nb.no/webdewey ? Norsk
RAMEAU Amerikansk webDewey Tysk webDewey Arbeid som er i gang for å koble emneord / tesaurier og Dewey. Skal si litt om noen av prosjektnee og vokabularene og til slutt litt om hva vi tenker kan være aktuelt for Norge. Det so mer interessant, er at gjennom WebDeweysamarbeidet, vil vi kunne ta del i koblingene mellom disse vokabularene. Geo Names Svensk webDewey SWD SAO

18 Klassifikasjonssystemer som er mappet til Dewey
Mellom UDC og Dewey på øverste nivåer (Tsjekkia) RVK-Deweykonkordanse (Tyskland). SAB –Dewey-konkordanse (Sverige) Hensikt: Gjøre nytte av eksisterende Dewey-klassifikasjon og/eller skritt på veien til å gå over til Dewey Problem: Ulike nivåer, ulikt innhold i klassene Tsjekkia bruker UDK. RVC-BC – hva er BC,. Metide: Begge veier, halv-automatisk.,. BC=Basic Classificari0n. RVK: Regnsberg Classifikation System. Mest brukte klassifikasjonssystem i Tyskland. (Nevn heller dette under vokabularer som er mappet). Problemer med mappingen: Ulike nivåer, ulikt innhold i klassene. Vist seg enklere å mappe fra UDK til Dewey enn den andre veien. Eksempel fra UDK og RVK! Norge: Invitasjon til UDK-biblioteke om å være emd i oversettelsesarbeidet. Trinn 1: DDC-RVk. Tronn 2: RVK-DDC

19 Noen verbale vokabularer som er mappet til Dewey
LCSH (Library of Congress Subject Headings) Bisac Subject Heading List Mesh (Medical Subject Headings) GND (Gemeinsame Normdatei) (tidl. SWD) Svenska ämnesord Si noe om de forskjellige her + husk udk og rwk og msc. LCSH: Library f Congress Subject Headigs – enkle relasjoner. Enten samsvar eller ikke samsvar. Bisac: Bokhandelbransjens klassifikasjonssystem. Ofte brukt for kategoriesering i folkebibliotek. Mesh: medisinsk tesaurus- Akutelle da den også er vuirdert oversatt til norsk. Måten det blir gjort på i Sverige, - kommer tilbake til av Pia og Ingrid. Måten de gjør det på i Tyskland – interessant å si noe om.

20 Assoative, eller «tilknyttede» emenord – sier ikke noe om hva slags relasjon det det er, bare at det er en, LC: Bare emneordene som er forskjellige fra registertermene,.

21

22

23 Mapping til Melvil (tysk webDewey) CrissCross-prosjektet
Mapping fra GND til Dewey Mål: Flere verbale innganger til Dewey både i indekserings- og søkeprosessen Metode: 4 grader av overensstemmelse mellom emneord og Deweynummer Intellektuell mapping. 12 årsverk. Tok for seg hvert enkelt emenord og så hvilke Deweynummere det «passet» til. Mål: Lette gjenfinning av Deweyklassifiserte poster.

24

25 Prosjekter som er i gang
Fast og Dewey VIAF og Dewey MSC og Dewey Geonames og Dewey AGROVOC geografiske områder til 9xx-numre Fast: fasettert versjon av LCSH. VIAF: Internasjonalt autoritetsregister,.. MSC: Medisinsk klassifikasjon. Geonames og DDC

26 Hvordan kan vi dra nytte av andre lands mappingarbeid?
Planer om mulighet for abonnement på andre lands vokabularer i WebDewey (ikke mulig i dag) Dewey gir allikevel mulighet til å nyttiggjøre oss mappingene mellom de andre vokabularene (LCSH /GWD/Rameau/Svenska ämnesord), men ikke automatisk Mangler samordnet nasjonalt emneordssystem Språkforskjeller Vi har et annet utgangspunkt enn andre, a vi ikke har noe emneordsvokabular som er mappet til et LCSH. Vi vil få disse forbindelsene gjennom å mappe til Dewey. Gi et eksempel

27 Hva har vi i Norge? Utstrakt bruk av Dewey
Vokabularer på bestemte fagområder: Humord, Realfagstermene, Tekord, Mesh, Riksantikvarens nøkkel, Musikktesaurus, Juridisk klassifikasjon, UDK, Medisinsk klassifikasjon osv. Vokabularer knyttet til Dewey: Lokale emneregistre Biblioteksentralens emneord

28 Veien videre NB jobber med å mappe DDK 5 til DDC 23
Undersøke potensialet i de enkelte vokabularene? Hvordan bruke Bibbi og emneregistrene? Hvordan kan en evt. mapping organiseres? Samarbeidsprosjekter mellom de som «eier» vokabularene og Nasjonalbiblioteket?


Laste ned ppt "Hva er mapping? Og hva er poenget?"

Liknende presentasjoner


Annonser fra Google