Hva er mapping? Og hva er poenget?

Slides:



Advertisements
Liknende presentasjoner
I.
Advertisements

Hva slags spørsmål skal man stille på hvilke nivåer?
Et hjelpemiddel for å lage litteraturlister/kildelister.
GoOnline publisering Hvordan komme i gang med GoOnline. Denne presentasjonen tar deg steg for steg gjennom oppsett av nettsted med bruk av GoOnline Proffesional.
Rammevilkårene for forskning i utdanningen Toril Johansson, ekspedisjonssjef Universitets- og høyskoleavdelingen.
Tromsø 5 september 2006 Astrid Bjerke EU-rådgiver Norsk kulturråd
B IBLIOTEKSKURS 2 INFORMASJONSSØK KILDEKRITIKK. ATEKST Du finner ATEKST i Fronter eller på bibliotekets forside. Kun datamaskiner på skolen har tilgang.
1 Tilgjengeliggjøring av elektroniske registre – idéer og problemstillinger Seminar om tilgængeliggørelse af elektroniske arkivalier, Skógar, Island,
Nasjonale bibliografiske tjenester
Orden i eget hus åpner nye dører Viola Kuldvere Mari Lundevall
Skritt 1 er å bli klar over Guds Plan
BIBSYS Brage. BIBSYS Brage – kort fortalt BIBSYS Brage gjør det lett å publisere og formidle institusjonens forsknings- og studentarbeider. Hver institusjon.
Pansoft, WebDewey 2.0 og MARCXML
1 Arbeidsgruppens forslag til klassifikasjon av læringsobjekter Berit Rolandsen, 2003.
MeSH på norsk – et spennende samarbeidsprosjekt
Å overleve oppgaveskriving: Litteraturgjennomgang
Merutnyttelse av emne- og klassifikasjonsdata Emneord og webens verktøykasse : Realfagsbibliotekets emneordsprosjekt snekrer videre og bygger broer mot.
1 Nasjonale retningslinjer for indeksering Jon Anjer
Automatisk indeksering
Arbeidskrav og rammebetingelser IKT-krav Betraktninger.
Hva er Fronter.
WinSpirs 5.0 En presentasjon. Start av systemet Trykk på Medline Advanced i mappen for medisin og helsefag.
«Nån jävla ordning ska det va’» Små folkebibliotek om Dewey Unni Knutsen, 21. mars 2012.
Høgskolen i Oslo Fragmentering eller fellesløsning? Unni Knutsen 17. mars 2010.
Nasjonalt autoritetsregister for navn
BS emneord Kjersti Feiring Myrtrøen Bibliotekmøtet Hamar 2010.
Ingebjørg Rype NKKI/Nasjonalbiblioteket
BIBSYS emneportal Kort oversikt og utvikling fremover v/Lisbeth Eriksen, NLH.
Faglig informasjonssøking for protokollstudenter (IIC/IID)
Taksonomi: Klassifikasjon; indeksering
Unni Knutsen Nasjonalbiblioteket, avdeling Oslo
Bibliotekkatalogen vs. Google Kjersti Feiring Myrtrøen Januar 2006.
Kunnskapsorganisasjonsdagene 27. januar 2006 Nasjonalbibliotekets supersøk - i nød og i lyst, eller i gode og onde dager Hilde Høgås, Nasjonalbiblioteket.
Nytt kursadministrasjonsverktøy. Internettsidene for potensiell deltager.
MeSH = Medical Subject Headings, utviklet av NLM I MeSH tesaurus er det snart MeSH.
Allmøte på USIT Vortex 3.0 og nytt fritekstsøk for UiO Tomm Eriksen Webseksjonen, USIT 29. september 2011.
BS Selger bøker og annet materiale til bibliotek Katalogiserer alt vi selger: bøker, lydbøker, filmer, musikk, elektroniske medier 7-8 som.
Dewey: Gjenfødt digitalt Ingebjørg Rype Elise Conradi KORG-dagene 2012.
Emneord som bindeledd mellom biblioteket og eksterne tjenester Realfagsbiblioteket.
Eks. med mapping av AGROVOC til andre kunnskapsorganisasjonssystemer (KOS) Seminar om mapping til Dewey 11. juni 2012 Lisbeth Eriksen, Universitetet for.
Norsk webversjon av Dewey
generell norsk tesaurus
Prosjekt ny norsk Deweyutgave (DDK5) prosjektleder og redaktør Isabella Kubosch.
Helseinformatikk Øving 2. Studie av modeller GLIF –Protégé GEM – GEM Cutter.
2003 Ontopia AS1 Tanker om standarder for e-læring Emnekart og published subjects Lars Marius Garshol, utviklingsleder Ontopia,
ORIA - alt i ett søk!. Hva er ORIA? Det er en søketjeneste som gjør det enklere å finne fram i alt biblioteket har tilgjengelig, både trykt og online.
Fra DDK5 til DDK23 Ingebjørg Rype Nasjonalbiblioteket.
Klassifikasjonspraksis og klassifikasjonspolitikk Ingebjørg Rype Nasjonalbiblioteket.
0-9 med Dewey. Oversikt Deweys desimalklassifikasjon – grunnleggende struktur Hvordan klassifisere etter DDK Funksjoner og prinsipper i hovedtabellene.
Introduksjon til Norsk WebDewey
Norsk WebDewey: Sluttbrukerløsninger. Disposisjon WebDewey Search Tilgjengelige datasett.
Opplæring i norsk WebDewey Ingebjørg Rype. Bakgrunn– hvorfor WebDewey, hvorfor fullstendig oversettelse? Om prosjektet Lisenser.
0-9 med Dewey.
Norsk WebDewey: Sluttbrukerløsninger
Hva er mapping? Og hva er poenget?
Mapping mot norsk WebDewey
Opplæring i norsk WebDewey
CcMapper-opplæring Mapping mot norsk WebDewey.
Hvorfor mapper vi? Forankring av mappingprosjektet
Hvorfor mapper vi? Ledermøtet på UB, 13. desember 2016
UBOs frokostmøte 12. juni 2015 Are Gulbrandsen & Dan Michael O. Heggø
Lisbeth Eriksen, Universitetet for miljø- og biovitenskap (UMB)
Pansoft, WebDewey 2.0 og MARCXML
Dewey: Gjenfødt digitalt
Fra det ene til det andre -
KulturNav Kulturnav.org
Oppgavehefte EPiServer
Orden i eget hus åpner nye dører Viola Kuldvere Mari Lundevall
BIBBI-emner i Norsk webDewey
BS Selger bøker og annet materiale til bibliotek
Utskrift av presentasjonen:

Hva er mapping? Og hva er poenget? Seminar om mapping til Dewey 11.06.2012

Hva er mapping? kildevokabular målvokabular begrep begrep(er) (Vokabular kan være en tesaurus, en annen form for emneordssystem, et klassifikasjonssystem, en ontologi…) I de fleste av eksemplene vi bruker i dag, er målvokabularet Deweys klassifikasjonssystem. Men det er viktig å presisere at prinsippene vi diskuterer gjelder for alle mulige vokabularer. 1) Mapping kan defineres som forholdet mellom et begrep i et kildevokabular og et eller flere begrep i et målvokabular 2) Retningsbasert: Fra et kildevokabular til et målvokabular 3) Eksempler: Her har vi to prekoordinerte begrep (begge representert med en term) fra fiktive emneordsystemer Arbeidarklasse (nynorsk) mappes til 305.562 (Deweyklasse for arbeiderklassen) Voldektsdop mappes til 362.883 (Deweyklasse for voldtekt) + 615.31 (syntetiske legemidler) 4) Spørsmålene vi skal diskutere i dag gjelder i stor grad hvordan og hvorfor man mapper, samt hvilke semantiske relasjoner det kan være viktig å belyse i mappingen. Først, skal Ellen diskutere teoretiske aspekter å ta hensyn til når kildevokabularet har en hel annen struktur enn målvokabularet, som i mappinger mellom tesauri og klassifikasjonssystemer Deretter skal jeg belyse noen av de viktigste valgene man må ta når man tenker på å mappe. Så skal Ingebjørg presentere hvilke vokabularer som allerede er mappet til Dewey + hva vi har her i Norge? Og til slutt skal Lisbeth snakke litt om mapping + Linked data Men aller først skal Ingebjørg si litt om hva poenget er. arbeidarklasse 305.562 voldtektsdop 362.883 615.31

Hva er poenget med mapping? Flere innganger til et emne for den som indekserer Flere innganger til et emne for sluttbruker Norge har ikke noe nasjonalt emneordssystem, mens vi bruker store ressurser på å utvikle en webDewey. En av begrunnelsene for å satse på webDewey, er muligheten for kunne utnytte klassebetegnelser og registertermer i søk, og gjennom samarbeid med andre bibliotekaktører mappe aktuelle norske emnevokabularer til Dewey.

Hvorfor mapping til Dewey? Internasjonalt Språkuavhengig Termer på flere språk kan mappes til Dewey Mapping kan gjøres mellom Dewey og andre klassifikasjonssystemer Mapping kan gjøres mellom Dewey og emneord Mapping kan gjøres mellom Dewey og autoritetsregistre for navn

Mapping til Dewey -for klassifikator Hjelp til klassifikasjon -flere termer å søke på Hjelp til å sette emneord - flere termer å søke på Letter gjenbruk og utveksling av data Mapping mellom Dewey og emneord på flere språk Registertermer er også en eneklt form for mapping. En hjelp for den som klassifiserer til å finne riktig klassifikasjonsnummer hvis man har flere ord å vleg mellom. Men det vil også kunne være en hjelp for de som finne emneord. Særlig pga Dewey mappet ti lLCSH, som er mappet ti lRameau, som er mappet ti lSWD, osv. Formen for mapping alle som klassifiserer kjenner til: «Mappingen» mellom registerterm og klassifikasjonsnummer. (kan vi kalle dette mapping?) Biblioteksentralens emneord. Lokale emneregistre. Mapping mellom emneord på flere språk - hjelp ved kopikatalogisering.

Mapping til Dewey -for sluttbruker Utvidelse av et søk: Muliggjør søk med eget vokabular i samlinger med ulike vokabularer Ved en underliggende mapping, kan man søke med emneord også i samlinger som bare har Dewey. Ved en underliggende mapping mellom vokabularer på flere språk, kan man søke med eget språk i poster på andre språk Kan søke i eget språk (eks. : Utenlandske studenter ved norske universiteter). Hvis det blir laget sluttbrukertjenester basert på vokablarer som er mappet til hverandre, Si

Noen valg som bør tas før man begynner å mappe…

1. Hvorfor mapper jeg*? For å konvertere eller supplere et målvokabular med termer fra mitt eget vokabular «Særnorske» begrep i utenlandske vokabularer Feks: særbo, kransekaker, dugnad Nynorske / samiske termer i «bokmålske» vokabularer --> Begrep og termer som ikke finnes i målvokabularet! Når vil jeg konvertere/supplere? Til hjelp i indekseringsprosessen? Til hjelp i søkeprosessen? Begge? Her er det viktig å presisere at det kommer til å være jeg (som eier kildevokabularet) som eier mappingen. Dvs, jeg registrerer mappingen direkte i emneposten i autoritetsformatet. Men før jeg setter i gang, bør jeg ha tenkt hvordan jeg evt. kan bruke denne mappingen. Det finnes hovedsakelig to situasjoner der en mapping kan komme til nytte: i indekseringsprosessen og i søkeprosessen. Vi skal se litt nærmere på disse situasjonene nå. *jeg, som eier eller drifter et vokabular

Hjelp i indekseringsprosessen Hvordan skal jeg klassifisere denne artikkelen om voldtektsdop? Bibliotekar som skal klassifisere en artikkel om voldektsdop (eng= Date rape drugs) Underliggende mapping (lastet inn i webDewey) Kommer rett inn i klassen for «Rape». Legg merke til at det ikke finnes registertermer på voldtekstsdop her– termen måtte inn via mapping. Også legg merke til at de som har mappet LCSH-termer til Dewey har vurdert at det kun er hensiktsmessig å mappe «date rape drugs» til klassen for voldtekt– ikke til klassen for syntetiske legemidler. Det er en vurdering som må tas. Man kan for eksempel godt tenke seg vitenskapelige artikler som fokuserer på de kjemiske egenskapene ved forskjellige former for voldektsdop…

Hjelp i søkeprosessen Legg inn relasjonstyper! Underliggende mapping mellom voldektsdop og Dewey klasse 362.883 og Dewey klasse 615.31 Søk på «voldtektsdop» i bibliotekkatalogen gir treff på «voldtektsdop» + dokumenter klassifisert med 362.883 eller 615.31 Men: både 362.883 (voldtekt) og 615.31 (syntetiske legemidler) er mye videre begreper enn voldtektsdop! Dersom koblingen er automatisk, vil det føre til mye støy i trefflisten! Hvordan utnytte mappingen på mest effektiv måte?? Hvordan finner jeg alt biblioteket har om voldektsdop? Legg inn relasjonstyper! Dermed kan vi lage systemer der brukeren selv velge om han/hun vil utvide søket når mappingen ikke er ekvivalent eller snevrere! Nå har jeg tatt av meg bibliotekarkapsen og er en sluttbruker som vil finne alt biblioteket har som handler om voldtektsdop. Underliggende mapping (i bibliotekssystemet mitt!) Hva skjer dersom man automatisk konverterer eller supplerer? Hva kan vi gjøre for å utnytte mappingen på bedre vis? 1) Legg inn relasjonstyper!!

2. Hvilke relasjonstyper skal jeg bruke? Kun til hjelp i indeksering? A. “Tilknyttet-klasse” Ett begrep er knyttet til et eller flere begrep fra målvokabularet Feks) voldektsdop «tilknyttet-klasse» 362.883 voldektsdop «tilknyttet-klasse» 615.31 Ingen semantiske relasjoner definert! Enkleste måte å mappe Innebygd i MARC 21 Authorities (når målvokabularet er et klassifikasjonssystem) Det kommer an på hvorfor man skal mappe!

2. Hvilke relasjonstyper skal jeg bruke? (forts.) Til indeksering og/eller søking? B. “Tilknyttet-klasse” med overensstemmelsesgrad Ett begrep er knyttet til et eller flere begrep fra målvokabularet, og det er gitt en overensstemmelsesgrad som definerer likheten mellom begrepene Feks) Overensstemmelsesgrad 1-4 (4 = helt ekvivalent) voldektsdop «tilknyttet-klasse» 362.883 B1 voldektsdop «tilknyttet-klasse» 615.31 B1 Krever at man selv definerer gradene – vanskelig! Kan bruke lokale løsninger i MARC 21 Authority Men ingen standard format for å registrere gradene Kommer an på hvorfor man skal gjøre det!

2. Hvilke relasjonstyper skal jeg bruke? (forts.) Til indeksering og/eller søking? Og kanskje til og med for å publisere som Linked data?  C. ISO-standarden for mapping (ISO/DIS 25964-2) Ett begrep er knyttet til et eller flere begrep fra målvokabularet, og den semantiske relasjonen mellom begrepene er definert Ekvivalens relasjoner (=EQ, ~EQ) Hierarkiske relasjoner (BM, NM) Assosiative relasjoner (RM) Feks) voldektsdop «RM» 362.883 voldektsdop «BM» 615.31 Kan bruke lokale løsninger i MARC 21 Authority Og lett konvertere til SKOS Kommer an på hvorfor man skal gjøre det!

3. Hvordan skal jeg gå frem? Automatisk? Intellektuelt Automatisk + intellektuelt Hva innebærer det intellektuelle arbeidet? God kjennskap til kildevokabularet og målvokabularet Analysere, analysere, analysere (parse, parse, parse) Jeg vet hvorfor jeg vil mappe, og har valgt relasjonstype jeg vil bruke. Hvordan går jeg frem nå? Automatisk: Statistisk mapping av termer fra kildevokabularet som forekommer sammen med termer fra målvokabularet i bibliografiske poster. Må telle frekvens, og bør ha et minimumsfrekvens. Eksempelet fra NORART + Dewey Nevn Bibsys Analysere: innebærer at man analyserer begrepet i kontekst av vokabularet  Hva betyr dette begrepet her?

Eksempel: HUMORD + Dewey Kunst 700 (Kunst og underholdning) BM eller ~EQ Arkitektur Bildekunst Dans Film Folkekunst Improvisasjon Kalligrafi Kunstforståelse Kunsthistorie Kunsthåndverk Kunstnerisk virksomhet Kunstpsykologi Kunstsosiologi Levende bilder Musikk Stil (Uttrykksmåte) Teater (Scenekunst) Her: Konseptkunst, arkitektur, billedkunst, kunsthåndverk, offentlig kunstpolitikk 710 Arealplanlegging og landskapsarkitektur 720 Arkitektur 730 Skulptur og lignende kunstformer 740 Grafiske kunstarter og kunsthåndverk 750 Malerkunst og malerier 760 Trykkekunst og grafiske blad 770 Fotografering, datakunst, kinematografi, videografi 780 Musikk 790 Fritidsaktiviteter, sport, utøvende kunst Hvorfor: Hjelp til indekserer + hjelp til søker Relasjoner: ISO/DIS 25964-2 Koding: MARC 21 / SKOS Hvordan: Intellektuelt

Eksempel: HUMORD + Dewey, forts. MARC 21 Authority 040 $aUiO $bnor $fHUMORD 08300 $a700 $223/nor $9~EQ eller $9BM 150 $aKunst SKOS <skos:Concept rdf:about="http://humord.uio.no/#kunst"> <skos:prefLabel>kunst</skos:prefLabel> <skos:closeMatch rdf:resource="http://dewey.info/class/700/2013/about.no"/> eller: <skos:broadMatch rdf:resource="http://dewey.info/class/700/2013/about.no"/> </skos:Concept>

BISAC ? MeSH LCSH WebDewey Geo Names http://www.nb.no/webdewey ? Norsk RAMEAU Amerikansk webDewey Tysk webDewey Arbeid som er i gang for å koble emneord / tesaurier og Dewey. Skal si litt om noen av prosjektnee og vokabularene og til slutt litt om hva vi tenker kan være aktuelt for Norge. Det so mer interessant, er at gjennom WebDeweysamarbeidet, vil vi kunne ta del i koblingene mellom disse vokabularene. Geo Names Svensk webDewey SWD SAO http://www.nb.no/webdewey

Klassifikasjonssystemer som er mappet til Dewey Mellom UDC og Dewey på øverste nivåer (Tsjekkia) RVK-Deweykonkordanse (Tyskland). SAB –Dewey-konkordanse (Sverige) Hensikt: Gjøre nytte av eksisterende Dewey-klassifikasjon og/eller skritt på veien til å gå over til Dewey Problem: Ulike nivåer, ulikt innhold i klassene Tsjekkia bruker UDK. RVC-BC – hva er BC,. Metide: Begge veier, halv-automatisk.,. BC=Basic Classificari0n. RVK: Regnsberg Classifikation System. Mest brukte klassifikasjonssystem i Tyskland. (Nevn heller dette under vokabularer som er mappet). Problemer med mappingen: Ulike nivåer, ulikt innhold i klassene. Vist seg enklere å mappe fra UDK til Dewey enn den andre veien. Eksempel fra UDK og RVK! Norge: Invitasjon til UDK-biblioteke om å være emd i oversettelsesarbeidet. Trinn 1: DDC-RVk. Tronn 2: RVK-DDC

Noen verbale vokabularer som er mappet til Dewey LCSH (Library of Congress Subject Headings) Bisac Subject Heading List Mesh (Medical Subject Headings) GND (Gemeinsame Normdatei) (tidl. SWD) Svenska ämnesord Si noe om de forskjellige her + husk udk og rwk og msc. LCSH: Library f Congress Subject Headigs – enkle relasjoner. Enten samsvar eller ikke samsvar. Bisac: Bokhandelbransjens klassifikasjonssystem. Ofte brukt for kategoriesering i folkebibliotek. Mesh: medisinsk tesaurus- Akutelle da den også er vuirdert oversatt til norsk. Måten det blir gjort på i Sverige, - kommer tilbake til av Pia og Ingrid. Måten de gjør det på i Tyskland – interessant å si noe om.

Assoative, eller «tilknyttede» emenord – sier ikke noe om hva slags relasjon det det er, bare at det er en, LC: Bare emneordene som er forskjellige fra registertermene,.

Mapping til Melvil (tysk webDewey) CrissCross-prosjektet Mapping fra GND til Dewey Mål: Flere verbale innganger til Dewey både i indekserings- og søkeprosessen Metode: 4 grader av overensstemmelse mellom emneord og Deweynummer Intellektuell mapping. 12 årsverk. Tok for seg hvert enkelt emenord og så hvilke Deweynummere det «passet» til. Mål: Lette gjenfinning av Deweyklassifiserte poster.

Prosjekter som er i gang Fast og Dewey VIAF og Dewey MSC og Dewey Geonames og Dewey AGROVOC geografiske områder til 9xx-numre Fast: fasettert versjon av LCSH. VIAF: Internasjonalt autoritetsregister,.. MSC: Medisinsk klassifikasjon. Geonames og DDC

Hvordan kan vi dra nytte av andre lands mappingarbeid? Planer om mulighet for abonnement på andre lands vokabularer i WebDewey (ikke mulig i dag) Dewey gir allikevel mulighet til å nyttiggjøre oss mappingene mellom de andre vokabularene (LCSH /GWD/Rameau/Svenska ämnesord), men ikke automatisk Mangler samordnet nasjonalt emneordssystem Språkforskjeller Vi har et annet utgangspunkt enn andre, a vi ikke har noe emneordsvokabular som er mappet til et LCSH. Vi vil få disse forbindelsene gjennom å mappe til Dewey. Gi et eksempel

Hva har vi i Norge? Utstrakt bruk av Dewey Vokabularer på bestemte fagområder: Humord, Realfagstermene, Tekord, Mesh, Riksantikvarens nøkkel, Musikktesaurus, Juridisk klassifikasjon, UDK, Medisinsk klassifikasjon osv. Vokabularer knyttet til Dewey: Lokale emneregistre Biblioteksentralens emneord

Veien videre NB jobber med å mappe DDK 5 til DDC 23 Undersøke potensialet i de enkelte vokabularene? Hvordan bruke Bibbi og emneregistrene? Hvordan kan en evt. mapping organiseres? Samarbeidsprosjekter mellom de som «eier» vokabularene og Nasjonalbiblioteket?