Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

Orden i eget hus åpner nye dører Viola Kuldvere Mari Lundevall

Liknende presentasjoner


Presentasjon om: "Orden i eget hus åpner nye dører Viola Kuldvere Mari Lundevall"— Utskrift av presentasjonen:

1 Orden i eget hus åpner nye dører Viola Kuldvere Mari Lundevall
Realfagsbiblioteket Orden i eget hus åpner nye dører Viola Kuldvere Mari Lundevall Vi kommer for å fortelle om hva vi har gjort for å få kontroll over våre emnedata, og hvordan vi bruker dem. Og så får vi se om dere synes vi mapper eller ikke. Inntil nylig hadde vi et mye lengre navn og vi var organisert i mange små enheter spredt på universitetet.

2 Emneord/frie nøkkelord
Hentet ut fra BIBSYS desember 2009: Utgangspunktet vårt var unike ord fordelt på katalogposter. msc Matematikk Geologi Geografi Geofysikk Fysikk Astrofysikk Farmasi Kjemi Biologi Fellesbiblioteket Informatikk Naturhistorisk museum ddc22 udk Våren 2011: Vi satt igjen med ca unike termer (enkeltord og fraser), 207 former, 45 tider og 912 steder. Ca poster fikk emnedata retrospektivt lagt til i BIBSYS. ddk4 inspec ccs farma Det var ikke bare fysisk plassering som var både her og der – det var også samlingsbeskrivelsene våre. Inntil for noen år siden var situasjonen slik at de ulike instituttbibliotekene brukte hver sine klassifikasjonssystemer og hver sine emneord – selvsagt, kan jeg vel si, for de beskrev jo hver sine emneområder. MEN samlingene var jo også overlappende, med ulik praksis for beskrivelse. I anledning dagen begynner jeg med vårt forhold til klassifikasjon. Det har altså vært sånn at inntil helt nylig klassifiserte bare to av våre institutter i Dewey. De andre brukte så godt som alt annet: Mathematics subject classification, udk, inspec, computer classification system, farma, UBO-klassifikasjon og diverse lokale skjemaer. Dewey var representert: Når vi nå skulle flytte sammen trengte vi en måte å samle også dokumentene våre på, og Dewey ble svaret på det. Fra i fjor avsluttet vi all annen klassifikasjon (siden det selvsagt er unntak fra alt, kommer jeg tilbake til det), og etter flyttesjauen har nå alle kommet i gang med det som for mange er et nytt bekjentskap: Alle nye dokumenter klassifiseres etter DDC-23. Vi bruker webdewey, og kontrollerer mot OCLCs dewey-klassifikasjon. HumSam har bygget opp et Dewey emneregister, som vi nå utfyller med realfagstermer. Etter hvert som registeret utfylles vil vi kunne være mer konsekvente på hvilke numre vi setter på de forskjellige emnene. Vi kontrollerer norske termer mot det pågående arbeidet ved NB for oversetting av DDC-23 til norsk. Nå legger jeg Dewey til side litt, for det jeg egentlig vil fortelle om i dag er emneord. Det var altså sånn at instituttbibliotekene registrerte sine emneord i et fellesfelt i BIBSYS. For de som ikke kjenner BIBSYS betyr det at feltet brukes av alle bibliotek som ønsker det. Vi brukte tid på å emnebeskrive dokumentene våre uten å ha kontroll på verken vokabularet eller søkemuligheter. I 2009 bestemte vi oss for å samordne måten instituttbibliotekene gjorde dette på, ved å lage ett felles, kontrollert, vokabular. Det har vi gjort på en utradisjonell måte, og de som måtte være interessert er hjertelig velkommen til å ta kontakt. Siden tiden her er knapp gjør vi et hopp og nøyer oss med å si at vi har fått lagt emneord på mange gamle katalogposter og selvsagt legger dem på nye poster - i et marcfelt vi kan kontrollere. UBO-klassifikasjon diverse lokale skjema

3 ddc23 msc kontrollerte emneord Realfagsbiblioteket
Realfagsbiblioteket. Informatikk Realfagsbiblioteket. Naturhistorisk museum ddc23 msc kontrollerte emneord Altså har vi en mer oversiktlig situasjon, som er et godt utgangspunkt for å leke oss med data

4 Realfagstermer i tall 14 833 indekstermer 216 former 21 tider
1 064 har en eller flere SE-henvisninger 273 har en eller flere SE OGSÅ-henvisninger 1 570 har engelsk oversettelse 114 har latin 199 har definisjon 250 har MSC 265 har DDC 216 former 21 tider 937 steder Vi har i dag indekstermer. De er beriket: Se-henvisningene er synonymer som i dag brukes for å hjelpe sluttbruker eller bibliotekansatt til å velge rett emneord. De er synlige i websøket. Vi ønsker å lage en mulighet for å bruke dem i søk etter hvert. Se også-henvisningene bruker vi allerede i websøket. sluttbruker kan se dem og søke på dem. Videre har vi endel termer med engelsk oversettelse. Det er ikke åpnet for videresøk på engelsk. Vi har begynt å legge latin på artsnavn. Foreløpig vises ikke latinen i websøket. 250 termer har fått påført klassifikasjon fra Mathematics Subject Classification, som er den klassifikasjonen vi bruker på matematisk bibliotek hos oss. 265 har fått Deweynummer. De som har fått det er først og fremst de samme som har klassifikasjon fra MSC. Jeg sa jo at hele Realfagsbiblioteket begynte å klassifisere med Dewey. DA løy jeg litt: Matematisk bibliotek stod i en særstilling fordi de aldri hadde satt emneord på sine samlinger, men kun lent seg på klassifikasjonen. Det sies at dette klassifikasjonssystemet er et som faktisk forstås og brukes aktivt av fagfolkene selv, altså matematikerne, og det er for viktig til å overhøre og overkjøre. Matematikerne våre har derfor fått en egen tilpasning i vokabularet: Fagreferenten bruker fremdeles MSC, men istedenfor å sette klassifikasjonen rett inn i katalogposten, går hun en omvei for å få med seg litt mer.

5 Dette er et actionbilde av det programmet vi kaller Roald
Dette er et actionbilde av det programmet vi kaller Roald. Det er jo dessverre sånn at biblioteksystemet vårt ikke gir noen mulighet til autoritetskontroll for våre emneord. Men vi har heldigvis gode programmerere selv, og har nå et program som brukes av alle som setter emneord, og som brukes til å vedlikeholde vokabularet. De klassekodene matematisk bibliotek bruker, er registrert på korresponderende emneord i vokabularet. Fagreferenten søker altså på klassekoden, og markerer ønsket term. Her kan dere se hva vi har registrert: Først kommer selve indekstermen. EN er termen på engelsk. BF er synonymer. MSC-koden og DDC-koden kommer så. BA er en intern opplysning. Når man så velger termen får vi se den på byggeplassen. Her kan vi samle opp flere termer til en og samme katalogpost, eller bygge strenger. Nå kopieres det automatisk, så ved å ha katalogposten åpen i annet vindu kan man lime rett inn fra byggeplassen. Som dere ser er posten nå forsynt med emneord, msc-klassifikasjon og ddc-klassifikasjon. Alle tre har også fått med seg identifikator i eget delfelt. Så har vi kontroll over data på innsiden. Men vi ville jo gjerne tilby brukerne våre å søke i og med våre emneord.

6 Her er vårt søkegrensesnitt: Som dere ser har vi tilpasset oss designet fra BIBSYS, tanken er at brukerne skal kjenne seg igjen, ikke at det er ”enda en” base å forholde seg til. Og ja, vi har fått lov av BIBSYS. Et søkeeksempel: Med en gang jeg begynner å skrive i feltet, søkes det i våre emneord. Nå søker jeg etter ord som begynner med ”ikke-”. Som dere ser har jeg en treffliste med 72 treff. Dette er treff i realfagstermene våre, ikke i samlingene. Når jeg velger meg et av ordene i trefflista og klikker på det, skjer det to ting: Det ene er at ordet får fokus i boksen under trefflista. Hvis det finnes synonymer, definisjoner eller andre opplysninger til denne termen vises de nå her. Det andre er at det søkes i BIBSYS. Så får vi bruk for våre bonusdata: Vi har en lenke med en msc-kode.

7 Når vi søker med msc-koden i stedet får vi mange flere treff, fordi matematisk bibliotek kun brukte klassekoder, ikke emneord, før Stilig – men er det mapping? HER mapper vi vel iallfall: Som dere ser har vi lenker til Store norske leksikon og til wikipedia. Hvis vi har valgt et emneord som har artikkeloppslag får vi direkte treff på leksikonartikkelen, men hvis emneordet vårt ikke har en egen leksikonartikkel, søkes det generelt i leksikonet. Hvis vi ikke får treff i norsk wikipedia, søkes det i engelsk.

8

9 Nytt eksempel: Emneordet er oksygen, tilleggsopplysing er at den har et akronym som er O. Det som legges inn i BIBSYS er bare indekstermen Oksygen. I websøket får vi enda en tilleggsopplysning – nemlig at dette er et grunnstoff – OG vi får en lenke til Periodesystemet.no som er en tjeneste som her laget ved universitetet vårt.

10

11

12 Realfagstermer (UBO) og TEKORD (NTNU UB)
Et felles emnesystem for teknikk og realfag ved hjelp av RDF? Realfagsbiblioteket har fått midler fra NB til dette prosjektet som skal se på en mulig sammenføying av Realfagstermene våre og Tekord. Tekord er kontrollerte termer innen teknikk og naturvitenskap ved Universitetsbiblioteket i Trondheim. Prosjektet er i en veldig tidlig fase – siden vi altså må få ryddet skikkelig i eget hus før vi kan gå i gang med en sammenlikning og sammenslåing av vokabularene, så dette vil handle om hva prosjektet går ut på, og hva vi håper å oppnå med det. Erfaringer og resultater får vi komme tilbake til ved en senere anledning! Den mest åpenbare grunnen til å se på en mulig sammenføying av de to vokabularene er selvsagt at vi til dels har overlappende fagterminologi. Det er naturlig å søke samordning og idéutveksling med fagmiljøer som driver med det samme som oss - istedenfor å fortsette på hver vår tue. Det vil bl.a. kunne gi gevinster i forhold til ressursbruk for vedlikehold og videreutvikling av systemene. Og selvfølgelig vil det være en gevinst for sluttbrukere og bibliotekarer som vil kunne søke i et forhåpentlig enda bedre og rikere vokabular. Tanken er at vi kan berike hverandres vokabular ved en sammenslåing. Det handler om å forsøke å utnytte de to vokabularenes likheter og ulikheter i denne prosessen.

13 Hierarkisk struktur (OT, UT)
TEKORD REALORD Røtter tilbake til 30-tallet Ca 15 000 termer Overvekt på teknikk Registertermer til UDK og emneord Hierarkisk struktur (OT, UT) Synonymer Assosiative relasjoner (SO) Startet opp i 2010 Overvekt på naturvitenskap Emneord Flat struktur Latin Engelsk Oppslag i Store Norske Leksikon Oppslag i Wikipedia MSC (Snart Deweynummer ?) Her er det satt opp eksempler på likheter og ulikheter. Dette er ingen uttømmende liste. Noe av det vi må undersøke er: om vi kan utnytte Tekords hierarkiske struktur (OT/UT ) – noe vårt vokabular ikke har i dag. Vi har en flat struktur. Vi som fortsatt rydder i vokabularet kan absolutt ha behov for en mer gjennomarbeidet struktur som Tekord har. Kan Tekord få nytte av våre engelske og latinske termer? Har vi ulike synonymer og henvisninger vi kan dra gjensidig nytte av? Kanskje vi kan mappe udk og msc?

14 Vi har oppslag på emneordene våre i Store Norske Leksikon og Wikipedia via søket vårt. Nå har vi lagt Tekord i same søkegrensesnitt som vårt, dvs. at Tekords brukere også allerede har mulighet til å utnytte videresøk i SNL /Wikipedia på samme måte som oss. Og de har da selvfølgelig de samme browsemulighetene som vi har (som Bibsys ikke har!). Dette er en god hjelp for brukerne som Bibsys mangler: Skriv inn et ord i søkefeltet og få opp forslag på emneord i en liste med videresøk til Bibsys og til de nevnte eksterne kildene.

15 Målet er erfaringer Uttesting av en metode for å sammenføye emnesystemer Kan metoden brukes til å sammenkoble andre norske emnesystemer senere? Dette prosjektets mål er ikke ene og alene er en sammenføying av de to vokabularene (det kan jo faktisk vise seg at det blir for komplisert). Det er mer riktig å si at det er en uttesting av en metode for sammenslåing av emnesystemer. Vi er interesserte i å høste erfaringer fra prosessen med tanke på om metoden senere kan brukes til å sammenkoble andre norske emnesystemer.

16 RDF SOM LIM te = datastøttet undervisning bf = e-læring
so = datastøttet læring so = fjernundervisning en = computer aided instruction <skos:Concept rdf:about="#REAL11013"> <rdf:type rdf:resource=" /> <skos:prefLabel xml:lang="no">datastøttet undervisning</skos:prefLabel> <skos:prefLabel xml:lang="en">computer aided instruction</skos:prefLabel> <skos:altLabel xml:lang="no">e-læring</skos:altLabel> <skos:related rdf:resource="#REAL07481" /> <skos:related rdf:resource="#REAL14416" /> </skos:Concept> Hvordan skal denne sammenligningen og mulige sammenføyingen av de to vokabularene foregå? For at vi skal kunne sammenlikne vokabularene må vi ha dem i et sammenliknbart format. Begge ligger nå ute i RDF (Resource Description Framework). En del av prosjektet vil være å vurdere ulike valgmuligheter når det gjelder metadata/skjema/syntaks for (teknisk) beskrivelse av vokabularene - som SKOS, OWL osv., og her må vi nok kompetanseheve oss selv en del…

17 SILK (program) Gir oss lister med for eksempel: identiske termer
nesten like termer (etter kriterier) termer som vokabularene er alene om + intellektuelt arbeid = et felles vokabular? For sammenlikning og fletting av data har vi tenkt å bruke et program som heter SILK. Programmet kan for eksempel liste opp: Identiske termer, nesten like termer (etter noen kriterier som vi setter), termer som de to vokabularene er alene om. En god del vil skje maskinelt, men så må det selvsagt også intellektuelt arbeid til (studier av data). Vi er veldig spente på hva vi vil finne og hva vi vil få ut av dette! I tillegg til å teste ut en sammenføyning av Realfagstermer og Tekord vil prosjektet også se på muligheten til å flette inn data fra andre kilder som eksisterer som linked, open data. En kartlegging av slike ressurser som kan være relevante for oss vil være en del av prosjektet - og da tenke vi også at vi vil visualisere noen eksempler på slike sammenkoblinger.

18 Et felles norskspråklig emnesystem ?
Bare science fiction? Eller…? Vi håper veldig at metoden vår for å koble sammen to emnesystemer ved hjelp av RDF er gangbar. For noe av det vi ønsker å oppnå med prosjektet er en idéutveksling om framtidig bruk av norske emneord som Linked Data. Visjonen vår er jo at vi i Norge i skal samordne flere emnesystemer slik at vi får et felles norskspråklig emnesystem innen de fleste fagområder, gjerne på et eller annet vis mappet mot Dewey. Vi ønsker at norske emnedata skal være åpne og at sluttbrukeren i framtida vil få mulighet til å browse i emner og få treff i både i våre fysiske samlinger og i andre relevante ressurser og at brukeren også kan «snuble over» bibliotekenes emneord og inn i våre fysiske samlinger via eksterne ressurser. Dette er et lite hint til ledelsen i NB om at vi venter på at noe snart må skje på emneordsområdet !

19 Informasjon og kontakt
Realfagstermer: Prosjekt Realfagstermer og TEKORD: Realfagsbibliotekets emneredaksjon/Deweygruppe: Knut Hegna Heidi Sjursen Konestabo Viola Kuldvere Mari Lundevall Kyrre Traavik Låberg


Laste ned ppt "Orden i eget hus åpner nye dører Viola Kuldvere Mari Lundevall"

Liknende presentasjoner


Annonser fra Google