UBOs frokostmøte 12. juni 2015 Are Gulbrandsen & Dan Michael O. Heggø

Slides:



Advertisements
Liknende presentasjoner
Institutt for samfunnsforskning | Institute for social research | Hvordan lage gode surveyspørsmål? En kommentar Rune Karlsen.
Advertisements

Orden i eget hus åpner nye dører Viola Kuldvere Mari Lundevall
Muntlig vurdering Inger Langseth Program for Lærerutdanning, NTNU.
Hva ligger i begrepet om ansvarlig nanoteknologiutvikling? Roger Strand (Senter for vitenskapsteori, UiB)
1 Nasjonale retningslinjer for indeksering Jon Anjer
Automatisk indeksering
Kvalitetssikring av analyser til forskningsbruk
1 KravprosessenKravprosessen Noen sentral punkter.
WinSpirs 5.0 En presentasjon. Start av systemet Trykk på Medline Advanced i mappen for medisin og helsefag.
Forum Produktutvikling og Design Temadag om Mekatronikk og produktutvikling Johan Rusaanes FMC Kongsberg Subsea.
Om Luthersk dåpsteologi og dåpens betydning for trosopplæring
MeSH = Medical Subject Headings, utviklet av NLM I MeSH tesaurus er det snart MeSH.
Hva er mapping? Og hva er poenget?
Nordisk statistikerkonferanse København 13. august 2010 Jan Byfuglien
Oppgaveformatet. Oversikt XML-format, spesifisert gjennom et XML Schema. Består av et sett lovlige elementer og attributter og hvordan de kan ordnes i.
generell norsk tesaurus
Internasjonale menneskerettigheter
Sparebanken Vest 13. september, 2007 Haakon Bønes Direkte: Mobil: Bevisets stilling overskygger.
Modellering og diagrammer Jesper Tørresø DAB1 E september 2007.
What is a good text? And how do we get pupils to write them?
Sikkerhetsmomenter Konfidensialitet Integritet Tilgjengelighet Autentisering Non-Repudiation (Uomtvistelig) Sporbarhet.
Linked Data 2: Hvordan KoG31 Uke 8, 2013.
The Thompson Schools Improvement Project Process Improvement Training Slides (Current State Slides Only) October 2009.
Primary French Presentation 10 Colours L.I. C’est de quelle couleur?
BÆREKRAFTIGE EPLER. Læringsmål Bærekraftig utvikling – refleksjon – kritisk tenking – ta beslutninger – handlingskompetanse Utarbeidet av Bård Knutsen.
Revisjon i Skolen.  Each Party shall ensure that:  1. the training and assessment of seafarers, as required under the Convention, are administered,
Introduksjon til Norsk WebDewey
Simulering av: teknologiske arbeidsprosesser - automasjon - roboter med LEGO Mindstorms EV3 ATEKO Introduksjon 1. september 2015.
Læringsteorier i matematikk -hvorfor gjør vi det vi gjør i matematikkundervisninga?
Radio listening in Norway
E-learing e-learning Find documents about and the use of
Find Fraud B4 it Finds You!
Hva er mapping? Og hva er poenget?
Mapping mot norsk WebDewey
Kapittel 8: Merkeevalueringer
Lecture 29.
Citation and reference tools for your master thesis
CcMapper-opplæring Mapping mot norsk WebDewey.
Hvorfor mapper vi? Forankring av mappingprosjektet
* 07/16/96 Personalopplæring Skriv inn emnet her. *
Hvorfor mapper vi? Ledermøtet på UB, 13. desember 2016
Eksempel fra Nevrologisk avdeling
Citations and citation databases
Relevant questions for the Reference Group
Moderniseringsprogram i SSB
Diabetes - Sykdommen som ble et symbol på nødvendigheten av omstilling og samhandling i helsetjenesten.
Økonomiske forutsetninger
CAMPAIGNING From vision to action.
Pansoft, WebDewey 2.0 og MARCXML
Studenters læring "The greatest obstacle to discovery is not ignorance – it is the illusion of knowledge." Daniel Boorstin Elaine Munthe UiS.
Fra det ene til det andre -
Veiledning - Verktøy for vurdering av strategier i en anskaffelse
Brukstips! Tekstfeltene i denne filen er vanlige tekstbokser. Du kan endre skrifttype, størrelse, flytte dem rundt og kopiere dem hvis du vil. Jeg syns.
The Gains from International Trade
Ovid Training Department
Welfare Access Through Technology
Fra idé til forskningsprosjekt Hilde Afdal & Odd Tore Kaufmann
Orden i eget hus åpner nye dører Viola Kuldvere Mari Lundevall
Begrepsforståelse i matematikk B – Samarbeid
Kunnskapsgrunnlag (kap. 4 og 5.5)
Citations and citation databases
Responsibility The purpose of the tutor reflections are to
Margaret Louise Fotland, AF Elin Stangeland, Universitetsbiblioteket
Rettslige aspekter ved informasjonsinfrastrukturer og semantisk interoperabilitet Dag Wiese Schartum.
How to evaluate effects of inspections on the quality of care?
Effekter av å bruke kunstig intelligens i et akademisk bibliotek
Modul 3 – La deg inspirere til å inkludere
Kapittel 5 Argumentasjon
- Endelig forslag til ønsketsituasjon
Utskrift av presentasjonen:

UBOs frokostmøte 12. juni 2015 Are Gulbrandsen & Dan Michael O. Heggø Mappingverktøyet ccmapper (concept context mapper)

Tradisjonell tilnærming Kildevokabular Målvokabular Term Strenglikhet Utfordringer knyttet til bl.a. synonymi og homonymi Term Strenglikhet vanligste strategi “Edit distance” - mål på strenglikhet. Utfordringer: Synonymer (Ulike termer brukes for samme begrep) Homonymer (Samme termer brukes for ulike begrep) Strengnormalisering: Store/små bokstaver, aksenter. “Words do not have meanings; people have meanings for words” The linguist Nelson Francis (1967) Contekst gir ord betydning. Begge deler er riktig

Tesauri og interoperabilitet med andre vokabularer (ISO 25964-2) Mapping er datastøttet intellektuelt arbeid Foreslåtte mappinger må kvalitetssikres av en ekspert Mapping av begreper (ikke termer) Dataverktøyet må gi eksperten god oversikt over kontekst for begrepene i kilde- og målvokabular Kap 14.2 “Computer assisted direct matching“ “It is sometimes possible to automate the process, at least in part, using a matching algorithm.” ISO: Det er ikke tilstrekkelig å kun se på termene, man må se på over- og underordnede klasser og eventuelle noter.. Mappings to or from a class or category in a monohierarchical scheme should treat the class/category as a pre-coordinated concept whose meaning can be established by inspecting all its superordinate and subordinate classes as well as any scope notes associated with it. Inspection of the caption alone is inadequate.

Vår tolkning av rådene I ISO-standarden. Støtte mappingen på to hovedmåter: Ved å foreslå de mest relevante mappingkandidatene for et gitt emneord Ved å gi eksperten som skal gjøre mappingen best mulig oversikt over begrepene I kilde- og målvokabuaret. Dashbord Integrere informasjon fra fire datakilder: Webdewey Humord Katalogdata UBOs emneregister til Dewey Vi tror at god interaksjonsdesign er et suksesskriterie.

Overordnede mål for ccmapper: Mer konsistent mapping når vi bruker resultatene fra testmapping som input. Mentalt avlastende, ett system istedet for fire, dvs systemintegrasjson Tidsbesparende Lenkede data (systemintegrasjon og deling av data) Potensiale for gjenbruk ved mapping av andre vokabularer mot Dewey.

Metode for databasert mapping Kildevokabular Målvokabular Emneord Kontekst Synonymer, dvs ekvivalensrelasjonene BF/SE Overordnede termer? Definisjon? Statistisk mapping? (analyse av bibliografiske data) Klassenummer Klassebetegnelse Kontekst Relative indekstermer (synonymer) Noter? Overordnede klasser Relative indeks termer? UiO emneregister til Dewey? separate komponenter som bidrar til å avgjøre begrepslikhet. Alle komponenter bør derfor vektes individuelt. Trenger en fleksibel modell Realfagstermer - Varierende hvor mye kontekst et emneord har Ønsker å kunne kombinere med statistisk mapping Bag of words -> Vektorrommodellen Standard søketeknologi

Vektorrommodellen Vi lager syntetiske dokumenter Et tekstdokument for hvert av emneordene i kildevokabularet Begrep = term og kontekst Alle komponenter vektes individuelt Et tekstdokument for hvert av emneordene i målvokabularet Lingvistisk normalisering av termer Tenk vanlig søk, for eksempel Google Lemmatiserer normaliserer ordendinger, men tar også hensyn til grammatiske bøyningsformer. Basert på språkbankens ordlister Splitting av sammensatte ord? Svensk: Gjennomsnittlig presisjon økte med 25%

Datakilder

Ccmapper demo ccmapper prototype NB. Applikasjonen ikke ferdig. Dette er en tidlig prototype med mockup data, som er ment å gi et inntrykk av hvordan det vil bli, Listen med mappingkandidater er ikke vektet riktig. En ferdig versjon vil gi bedre relevanssortering.