Semantisk web og ontologier – et forsøk på oppklaring

Slides:



Advertisements
Liknende presentasjoner
IT-Ledelse , 4.februar Dagens: forts. “Dagens Situasjon” i Y-modellen
Advertisements

Litt om alt Leiarsamling NSKR Ålesund 2. april 2006 Kristine Sevik.
Content Management på en ny måte Stian Danenbarger Creuna as.
IKT ressurser for e-læring NVU-konferansen 2005 Olav Skundberg HiST, AITeL
Intro til Semantiske Teknologier/ Semantisk Interoperabilitet
Erfaringer med akkreditering av masterprogram ved HiAk Oversikt over de masterne (og en ph.d.) HiAk har fått akkreditert fra 2004 – d.d. ■Læring i komplekse.
Biblioteket som støtte for forskning og utdanning Randi E. Taxt Bibliotekmøtet på Hamar
MeSH på norsk – et spennende samarbeidsprosjekt
Nyhetsstrømmer #02 RSS ( RDF Site Summary ) gjør at man kan abonnere på nyhetsstrømmer. Atom er en standardisering av RSS formatet. Kan abonnere v.h.a.
Mads Lomholt (usit/sas/lipk) Nytt i Windows 7 Åpne dokumentformat.
Forstå bruk og datainnsamling
Rolighetsmoen barnehage
1 Nasjonale retningslinjer for indeksering Jon Anjer
Datavarehus i skatteetaten -
Hva er Fronter.
1 KravprosessenKravprosessen Noen sentral punkter.
BIBSYS emneportal Kort oversikt og utvikling fremover v/Lisbeth Eriksen, NLH.
Høgskolen i Oslo Litt om LMS. Hva er et LMS? l Et internettbasert, brukeravgrenset system for elektronisk kommunikasjon, publisering av elektroniske filer.
© UNIVERSITETETS SENTER FOR INFORMASJONSTEKNOLOGI UNIVERSITETET I OSLO USIT Side 1 HOUSTON Planene fremover.
Litteratursøk for Spesialpedagogikk Master Hilde K. Bjerkholt Fagreferent i pedagogikk, spesialpedagogikk Treffetid høst 2007 fredager kl et Tlf.
Løsning hos RSH Norge En gjennomgang av løsning hos Reitan Servicehandel Norge Edvard Gundersen – ProfitBase AS Løsningsarkitekt.
Velkommen til Medisinsk bibliotek
Standardisering – hvorfor det?
UFD ITU-konferansen Kristin Clemet, ITU-konferansen 2003, ”Digital dannelse. IKT i utdanning: Resultater og konsekvenser”. Oslo 16.
Taksonomi: Klassifikasjon; indeksering
Digitale dokumenter Nils Pharo. Digitale dokumenter engelskspråklig kurs tverrfaglig del av sivilbibliotekarstudiet.
NOVAGate Erfaringer med flere samarbeidspartnere i å bygge opp en felles nordisk emneportal. Av Lisbeth Eriksen Norges.
MetaLib og SFX Demonstrasjon 16 oktober Program Utfordringer for bibliotek og brukere Hva er MetaLib og SFX? Live-demo Systemene i bruk Produkter.
Allmøte på USIT Vortex 3.0 og nytt fritekstsøk for UiO Tomm Eriksen Webseksjonen, USIT 29. september 2011.
Innledning om HTML IT20 oktober Bakgrunn Konseptet WWW ble født i 1983 i CERN, Geneve Opphavsmann: Tim Berners-Lee, MIT Spre informasjon uavhengig.
Oppgaveformatet. Oversikt XML-format, spesifisert gjennom et XML Schema. Består av et sett lovlige elementer og attributter og hvordan de kan ordnes i.
Standarder, innhold og ePortfolio Helge Hannisdal Product Manager it’s:learning
UNIVERSITETSBIBLIOTEKET I BERGEN Læringssenter – form eller innhold? Fagreferentseminar i Stavanger 25.april 2002 Innledning ved Anne Sissel Vedvik Tonning.
Eks. med mapping av AGROVOC til andre kunnskapsorganisasjonssystemer (KOS) Seminar om mapping til Dewey 11. juni 2012 Lisbeth Eriksen, Universitetet for.
Anbefalingssystemer og Ontologier
Universitets- og høgskolebibliotekene i kunnskapssamfunnet Randi E. Taxt Bibliotekmøtet på Hamar
Juridisk nettviser Dokumentasjon av konvertering.
Samordning, arkitektur, PKI Hva skjer? Endre Grøtnes, Statskonsult
Natalya Fridman Noy and Carole D. Hafner The State of the Art in Ontology Design Av Ida Kokkersvold.
Innsamling av ekstremt sensitive data til forskning
PUG-NORWAY OKTOBER 2008 THOMAS SKJØRTEN, HILDE ANDREASSEN UML og OpenEdge OOABL.
1 Kap. 17 – Interactive computing How Information Technology Is Conquering the World: Workplace, Private Life, and Society Professor Kai A. Olsen, Universitetet.
Kulturskolene: har de noen verdi? Nina Scott Frisch KS-Nordland -årsmøte Bodø 19. Oktober 2010.
1 Kap. 17 – Interactive computing How Information Technology Is Conquering the World: Workplace, Private Life, and Society Professor Kai A. Olsen, Universitetet.
Katalog med tjenester n Masse tjenester, men det er ikke lett å finne de. n Tjeneste tilbyder må selv kunne oppdatere. n Tjenesten selv forteller hva den.
Referansehåndteringsverktøy EndNote og Reference Manager Ingeborg Hvaale.
T OSPRÅKLIG ASSISTANSE OG BARNEHAGENS FLERKULTURELLE SAMFUNNSMANDAT Katrine Giæver Bergen 24. mars 2009 Katrine Giæver 2008.
NIJOS-foredrag1 Veiledningstjeneste: ”Lett tilgjengelig faginformasjon for webtjenester.” En rapport med vurderinger og et eksempel på løsning, NIJOS og.
FINF 4001 forelesning Arild Jansen, AFIN 1 Digital forvaltning Introduksjon Hva er digital forvaltning Nasjonale og internasjonale perspektiver.
1 GeoPortal – Rammeverk Introduksjon. 2 Teknisk rammeverk - Interoperabilitet Interoperabilitet evne til å kommunisere, kjøre programmer, eller overføre.
Introduksjon Pensum: Olsen, K.A. The Internet, the Web and eBusiness, Formalizing applications for the real world, Scarecrow Press, 2005.
Evaluering av informasjon på Internett Kildebruk og kritikk Universitetsbibliotekar Hilde Westbye Det juridiske fakultetsbibliotek Universitetet i Oslo.
Høgskolen i Oslo IKT-revolusjonen i mitt lærerliv! Digitale presentasjoner i eget arbeid Forelesning for A05 Hanne Christensen Monica Johannesen.
DRI 1002 Våren 2004 Oppsummering Overblikk over kurset : Mål og innhold Forelesningene Obligatoriske oppgaver 2.Litt om eksamen 3.Evaluering.
Semantic Overlay Networks for P2P Systems Øyvind Reinsberg.
Protokoller Pensum: Olsen, kap. 5 og 6. Kommunikasjonsprotokoll Rutiner for å administrere og kontrollere oversending av data Telefonsamtale (”Hallo”,
Senter for teknologi, innovasjon og kultur (TIK) - Universitetet i Oslo ORGANIZATIONS AND KNOWLEDGE TIK ESST Module 4 Jon Vatnaland.
2003 Ontopia AS1 Tanker om standarder for e-læring Emnekart og published subjects Lars Marius Garshol, utviklingsleder Ontopia,
Linked Data 2: Hvordan KoG31 Uke 8, 2013.
TDT4210 Helseinformatikk 2004Øystein Nytrø Ontologier og Protégé Forberedelse til øving 1.
Årsplan for USIT for : – Tiltak og prioriteringer IT-direktør Lars Oftedal.
Innleveringsoppgaver i forskningsmetode
Digital læring for publikum og bibliotekansatte
Hvorfor mapper vi? Ledermøtet på UB, 13. desember 2016
UBOs frokostmøte 12. juni 2015 Are Gulbrandsen & Dan Michael O. Heggø
Lisbeth Eriksen, Universitetet for miljø- og biovitenskap (UMB)
Frokostmøte om kunstig intelligens
Turtle Terse RDF Triple Language, a concrete syntax for RDF
Utskrift av presentasjonen:

Semantisk web og ontologier – et forsøk på oppklaring Semantisk web og ontologier – et forsøk på oppklaring? Bibliotekmøtet 2010, Hamar Lisbeth Eriksen, Universitetsbiblioteket for miljø- og biovitenskap, Ås

Semantisk web – hva og hvorfor? Min presentasjon Semantisk web – hva og hvorfor? Teknisk infrastruktur for semantisk web og ontologier Ontologier – hva og hvorfor? Fasettert klassifikasjon og ontologier – to sider av samme sak? Semantisk web og digitale bibliotekfunksjoner – likheter? Hva bør skjer videre innenfor det norske bibliotekfagligemiljøet? DETTE ER TITTELEN PÅ PRESENTASJONEN

Hva betyr semantisk web og hvorfor semantisk web, og ikke bare den ”vanlige” web’en? Semantikk er den grenen av lingvistikken (språkvitenskapen) som studerer ordenes betydning, både enkeltvis og i sammenstilte strukturer Semantisk web har hentet sin betydning fra språkvitenskapen Semantisk web skal gi mer mening og struktur til ”dagens” web – smartere web Tim Berners-Lees visjon for www er utvidelse av web’en hvor: ”information is given well-defined meaning, better enabling computers and people to work in cooperation” Dagens web publiserer informasjon, mens semantisk web publiserer data DETTE ER TITTELEN PÅ PRESENTASJONEN Semantisk web erstatter ikke dagens web, men gjør den smartere! Dagens web gir treffliste over dokumenter med lenker videre til andre dokumenter uten å se informasjon i sammenhegng. Gjenfinning og presisjon synker p.g.a. dårlig gjenfinningssystemer – søker på ord i store dokumentmengder som kan ha forskjellig betydning i forhold til hvilke sammenheng de opptre i. Vi har fortsatt faglige databaser som er for spesielle fagområder (domener) og er kvalitetssikret etter utvalg, men dette gjelder ikke for verdensveven. Bedre menneske-maskin kommunikasjon fordi vi legger data til rette og lager applikasjoner for web og vi har bedre styring med det som legges ut. Og her kommer bruk av metadata inn for å gi bedre struktur og standardisering av det som legges ut. Ved vanlig web-søk presenterers dokumentene i ei treffliste uten struktur.

Hva betyr semantisk web… (forts.) Semantisk web gir mening til informasjon ved at data kan deles og prosesseres av maskiner – maskin til maskin kommunikasjon, men også bedre menneske-maskin samhandling Semantisk web krever at informasjons bærende enheter på web er tagget med semantisk metadata på en standardisert måte Standardiseringen gjør det mulig å utveksle, bruke og gjenbruke data og informasjon på web De viktigste fundamentene for semantisk web er utvikling, registrering og deling av metadata skjemaer og ontologier og teknisk infrastruktur Den teknologiske infrastrukturen er ikke nok, men vi må forstå den for å kunne utnytte den DETTE ER TITTELEN PÅ PRESENTASJONEN Hva kan vi bidra med i denne sammenhengen? Og blir vi overflødig siden det er snakk om maskin til maskin kommunikasjon? Vi må bidra med å strukturere data’en så de kan bearbeides og gi mening. Standardisering og standarder er usexy og kjedelig, men så viktig i tankegangen og i utviklingen av semantisk web. For å underbygge at den teknologiske infrastrukturen ikke er nok vil jeg henvise til en art. og bok av Jane Greenberg, professor ved ……… og hun skriver i en art. i boka ”Knitting the semantic web” at ”Most semantic effort have focused on infrastructure and enabling technology development (like RDF and OWL), but building a network of shared semantics that is understandable and accessible by people and machines requires time and thinking”. Det tekniske ligger der det er innholdet som må skapes og der må vi som bibliotekarer være med.

Teknisk infrastruktur for semantisk web: RDF (Resource Description Framework) RDF er en datamodell (metadata standard) som definerer resurser (objekter) og relasjonene mellom dem RDF gjør det mulig for applikasjoner å utveksle data mellom servere verden over RDF støtter opp om semantisk web mål om deling av ressurser mellom applikasjoner og maskiner Eksempel på en RDF beskrivelse (datamodell) hvor geonames er et navnerom (namespace) og locatedIn er relasjonen mellom ressursene RDFS (RDF Skjema)et vokabular som beskriver egenskaper og klasser (ontologier) for RDF resurser DETTE ER TITTELEN PÅ PRESENTASJONEN Ontologier kan være tesauri, Dublin Core, FOAF m.m. Type (relasjonen) gir mening til dataene. Navnerom beskriver type kilde/emneområde (eks geografiske navn) hvor termene stammer fra. Navnerom gjør at man kan konsentrere seg om en kilde om gangen ved at eksperter kan jobbe med forskjellige navnerom. Noen navnerom som: for eksempel tid og nummer er mer eller mindre universelle og kan brukes på tvers. Navnerom hjelper med å plassere termene riktig jmf. fassetert klass. skjema. En ontologi kan ha flere navnerom. RDF gir enkel funksjonalitet for å beskrive ontologier, som brukes til å gi informasjon om RDF-ressurser. På enkleste måte kan RDF beskrives som: En ressurs eller alle ting som vi kan beskrive og gi en URL/URI til. Eller kort: Something has some relation to some other thing. locatedIn geonames:Oslo : geonames:Norway

Teknisk infrastruktur for semantisk web (forts Teknisk infrastruktur for semantisk web (forts.): OWL (Web Ontology Language) OWL er et ontologi språk (dataspråk) for beskrivelse av ontologier OWL kan definere begreper eller klasser, relasjoner mellom dem og egenskaper i ontologier OWL har tre forskjellige formater: OWL Lite, OWL DL and OWL Full OWL Lite kan brukes når man ønsker å restrukturere tesauri og taxonomier til ontologier Eks. AGROVOC tesaurusen er blitt restrukturert ved bruk av OWL i en mer semantisk strukturert concept server (begrepsserver) http://aims.fao.org/website/The-Concept-Server/sub DETTE ER TITTELEN PÅ PRESENTASJONEN OWL fyller de samme funksjonene som RDF Skjema , men er mer uttrykksfull. Både RDF skjema og OWL er RDF vokabularer og begge er W3C recommendasjon – W3C standarder. SKOS (Simple Knowledge Org. Systems) – publisere tesauri på semantisk web.

Ontologier – hva og hvorfor? Er et kunnskapsorganisasjonssystem (KOS) innen et bestemt fagområde (domene) som inneholder begreper ”concepts”, definisjon av begrepene og relasjonene mellom dem Kan også sees på som en web-basert tesaurus innenfor et bestemt fagområde med et utvidet sett av relasjoner En ontologi er en standardisert formell eller uformell organisering av kunnskap For bedre gjenfinning og presisjon ved søk innen et bestemt område For å utvikle bedre brukergrensesnitt som gir mer læring for de som søker For bedre samsøk og deling av kunnskap på web DETTE ER TITTELEN PÅ PRESENTASJONEN Fagområdet må være klart definert for de som skal jobbe med ontologien. Krever samarbeid. Termene i en ontologi kan hentes fra KOS’er innenfor et bestemt fagområde eller at en gruppe fagpersoner/bibliotekarer sitter ned og definerer hvilke begreper, termer, egenskaper og relasjoner som man enes om skal dekke området. Jmf. arbeidet med EDUnet ontologien.

Ontologier og fasettert klassifikasjon – to sider av samme sak, eller? Ontologier bygges opp av klasser (begreper) og relasjoner mellom klassen (begrepene) for å beskrive et domene (emneområde) Beskrivende ontologier: beskriver klasser i et domene med f.eks. is-a (er) eller part-of (del av) relasjoner DETTE ER TITTELEN PÅ PRESENTASJONEN Ontologier over pattedyr og fugler. Ontologier over geografiske områder. Generelle ontologier. Fugler lokalisert i Italia. Ontologi over all verden fugler og kobler den mot Italia.

Ontologier og fasettert klassifikasjon… (forts.) Klassifiserende ontologier: kategoriserer begrepene som i fasettert klassifikasjon Klassifiserende ontologier preger: Bibl. klassifikasjon, thesuri, web-directories og database skjemaer DETTE ER TITTELEN PÅ PRESENTASJONEN Jmf. A.C.Foskett ”The Subject Approach to Information”. Dette var teamet på et seminar om DL (Digital Libraries) og Semantic Wew (SW) som jeg deltok på i Italia sist høst. Konklusjonen var at ontologier og semantisk web var to sider av samme sak for strukturering av begrepsverden, men her er strukturen bestemt av underordnet versus overordnete begreper.

Fasettert klassifikasjon og fundamentale kategorier En fasett representerer en lik gruppe av begreper Kan organiseres som et sett av uavhengige domener eller moduler og på forskjellige måter Er gjestfrie og fleksible ved at nye termer lett kan inkluderes og fasetter kan gjenbrukes i andre sammenheng Kan vise et emne i komplekse sammenheng og fra forskjellige synsvinkler Kan brukes ved automatisk indeksering av dokumenter Fundamentale kategorier : Ranganathan 5 kategorier: PMEST (Personality, Matter, Energy, Space and Time) og Bhattachary (?) 4 kategorier : DEPA (Domain, Entity, Property, Action [+ Modifiers]) DETTE ER TITTELEN PÅ PRESENTASJONEN Bhattachary, G. var elev av Ranganathan foreslo DEPA som sammenfaller veldig med Semantisk Web/Ontolgier og nettet. PMEST kjenner vi fra indeksering av dokumenter ved analysering av dokumentets innhold. DEPA ligner mer på kategorisering av en ontologi.

Hvordan bygge opp en fasettert klass Hvordan bygge opp en fasettert klass./ontologi innenfor et bestemt område? Analysere et emneområde (domene) i samarbeid med emneeksperter – ide planet Definere begrepene som skal inngå Innsamling av termer manuelt fra fagfolk eller andre manuelle eller nettbaserte kilder (tesauri, taxonomier, ordbøker etc.) Sjekke om det allerede finnes ontologier som kan inkluderes Organisere termene i hierarkier eller etter relasjoner DEPA strukturen: Domain (D): for eksempel landbruk, Entity (E): korn, Property (P): for eksempel kvalitet, Action (A): for eksempel høsting DETTE ER TITTELEN PÅ PRESENTASJONEN Korn kan være forskjellige kornsorter, kvalitet kan være frostherdighet, høsting kan være type innhøstingsmåte

Semantisk web (sw) og bibliotek funksjoner – likheter i utvikling? Samlingsutvikling = utvalg av ressurser for semantisk web og deling av ressurser Katalogisering = Semantisk Web ”semantisk” representasjon (RDA den nye katalogiseringsstandarden) Referansetjenester/søk = Semantisk web søke tjenester Bibliotek og sw har lik målsetting som går på servise, tilgang til informasjon og bedre gjenfinning Bibliotek og sw har utviklet seg på grunnlag av internasjonale og nasjonale standarder Bibliotekene sitter på store ”lukkede” datamengder som ikke er tilrettelagt for gjenbruk i andre sammenheng og her kan sw bidra for bedre deling av ressurser DETTE ER TITTELEN PÅ PRESENTASJONEN RDA=resource description and access. Bibliotekene har utviklet standarder som: ISBD, MARC, AACR2 og RDA. Semantisk Web har : RDF, OWL, FOAF og SKOS. Det er kanskje litt mer løselige standarder, men de eksisterer som W3C (World Wide Web Consortium) formelle rekomenderinger. Både produksjon av metadata for semantisk web og katalogisering av dokumenter handler om representasjon. Bibliotekene har sine bibliografiske beskrivelser mens SW har metadata skjemaer og ontologier. Men pr. i dag mangler politikk for å guide i bruke av semantisk representasjon derfor er det viktig for fremtidige prosjekter å få frem gode eksempler for å dokumentere semantisk representasjon. Jane Greenberg, professor ved University of North Carolina , Metadat Research center sier i en art. Fra 2007 Cataloging & Classification Quarterly følgende: Web miljøet er ikke fullt ut klar over kompetansen som bibliotekmiljøene sitter med når det gjelder strukturering av informasjon og kunnskap til bruk i semantisk web. Bibliotekenes lukkede samlinger må “åpnes” for gjenbruk av andre applikasjoner og i andre sammenheng.

Det norske bibliotekmiljøet og utfordringen med semantisk web – hvem, hva og hvor? ”Web community are not fully aware of the skills, talent and knowledge that librarians have, and which can help advance the Semantic Web” skriver Prof. Jane Greenberg ved Univ. of North Carolina, Metadata Research Centre i art. i Cat. & Class. Quarterly fra 2007 Bibliotekmiljøet kan katalogisering, klassifikasjon, emneindeksering, tesauri, metadata m.m, men vi må bevise det for IKT og web-miljøet!! Hvem bør ta ansvaret for utviklingen av en web-tjeneste med informasjon om ontologier, metadata og semantisk web i Norge? Viktig at bibliotekmiljøene samler og registrerer norske KOS’er på web – kan bli en del av e-forskning og e-undervisning DETTE ER TITTELEN PÅ PRESENTASJONEN Ansvar for utviklingen i Norge? Fagmiljøene selv i samarbeid med BIBSYS, Nasjonalbiblioteket og andre internasjonale organisasjoner. FAO har opprettet en nettjeneste med oversikt og tilgang til alle KOS’ene innenfor sitt fagområde på deres side Noe å lære av for andre miljøer som vi lede utviklingen. Dette feltet er også viktig for e-forskning og e.undervisning

Det norske bibliotekmiljøet og utfordringen med semantisk web…(forts.) Hvem skal være pådriver? NKKI, Nasjonalbiblioteket, BIBSYS eller andre i samarbeid med bibliotekmiljøene/fagmiljøene Gledelig! Tema om biblioteker og semantisk web på IFLA konf. i Gøteborg i august FAOs (FNs mat- og landbruks org) har utiklet en web-tjeneste med oversikt og tilgang til KOS’er innen mat, landbruk, livsvitenskap m.m. http://aims.fao.org/website/Knowledge-Organization-Systems-%28KOS%29/sub Den tekniske infrastrukturen ligger der, men innholdet som skal skapes må vi bibliotekarer bidra med  Takk for oppmerksomheten! DETTE ER TITTELEN PÅ PRESENTASJONEN

Referanseliste Ontology Development 101: A guide to creating your first ontology http://protege.stanford.edu/publications/ontology_development/ontology101-noy-mcguinness.html Alligning Controlled Vocabularies using Faceted based approach ftp://ftp.fao.org/docrep/fao/012/ak911e/ak911e00.pdf Knitting the Semantic Web i Cataloging & Classification Quart., nr. 3/4, vol. 43, 2007 (flere artikler) http://www.catalogingandclassificationquarterly.com/ccq43nr3-4.html DETTE ER TITTELEN PÅ PRESENTASJONEN