Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

Semantisk web og ontologier – et forsøk på oppklaring

Liknende presentasjoner


Presentasjon om: "Semantisk web og ontologier – et forsøk på oppklaring"— Utskrift av presentasjonen:

1

2 Semantisk web og ontologier – et forsøk på oppklaring
Semantisk web og ontologier – et forsøk på oppklaring? Bibliotekmøtet 2010, Hamar Lisbeth Eriksen, Universitetsbiblioteket for miljø- og biovitenskap, Ås

3 Semantisk web – hva og hvorfor?
Min presentasjon Semantisk web – hva og hvorfor? Teknisk infrastruktur for semantisk web og ontologier Ontologier – hva og hvorfor? Fasettert klassifikasjon og ontologier – to sider av samme sak? Semantisk web og digitale bibliotekfunksjoner – likheter? Hva bør skjer videre innenfor det norske bibliotekfagligemiljøet? DETTE ER TITTELEN PÅ PRESENTASJONEN

4 Hva betyr semantisk web og hvorfor semantisk web, og ikke bare den ”vanlige” web’en?
Semantikk er den grenen av lingvistikken (språkvitenskapen) som studerer ordenes betydning, både enkeltvis og i sammenstilte strukturer Semantisk web har hentet sin betydning fra språkvitenskapen Semantisk web skal gi mer mening og struktur til ”dagens” web – smartere web Tim Berners-Lees visjon for www er utvidelse av web’en hvor: ”information is given well-defined meaning, better enabling computers and people to work in cooperation” Dagens web publiserer informasjon, mens semantisk web publiserer data DETTE ER TITTELEN PÅ PRESENTASJONEN Semantisk web erstatter ikke dagens web, men gjør den smartere! Dagens web gir treffliste over dokumenter med lenker videre til andre dokumenter uten å se informasjon i sammenhegng. Gjenfinning og presisjon synker p.g.a. dårlig gjenfinningssystemer – søker på ord i store dokumentmengder som kan ha forskjellig betydning i forhold til hvilke sammenheng de opptre i. Vi har fortsatt faglige databaser som er for spesielle fagområder (domener) og er kvalitetssikret etter utvalg, men dette gjelder ikke for verdensveven. Bedre menneske-maskin kommunikasjon fordi vi legger data til rette og lager applikasjoner for web og vi har bedre styring med det som legges ut. Og her kommer bruk av metadata inn for å gi bedre struktur og standardisering av det som legges ut. Ved vanlig web-søk presenterers dokumentene i ei treffliste uten struktur.

5 Hva betyr semantisk web… (forts.)
Semantisk web gir mening til informasjon ved at data kan deles og prosesseres av maskiner – maskin til maskin kommunikasjon, men også bedre menneske-maskin samhandling Semantisk web krever at informasjons bærende enheter på web er tagget med semantisk metadata på en standardisert måte Standardiseringen gjør det mulig å utveksle, bruke og gjenbruke data og informasjon på web De viktigste fundamentene for semantisk web er utvikling, registrering og deling av metadata skjemaer og ontologier og teknisk infrastruktur Den teknologiske infrastrukturen er ikke nok, men vi må forstå den for å kunne utnytte den DETTE ER TITTELEN PÅ PRESENTASJONEN Hva kan vi bidra med i denne sammenhengen? Og blir vi overflødig siden det er snakk om maskin til maskin kommunikasjon? Vi må bidra med å strukturere data’en så de kan bearbeides og gi mening. Standardisering og standarder er usexy og kjedelig, men så viktig i tankegangen og i utviklingen av semantisk web. For å underbygge at den teknologiske infrastrukturen ikke er nok vil jeg henvise til en art. og bok av Jane Greenberg, professor ved ……… og hun skriver i en art. i boka ”Knitting the semantic web” at ”Most semantic effort have focused on infrastructure and enabling technology development (like RDF and OWL), but building a network of shared semantics that is understandable and accessible by people and machines requires time and thinking”. Det tekniske ligger der det er innholdet som må skapes og der må vi som bibliotekarer være med.

6 Teknisk infrastruktur for semantisk web: RDF (Resource Description Framework)
RDF er en datamodell (metadata standard) som definerer resurser (objekter) og relasjonene mellom dem RDF gjør det mulig for applikasjoner å utveksle data mellom servere verden over RDF støtter opp om semantisk web mål om deling av ressurser mellom applikasjoner og maskiner Eksempel på en RDF beskrivelse (datamodell) hvor geonames er et navnerom (namespace) og locatedIn er relasjonen mellom ressursene RDFS (RDF Skjema)et vokabular som beskriver egenskaper og klasser (ontologier) for RDF resurser DETTE ER TITTELEN PÅ PRESENTASJONEN Ontologier kan være tesauri, Dublin Core, FOAF m.m. Type (relasjonen) gir mening til dataene. Navnerom beskriver type kilde/emneområde (eks geografiske navn) hvor termene stammer fra. Navnerom gjør at man kan konsentrere seg om en kilde om gangen ved at eksperter kan jobbe med forskjellige navnerom. Noen navnerom som: for eksempel tid og nummer er mer eller mindre universelle og kan brukes på tvers. Navnerom hjelper med å plassere termene riktig jmf. fassetert klass. skjema. En ontologi kan ha flere navnerom. RDF gir enkel funksjonalitet for å beskrive ontologier, som brukes til å gi informasjon om RDF-ressurser. På enkleste måte kan RDF beskrives som: En ressurs eller alle ting som vi kan beskrive og gi en URL/URI til. Eller kort: Something has some relation to some other thing. locatedIn geonames:Oslo : geonames:Norway

7 Teknisk infrastruktur for semantisk web (forts
Teknisk infrastruktur for semantisk web (forts.): OWL (Web Ontology Language) OWL er et ontologi språk (dataspråk) for beskrivelse av ontologier OWL kan definere begreper eller klasser, relasjoner mellom dem og egenskaper i ontologier OWL har tre forskjellige formater: OWL Lite, OWL DL and OWL Full OWL Lite kan brukes når man ønsker å restrukturere tesauri og taxonomier til ontologier Eks. AGROVOC tesaurusen er blitt restrukturert ved bruk av OWL i en mer semantisk strukturert concept server (begrepsserver) DETTE ER TITTELEN PÅ PRESENTASJONEN OWL fyller de samme funksjonene som RDF Skjema , men er mer uttrykksfull. Både RDF skjema og OWL er RDF vokabularer og begge er W3C recommendasjon – W3C standarder. SKOS (Simple Knowledge Org. Systems) – publisere tesauri på semantisk web.

8 Ontologier – hva og hvorfor?
Er et kunnskapsorganisasjonssystem (KOS) innen et bestemt fagområde (domene) som inneholder begreper ”concepts”, definisjon av begrepene og relasjonene mellom dem Kan også sees på som en web-basert tesaurus innenfor et bestemt fagområde med et utvidet sett av relasjoner En ontologi er en standardisert formell eller uformell organisering av kunnskap For bedre gjenfinning og presisjon ved søk innen et bestemt område For å utvikle bedre brukergrensesnitt som gir mer læring for de som søker For bedre samsøk og deling av kunnskap på web DETTE ER TITTELEN PÅ PRESENTASJONEN Fagområdet må være klart definert for de som skal jobbe med ontologien. Krever samarbeid. Termene i en ontologi kan hentes fra KOS’er innenfor et bestemt fagområde eller at en gruppe fagpersoner/bibliotekarer sitter ned og definerer hvilke begreper, termer, egenskaper og relasjoner som man enes om skal dekke området. Jmf. arbeidet med EDUnet ontologien.

9 Ontologier og fasettert klassifikasjon – to sider av samme sak, eller?
Ontologier bygges opp av klasser (begreper) og relasjoner mellom klassen (begrepene) for å beskrive et domene (emneområde) Beskrivende ontologier: beskriver klasser i et domene med f.eks. is-a (er) eller part-of (del av) relasjoner DETTE ER TITTELEN PÅ PRESENTASJONEN Ontologier over pattedyr og fugler. Ontologier over geografiske områder. Generelle ontologier. Fugler lokalisert i Italia. Ontologi over all verden fugler og kobler den mot Italia.

10 Ontologier og fasettert klassifikasjon… (forts.)
Klassifiserende ontologier: kategoriserer begrepene som i fasettert klassifikasjon Klassifiserende ontologier preger: Bibl. klassifikasjon, thesuri, web-directories og database skjemaer DETTE ER TITTELEN PÅ PRESENTASJONEN Jmf. A.C.Foskett ”The Subject Approach to Information”. Dette var teamet på et seminar om DL (Digital Libraries) og Semantic Wew (SW) som jeg deltok på i Italia sist høst. Konklusjonen var at ontologier og semantisk web var to sider av samme sak for strukturering av begrepsverden, men her er strukturen bestemt av underordnet versus overordnete begreper.

11 Fasettert klassifikasjon og fundamentale kategorier
En fasett representerer en lik gruppe av begreper Kan organiseres som et sett av uavhengige domener eller moduler og på forskjellige måter Er gjestfrie og fleksible ved at nye termer lett kan inkluderes og fasetter kan gjenbrukes i andre sammenheng Kan vise et emne i komplekse sammenheng og fra forskjellige synsvinkler Kan brukes ved automatisk indeksering av dokumenter Fundamentale kategorier : Ranganathan 5 kategorier: PMEST (Personality, Matter, Energy, Space and Time) og Bhattachary (?) 4 kategorier : DEPA (Domain, Entity, Property, Action [+ Modifiers]) DETTE ER TITTELEN PÅ PRESENTASJONEN Bhattachary, G. var elev av Ranganathan foreslo DEPA som sammenfaller veldig med Semantisk Web/Ontolgier og nettet. PMEST kjenner vi fra indeksering av dokumenter ved analysering av dokumentets innhold. DEPA ligner mer på kategorisering av en ontologi.

12 Hvordan bygge opp en fasettert klass
Hvordan bygge opp en fasettert klass./ontologi innenfor et bestemt område? Analysere et emneområde (domene) i samarbeid med emneeksperter – ide planet Definere begrepene som skal inngå Innsamling av termer manuelt fra fagfolk eller andre manuelle eller nettbaserte kilder (tesauri, taxonomier, ordbøker etc.) Sjekke om det allerede finnes ontologier som kan inkluderes Organisere termene i hierarkier eller etter relasjoner DEPA strukturen: Domain (D): for eksempel landbruk, Entity (E): korn, Property (P): for eksempel kvalitet, Action (A): for eksempel høsting DETTE ER TITTELEN PÅ PRESENTASJONEN Korn kan være forskjellige kornsorter, kvalitet kan være frostherdighet, høsting kan være type innhøstingsmåte

13 Semantisk web (sw) og bibliotek funksjoner – likheter i utvikling?
Samlingsutvikling = utvalg av ressurser for semantisk web og deling av ressurser Katalogisering = Semantisk Web ”semantisk” representasjon (RDA den nye katalogiseringsstandarden) Referansetjenester/søk = Semantisk web søke tjenester Bibliotek og sw har lik målsetting som går på servise, tilgang til informasjon og bedre gjenfinning Bibliotek og sw har utviklet seg på grunnlag av internasjonale og nasjonale standarder Bibliotekene sitter på store ”lukkede” datamengder som ikke er tilrettelagt for gjenbruk i andre sammenheng og her kan sw bidra for bedre deling av ressurser DETTE ER TITTELEN PÅ PRESENTASJONEN RDA=resource description and access. Bibliotekene har utviklet standarder som: ISBD, MARC, AACR2 og RDA. Semantisk Web har : RDF, OWL, FOAF og SKOS. Det er kanskje litt mer løselige standarder, men de eksisterer som W3C (World Wide Web Consortium) formelle rekomenderinger. Både produksjon av metadata for semantisk web og katalogisering av dokumenter handler om representasjon. Bibliotekene har sine bibliografiske beskrivelser mens SW har metadata skjemaer og ontologier. Men pr. i dag mangler politikk for å guide i bruke av semantisk representasjon derfor er det viktig for fremtidige prosjekter å få frem gode eksempler for å dokumentere semantisk representasjon. Jane Greenberg, professor ved University of North Carolina , Metadat Research center sier i en art. Fra 2007 Cataloging & Classification Quarterly følgende: Web miljøet er ikke fullt ut klar over kompetansen som bibliotekmiljøene sitter med når det gjelder strukturering av informasjon og kunnskap til bruk i semantisk web. Bibliotekenes lukkede samlinger må “åpnes” for gjenbruk av andre applikasjoner og i andre sammenheng.

14 Det norske bibliotekmiljøet og utfordringen med semantisk web – hvem, hva og hvor?
”Web community are not fully aware of the skills, talent and knowledge that librarians have, and which can help advance the Semantic Web” skriver Prof. Jane Greenberg ved Univ. of North Carolina, Metadata Research Centre i art. i Cat. & Class. Quarterly fra 2007 Bibliotekmiljøet kan katalogisering, klassifikasjon, emneindeksering, tesauri, metadata m.m, men vi må bevise det for IKT og web-miljøet!! Hvem bør ta ansvaret for utviklingen av en web-tjeneste med informasjon om ontologier, metadata og semantisk web i Norge? Viktig at bibliotekmiljøene samler og registrerer norske KOS’er på web – kan bli en del av e-forskning og e-undervisning DETTE ER TITTELEN PÅ PRESENTASJONEN Ansvar for utviklingen i Norge? Fagmiljøene selv i samarbeid med BIBSYS, Nasjonalbiblioteket og andre internasjonale organisasjoner. FAO har opprettet en nettjeneste med oversikt og tilgang til alle KOS’ene innenfor sitt fagområde på deres side Noe å lære av for andre miljøer som vi lede utviklingen. Dette feltet er også viktig for e-forskning og e.undervisning

15 Det norske bibliotekmiljøet og utfordringen med semantisk web…(forts.)
Hvem skal være pådriver? NKKI, Nasjonalbiblioteket, BIBSYS eller andre i samarbeid med bibliotekmiljøene/fagmiljøene Gledelig! Tema om biblioteker og semantisk web på IFLA konf. i Gøteborg i august FAOs (FNs mat- og landbruks org) har utiklet en web-tjeneste med oversikt og tilgang til KOS’er innen mat, landbruk, livsvitenskap m.m. Den tekniske infrastrukturen ligger der, men innholdet som skal skapes må vi bibliotekarer bidra med  Takk for oppmerksomheten! DETTE ER TITTELEN PÅ PRESENTASJONEN

16 Referanseliste Ontology Development 101: A guide to creating your first ontology Alligning Controlled Vocabularies using Faceted based approach ftp://ftp.fao.org/docrep/fao/012/ak911e/ak911e00.pdf Knitting the Semantic Web i Cataloging & Classification Quart., nr. 3/4, vol. 43, 2007 (flere artikler) DETTE ER TITTELEN PÅ PRESENTASJONEN


Laste ned ppt "Semantisk web og ontologier – et forsøk på oppklaring"

Liknende presentasjoner


Annonser fra Google