Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

2003 Ontopia AS1 Om emnekartprosjekter Lars Marius Garshol, utviklingsleder Ontopia, Fra emnekratt til emnekart.

Liknende presentasjoner


Presentasjon om: "2003 Ontopia AS1 Om emnekartprosjekter Lars Marius Garshol, utviklingsleder Ontopia, Fra emnekratt til emnekart."— Utskrift av presentasjonen:

1 Ontopia AS1 Om emnekartprosjekter Lars Marius Garshol, utviklingsleder Ontopia, Fra emnekratt til emnekart

2 Ontopia AS1 Introduksjon Er emnekartprosjekter som andre prosjekter?

3 Ontopia AS1 Emnekartprosjekter er som andre prosjekter! • De samme reglene for god prosjektskikk gjelder – vit hva du vil oppnå – sørg for å ha en god kravspesifikasjon – start forsiktig, men planlegg langsiktig – unngå forandringer når du først har begynt – hold kontroll på prosjektet – start smått – følg vanlig god utviklingspraksis – gjør kvalitetssikring som vanlig – osv osv osv • Det eneste som er nytt er – informasjonen er strukturert på en annen måte – kanskje prøver man å gjøre ting man ikke har gjort før

4 Ontopia AS1 Fokus på informasjon • Emnekartprosjekter er informasjonssentriske – informasjon står i fokus, ikke oppførsel – oppførsel styres av informasjonen, ikke omvendt • Forskjellen fra andre prosjekter er – noe av informasjonen er emnekart istedet for XML/RDBMS/... – man bruker gjerne mer tid på å arbeide med informasjonen – man kan få til ting som ikke var oppnåelige før Emnekartprosjekter er som andre prosjekter!

5 Ontopia AS1 Ontologien Hva er en ontologi? Hva trenger man den til? Og hvordan får man en?

6 Ontopia AS1 Hva er en ontologi? • Hvis jeg vil si... – “Lars Marius er en person” – “Ontopia er et firma” – “Lars Marius er ansatt i Ontopia” •...må jeg ha en ontologi for det • Jeg trenger emner for – “person” – “firma” – “ansatt i” • Disse tre emnene er ontologien • “Lars Marius” og “Ontopia” er instanser Lars Marius Ontopia Instanser

7 Ontopia AS1 Hva er en ontologi? • Hvis jeg vil si... – “Lars Marius er en person” – “Ontopia er et firma” – “Lars Marius er ansatt i Ontopia” •...må jeg ha en ontologi for det • Jeg trenger emner for – “person” – “firma” – “ansatt i” • Disse tre emnene er ontologien • “Lars Marius” og “Ontopia” er instanser ansatt i Lars Marius Ontopia person firma Ontologi Instanser

8 Ontopia AS1 Hva er en ontologi? • Hvis jeg vil si... – “Lars Marius er en person” – “Ontopia er et firma” – “Lars Marius er ansatt i Ontopia” •...må jeg ha en ontologi for det • Jeg trenger emner for – “person” – “firma” – “ansatt i” • Disse tre emnene er ontologien • “Lars Marius” og “Ontopia” er instanser ansatt i Lars Marius Ontopia person firma Ontologi Instanser Emnekart

9 Ontopia AS1 Ontologier er som språk • Ontologien bestemmer hva du kan si – den er modellen av informasjonen man jobber med • Hva du kan si styrer i praksis prosjektet – brukergrensesnittet bygges med utgangspunkt i ontologien – skal du legge til emnetypen “prosjekt” trenger du sannsynligvis også et nytt skjermbilde for å vise informasjonen om prosjekter – øvrig funksjonalitet bygges også med utgangspunkt i ontologien • Ontologien er derfor prosjektets utgangspunkt – ontologien bør utarbeides så tidlig i prosjektet som mulig – ontologien bør dokumenteres grundig – alle parter bør ha en felles forståelse av ontologien – som kunde: sørg for at du forstår ontologien!

10 Ontopia AS1 Ontologier er som skjemaer/DTD-er • Relasjonsdatabaser er bygget opp av tabeller – all informasjon som skal inn må inn som en verdi i en tabellcelle – har du ingen kolonne for det du vil legge inn får du ikke lagt det inn – skjemaet (tabelloppsettet) tilsvarer ontologien i et emnekart – dette tilsvarer organiseringen av et regneark i Excel • XML-dokumenter består av elementer og attributter – all informasjon må pakkes inn i elementer eller attributter – har du ikke et element for det du vil si kan du ikke si det – DTD-en/skjemaet tilsvarer ontologien i et emnekart

11 Ontopia AS1 Skjemaer • Selve ontologien er bare en samling emner – “person”, “firma”, “ansatt-i”, “fødselsdato”, “hjemmeside” • Ofte vil man også formulere regler for ontologien – “alle personer må være ansatt i et firma” – “bare personer kan være ansatt” – “man ikke være både et firma og en person” – “alle personer må ha akkurat én fødselsdato” – “alle firmaer må ha akkurat én hjemmeside” • Disse kan formaliseres i et skjema – emnekartet kan da automatisk valideres mot skjemaet – skjemaet vil dokumentere reglene kort og konsist – ISO jobber med en standard for dette: TMCL

12 Ontopia AS1 Hvordan utvikle en ontologi • Hva trenger man? – emnekart-ekspertise, og kompetanse på datamodellering – domenekunnskap – brukere – oversikt over eksisterende data – oversikt over data som skal inn i systemet – oversikt over data som skal ut av systemet – oversikt over systemets ønskede funksjonalitet • Det kan være nødvendig med et analyseskritt først • Ontologien bør utvikles av noen med emnekartkunnskap – i samråd med de som kjenner området emnekartet skal dekke • Brukertesting er en viktig form for kvalitetssikring

13 Ontopia AS1 Ontologien kan utvides skritt for skritt • Emnekart er lett utvidbare – vil man si mer er det bare å hekte det på det som er der allerede • Det nye som legges på forstyrrer ingenting • Dette gjør at man kan starte enkelt og bygge på etterhvert Om emnekart- prosjekter Lars Marius Garshol skrevet av

14 Ontopia AS1 Ontologien kan utvides skritt for skritt • Emnekart er lett utvidbare – vil man si mer er det bare å hekte det på det som er der allerede • Det nye som legges på forstyrrer ingenting • Dette gjør at man kan starte enkelt og bygge på etterhvert Om emnekart- prosjekter Lars Marius Garshol Ontopia ansatt iskrevet av Emnekart handler om

15 Ontopia AS1 Ontologien kan utvides skritt for skritt • Emnekart er lett utvidbare – vil man si mer er det bare å hekte det på det som er der allerede • Det nye som legges på forstyrrer ingenting • Dette gjør at man kan starte enkelt og bygge på etterhvert Om emnekart- prosjekter Lars Marius Garshol Ontopia ansatt iskrevet av SC34 medlem av Oslo Emnekart kontor i handler om

16 Ontopia AS1 Ontologier er ikke vanskelige! • Se på dette eksempelet – hvor vanskelig er det å forstå? • Kan du forstå dette kan du forstå en ontologi – de tekniske detaljene er ikke nødvendige for å forstå dette Om emnekart- prosjekter Lars Marius Garshol Ontopia ansatt iskrevet av SC34 medlem av Oslo Emnekart kontor i handler om

17 Ontopia AS1 Vær kreativ! • Det du ble fortalt var umulig før kan være mulig nå – noe av vitsen med emnekart er at de åpner nye muligheter – begrensningene ligger nå mer i fantasien enn noe annet sted – “hva kan vi egentlig si om informasjonen vår?” • Husk at du kan gjøre noe mer enn bare å lage en tesaurus – emnekart trenger ikke være hierarkier! • Emnekart er ikke bare for leksikon-aktige emner, de kan også inneholde – brukerinformasjon – oppsettinformasjon – osv

18 Ontopia AS1 Hvordan lage et emnekart Hvor kommer emnekart fra? Hvordan vedlikeholder man et emnekart? Hva med mine gamle data?

19 Ontopia AS1 Håndlagde emnekart • Emnekart kan utmerket godt skrives av mennesker • Fordeler – høy kvalitet på resultatet • Ulemper – dyrt – ofte langsomt – ikke alle er villige til å jobbe med “metadata” • Forutsetninger – god prosess med retningslinjer, opplæring og kanskje arbeidsflyt – egen applikasjon for redigering av emnekartet

20 Ontopia AS1 Automatisering • Emnekart kan også produseres automatisk – billigere og raskere – som regel lavere kvalitet • De tre nivåene er svært ulike: – ontologien må i praksis gjøres manuelt – instanser er lettere å automatisere – forekomster klarer man ganske bra • Alt avhenger av hvordan kildedataene ser ut! – bare mennesker kan skape ny informasjon... ansatt i Lars Marius Ontopia person firma Ontologi Instanser Forekomster

21 Ontopia AS1 Automatisk generering av instanser • Mulige kilder for instanser kan være – databaser – klassifiseringssystemer – metadata – andre strukturerte data – ren tekst (vanskelig!) • For denne typen generering trenger man konverteringsrutiner – disse må settes opp av utviklere – det finnes rammeverk som forenkler dette arbeidet – detaljert oppsett for hvert enkelt prosjekt er likevel nødvendig • Identitet er viktig!

22 Ontopia AS1 Fra database til emnekart DEPARTMENT MAJOROFFERS 11 SECTION ENROLLS HAS mn STUDENT n n COURSE n 1 Entity-relationship diagram for a university database (from J. Sowa, Knowledge Representation) DEPARTMENT MAJOROFFERS 11 SECTION ENROLLS HAS mn STUDENT n n COURSE n 1 Candidate topic types Candidate association types Column names in each table provide candidate occurrence types, e.g. age, description, address

23 Ontopia AS1 Fra metadata til emnekart The XML Papers Steve Pepper Ontopia Lars Marius Garshol Ontopia This paper describes...

24 Ontopia AS1 Fra metadata til emnekart The XML Papers Steve Pepper Ontopia Lars Marius Garshol Ontopia This paper describes... The XML Papers Steve Pepper Lars Marius Garshol Ontopia This paper describes... ansatt i skrevet av sammendrag

25 Ontopia AS1 Automatisk generering av forekomster • Dersom man allerede har et emnekart kan man plassere nye forekomster inn i dette automatisk • Dette krever programvare som kan lese dokumentene og klassifisere dem • Slik programvare trenger ikke nødvendigvis så mye oppsett – emnekartet er i praksis oppsettet – programvaren leser dokumentet og kjenner igjen emner fra emnekartet – den evaluerer hvor relevant dokumentet er for hvert enkelt emne – forekomster opprettes utfra dette • Kvaliteten vil variere sterkt med emnekart, dokument og verktøy

26 Ontopia AS1 Eksempel The XML Papers: Lessons on Applying Topic Maps This paper describes some of the basic steps in applying topic maps in a real world application, a topic map-driven web portal of conference papers. It covers the tasks of collecting and examining source data, defining an ontology and populating a topic map. It discusses tools for automatically creating topic maps, with particular emphasis on how the synergies between topic maps and RDF can be exploited in the process of autogenerating topic maps from structured and semi-structured source data. It also provides an introduction to the concept of published subjects, describes how they are being applied in this project and details the benefits that they are expected to bring in both this and other projects.

27 Ontopia AS1 Eksempel The XML Papers: Lessons on Applying Topic Maps This paper describes some of the basic steps in applying topic maps in a real world application, a topic map-driven web portal of conference papers. It covers the tasks of collecting and examining source data, defining an ontology and populating a topic map. It discusses tools for automatically creating topic maps, with particular emphasis on how the synergies between topic maps and RDF can be exploited in the process of autogenerating topic maps from structured and semi-structured source data. It also provides an introduction to the concept of published subjects, describes how they are being applied in this project and details the benefits that they are expected to bring in both this and other projects. topic maps XML ontologies RDF published subjects

28 Ontopia AS1 Konvertering kan gjøres på ulike måter • Konvertér hele datasettet på nytt hver gang – “batched conversion” – enkelt å sette opp, kan være vanskelig å synkronisere med endringer – best hvis man kaster det opprinnelige datasettet etterpå • Automatisk synkronisering – oppdatér emnekartet etterhvert som datasettet oppdateres – hver gang brukerne endrer datakilden oppdateres emnekartet tilsvarende • Emnekartbriller – lager “virtuelt emnekart” fra datakilden – endringer i datakilden er umiddelbart synlige i emnekartet

29 Ontopia AS1 Valgfrihet • Den største utfordringen her er som regel å velge riktig • Alle mulighetene er åpne – spørsmålet er hva som er riktig for hvert enkelt prosjekt • Riktig svar avhenger av – prosjektets informasjonskilder – prosjektets behov (er det OK om emnekartet ikke er 100% i sync?) – prosjektets budsjettrammer

30 Ontopia AS1 Emnekartsystemers anatomi Hvordan ser en emnekartportal ut inni? Hvordan er den forskjellig fra en vanlig portal? Hva trenger jeg egentlig av verktøy?

31 Ontopia AS1 En vanlig portal – litt forenklet Applikasjon data- base -sider http server klient

32 Ontopia AS1 En emnekartportal Applikasjon emne- kart -sider http server klient

33 Ontopia AS1 Flere applikasjoner på samme emnekart Portal #1 emne- kart -sider http server klient Portal #2 Redigerings- grensesnitt

34 Ontopia AS1 Emnekart uten verktøy • Man kan lage emnekartløsninger med bare XSLT – man lagrer emnekartet som en XTM-fil og publiserer med XSLT – dette kan være en god måte å komme igang på • Problemet er at dette – er tungvint – fungerer ikke for store emnekart – fungerer ikke for emnekart som skal endres av brukere – støtter ikke fletting – støtter ikke avanserte søk

35 Ontopia AS1 Emnekartverktøy • Ordentlige emnekartverktøy er basert på en motor – dette tilsvarer en databaseserver for databaser – motoren lagrer emnekartet, gjør fletting og søk – den er gjerne basert på en form for database – den gjør også import/eksport til/fra XTM og andre formater • I tillegg til motoren finnes som regel – rammeverk for publisering drevet av emnekartet – rammeverk for redigering av emnekartet – verktøy for konvertering av data til emnekart

36 Ontopia AS1 Sjekkliste for emnekartverktøy • Støtte for XTM-import og -eksport • Støtte for fletting • Søkespråk for avanserte søk • Fulltekstsøk • Funksjonalitet for innhold • Støtte for redigering? • Følger de standarden? • Ytelse • Skalérbarhet • Pris Finn ut hva du trenger!

37 Ontopia AS1 Emnekart er en standard • At emnekart er en standard gir liten gevinst dersom – man bruker verktøy som ikke følger standarden – emnekartet ikke følger standarden • Men hvordan sjekke dette? – ISO arbeider med en ny versjon av emnekartstandarden – denne vil tette alle smutthull og definere Canonical XTM – planen er å bruke Canonical XTM til å lage en testpakke – denne vil kunne brukes til å teste om verktøy følger standarden

38 Ontopia AS1 Noen viktige begreper • XTM – XML Topic Maps – XML-syntaks for emnekart standardisert av ISO – formatet for utveksling av emnekart • PSI – Published Subject Indicator – mekanisme for definisjon av standardiserte emner – disse kan gjenbrukes i ulike emnekart – får fletting (merging) til å fungere • TMCL – Topic Map Constraint Language – skjemaspråk for emnekart under utarbeidelse av ISO • TMQL – Topic Map Query Language – spørrespråk for emnekart under utarbeidelse av ISO

39 Ontopia AS1 Konklusjon Så, hva gjør man?

40 Ontopia AS1 Oppsummering • Emnekartprosjekter er som andre prosjekter • Ontologi – alle emnekart må ha en ontologi – ontologien er styrende for prosjektet • Oppretting og vedlikehold – kan gjøres både manuelt og maskinelt – maskiner kan ikke gjøre alt – man kan sette sammen en løsning etter behov • Emnekartverktøy – er ikke så ulike eksisterende verktøy som man kunne tro – trenger en emnekartmotor

41 Ontopia AS1 Do try this at home!


Laste ned ppt "2003 Ontopia AS1 Om emnekartprosjekter Lars Marius Garshol, utviklingsleder Ontopia, Fra emnekratt til emnekart."

Liknende presentasjoner


Annonser fra Google