Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

© 2002 Ontopia AS 1 Emnekart i praksis Hvordan komme igang Lars Marius Garshol Ontopia Emnekart Norge 2002.

Liknende presentasjoner


Presentasjon om: "© 2002 Ontopia AS 1 Emnekart i praksis Hvordan komme igang Lars Marius Garshol Ontopia Emnekart Norge 2002."— Utskrift av presentasjonen:

1 © 2002 Ontopia AS 1 Emnekart i praksis Hvordan komme igang Lars Marius Garshol Ontopia Emnekart Norge 2002

2 © 2002 Ontopia AS 2 Oversikt over foredraget •Forsøk på å forklare hvordan man kommer igang med et emnekartprosjekt •Svar på spørsmål som –hva slags prosjekt bør man starte med? –hva må man ta hensyn til? –hva trenger man? –hva slags verktøy finnes? •Sannheten er at 45 minutter ikke er nok til å besvare alle spørsmål

3 © 2002 Ontopia AS 3 #1: Det er lettere enn du tror! •Nå som dette er nytt virker det kanskje komplisert og vanskelig •Sannheten er at emnekart er utrolig enkelt •Alle emnekart består av –ting –forhold mellom ting –ressurser om tingene –navn på tingene •Du trenger ikke mer for å lage et nyttig emnekart!

4 © 2002 Ontopia AS 4 Ting, forhold, ressurser TING forhold Dette er ikke ordentlig tekst, bare noe jeg skrive for at dette skal se ut som et dokument, selv om det altså egentlig ikke er noe dokument, men bare juks som jeg skal bruke i denne presentasjo|nen. Nuvel. ressurs TING

5 © 2002 Ontopia AS 5 Erfaring er den beste lærer •Hvis du er litt teknisk anlagt –velg et tema du synes er interessant –last ned Omnigator –sett i gang med en teksteditor og LTM –en kveld er nok til å lage et enkelt utkast •Hvis du ikke er teknisk anlagt overhodet –bruk papir og blyant –rundinger er ting, streker er forhold, bokser er ressurser –se hva du får til! •En tredje mulighet –1-2 dager kurs hjelper –særlig dersom en interaktiv "lag et emnekart"-sesjon inngår

6 © 2002 Ontopia AS 6 Du kan velge ambisjonsnivå •Du trenger ikke lage "alle leksikons mor" med én gang •Du kan godt starte med en liten del av informasjonsmengden •Dersom denne er interessant i seg selv kan du –gjøre et komplett prosjekt på denne delen –som neste skritt velge et annet utvalg av informasjonen –resultatet fra neste skritt kan hektes inn i det første emnekartet •Emnekartet kan med andre ord vokse organisk etter behov

7 © 2002 Ontopia AS 7 Smått er trygt •Et lite prosjekt er tryggere enn et stort –kompleksiteten er mindre –prislappen er mindre –ambisjonene som regel mindre •Etter første prosjektet har man lært mer om –hva som er realistisk å få til –hvor man får mest ut av emnekart –hva som fungerer og ikke fungerer i egen organisasjon •Det er fullt mulig å gjennomføre en pilot uten å betale en krone! –ved å bruke gratisverktøy og ikke leie inn hjelp –mange har gjort det allerede

8 © 2002 Ontopia AS 8 Emnekartet er et register

9 © 2002 Ontopia AS 9 #2: Du trenger en ontologi! •"Ontologi" høres skummelt og vanskelig ut •Det er bare typene av ting, forhold, og ressurser –"person, barn-av, fødselsdato" er en minimal ontologi •Ontologien bestemmer hva du kan si i emnekartet ditt •Dette er på samme måten som –DTD-en (eller XML Schema) for XML –databaseskjemaet for en relasjonsdatabase –kolonneoppsettet i et Excel-regneark

10 © 2002 Ontopia AS 10 Ontologier kan gjenbrukes •Ontologien kan du –utvikle selv, –gjenbruke om det finnes en kilde, –eller litt av begge deler (som forsking.no gjorde) •Ofte kan mye løftes rett ut av offentlige emnekart –employed-by, located-in, part-of, created-by,... •Kan være lurt å be om hjelp –konsulenter kan designe hele greia for deg –eller de kan vurdere det dere har laget •Har du eksisterende data kan idéer hentes derfra

11 © 2002 Ontopia AS 11 Eksempel på inspirasjon Topic Maps, The Business Case Kal Ahmed Founder Techquila Oxford [...] Artikkel Person Stilling Firma By skrevet-av har-kontor-i ansatt-i har-stilling

12 © 2002 Ontopia AS 12 Ontologier biter ikke! •Ofte vanskelig å lage ontologien med en gang –hvilke typer ting og forhold har vi egentlig? •Du kan velge hvor presis du vil være –det går an å bare ha én forholdstype: har-forhold-til –mer presisjon er bedre, men vanskeligere •Det går an å forandre ontologien underveis –eksisterende data ødelegges ikke av en endring –RDBMS-er har et rigid skjema, emnekart er mye lettere slik •Siden emnekartet ligger utenfor dataene det snakker om... •Ofte starter man nokså upresist –presisjonen økes ved behov

13 © 2002 Ontopia AS 13 Emnet som knutepunkt, #1 Guidance topic Parent topic Child topic

14 © 2002 Ontopia AS 14 Emnet som knutepunkt, #2 Guidance topic Master topic Derived topic Parent topic Child topic

15 © 2002 Ontopia AS 15 Emnet som knutepunkt, #3 Guidance topic Master topic Derived topic Parent topic Child topic Concept Responsible person Workflow state

16 © 2002 Ontopia AS 16 Forfatterne må kunne ontologien! •Dersom mennesker skal produsere emnekartet –må de vite hvordan den fungerer –hva som er tanken bak •Ellers blir det umulig for dem å bruke den riktig •Et inkonsistent emnekart er... •Løsninger –opplæring –selv-dokumentasjon

17 © 2002 Ontopia AS 17 #3: Kjenn dine data! •I alle informasjonsprosjekter er det dataene som bestemmer •All funksjonalitet lages på dataenes premisser •Dette kan bety ett av to ting –det avgjørende er temaene du vil beskrive, eller –det avgjørende er hvilke data du allerede har •Dette er det aller viktigste og det du bør fokusere på først –hva skal emnekartet handle om? –hva skal det si om disse tingene? •Nå har du råmateriale til en ontologi allerede...

18 © 2002 Ontopia AS 18 Informasjon oppstår ikke av seg selv prosjektet informasjon inn og ut

19 © 2002 Ontopia AS 19 Kjenn dine kilder •Dette er det nest viktigste spørsmålet –hvor kommer informasjonen fra? •Som regel er det fire muligheter –den skrives inn av mennesker (fra andre kilder) –den genereres av maskiner (fra andre kilder) –den skrives av mennesker, og annoteres av maskiner –den genereres av maskiner, og annoteres av mennesker

20 © 2002 Ontopia AS 20 Garbage in, garbage out •Ved automatisk generering er formen på data uhyre viktig •Å speile formen på inndata i emnekart er veldig lett •Med veldig strukturerte data er det en lek å lage emnekart •Med helt flate data er det fortsatt mulig –maskiner kan skjønne at "Lars Marius" er navnet på en person og at "Ontopia A/S" er et firma •Maskinene kan gjøre en bedre jobb hvis du allerede har et emnekart –hvis emnekartet sier "topic maps er en teknologi" kan maskiner skjønne at dokument X handler om teknologien topic maps

21 © 2002 Ontopia AS 21 Litt manuell innsats kan oppnå mye •Det er mulig å lage emnekart fra dokumenter helt automatisk •Selv uten å ha en god ontologi på forhånd •Men, hvis du –skaffer deg en god ontologi først, og –har noen til å finpusse det maskinen produserer •kan du ofte få et mye bedre resultat

22 © 2002 Ontopia AS 22 Identitet •Det sentrale i alle emnekart er identitet •Du kommer mye lenger hvis du kan identifisere emnene •Bruk identifikatorer! –i eksisterende data, se etter hva som identifiserer ting –kommunenummer, postnummer, epostadresser, fagkoder,... –i nye data, få med identifikatorer der det går an •Med identifikatorer har du et mye bedre grunnlag

23 © 2002 Ontopia AS 23 #4: Bruk emnekart-programvare! •Det går an å gjøre emnekartprosjekter uten •Noen har f.eks klart seg med Excel, XML og XSLT •Med emnekartprogramvare er det dog mye lettere •Siden utviklingen blir lettere kan du også få til mye mer

24 © 2002 Ontopia AS 24 Emnekartmotor •Sentralt i all emnekartprogramvare står emnekartmotoren •Forholder seg til emnekartprogramvare som en motor til en bil –bilen fungerer ikke uten –du kan ikke se den uten å åpne panseret –du forholder deg ikke til den med mindre du er mekaniker •Typisk motorfunksjonalitet er –innlesing av emnekartfiler –fletting av emnekart –oppslag av informasjon –tilby API til utviklere –lagring i database •En god motor kan puttes inn i hva som helst

25 © 2002 Ontopia AS 25 Visualisering og redigering •Visualiseringsverktøy brukes for å lage framvisning av emnekart –som nettsted –i vindusgrensesnitt –grafisk med sirkler og streker •Bygger på motoren, men gir den ekstra funksjonalitet •To typer –generisk: kan vise alle emnekart, men viser dem på samme måte –rammeverk: kan brukes for å utvikle egne visualiseringer •Omnigator er generisk •Redigeringsverktøy legger til muligheten for å endre emnekartet

26 © 2002 Ontopia AS 26 Automatisk generering •Verktøy for å lage emnekart automatisk fra kildedata •Kildedata kan være alt mulig –strukturert: regneark, databaser, CSV-filer, XML,... –ustrukturert: websider, Word-dokumenter, epost,... •Typisk funksjonalitet –kan settes opp for å konvertere fra kildedata til din ontologi –oppsett kan innebære alt fra programmering til bare konfigurasjon •Ustrukturert informasjon håndteres av NLP-programvare –dette er "magisk" programvare som leser og "forstår" tekst –med begrenset presisjon kan man få til en god del

27 © 2002 Ontopia AS 27 De tre lagene Mennesker Mennesker/ maskiner Mennesker/ maskiner Ontology Instances Resources

28 © 2002 Ontopia AS 28 #5: Se framover! •Når emnekartprosjektet er i drift vil du oppdage anvendelser du ikke hadde forestilt deg i forkant •Informasjonen som ligger i emnekartet har en verdi i seg selv •Jo mer presis ontologien er, jo mer kan du bruke den til •Å tenke litt rundt dette vil ofte betale seg

29 © 2002 Ontopia AS 29 Eksempel #1: Biprodukt •Kunde A er et amerikansk forlag som foredler og republiserer offentlig informasjon •Et stort område er lovinformasjon, og domsavsigelser •Domsavsigelser kommer inn i bolker –en ansatt fører opp dommene i et Excel-regneark –dette regnearket gir en del bakgrunn og setter opp arbeidsflyten –etter at dommen er ferdigbehandlet kastes regnearket –bakgrunnsinformasjonen kastes samtidig! •Løsning: prosessér regnearket til et emnekart...

30 © 2002 Ontopia AS 30 Eksempel #2: Starbase •Produserer verktøy for å støtte store grupper utviklere •Bruker emnekart for å sy sammen egne programvareprodukter –verktøy for oppfølging av kravspesifikasjon –database over feil og ønskede forbedringer i programvare –versjonskontrollsystem for kildekode •Disse produktene er utviklet av ulike oppkjøpte firmaer •De snakker derfor ikke sammen •Starbase bruker emnekart for å sy sammen informasjonen •Fra dette lager de en portal til all informasjonen i hele systemet

31 © 2002 Ontopia AS 31 Real SmartTags!

32 © 2002 Ontopia AS 32 Real SmartTags!

33 © 2002 Ontopia AS 33 Eksempel #3: Department of Energy, USA •Energidepartementet driver med både kjernekraft og kjernevåpen •Derfor produserer de håndbøker til klassifisering av informasjon om disse temaene •Hovedhåndbøkene produseres sentralt i Washington –nye håndbøker spesialiserer disse for forskjellige avdelinger –laboratorier rundt om i landet spesialiserer dem igjen •Dette systemet har hittil vært svært primitivt •DOE jobber med et innholdssystem for å håndtere denne informasjonen der alt lagres som et emnekart

34 © 2002 Ontopia AS 34 Emnet som knutepunkt Guidance topic Master topic Derived topic Parent topic Child topic Concept Responsible person Workflow state

35 © 2002 Ontopia AS 35 Automatisk sensur •"Guidance topics" kobles mot ulike konsepter som omtales i dem •Konseptene kobles videre mot slutningsregler •Dette brukes av en slutningsmotor som kalles Ferret til å –lese epost og automatisk sensurere den i henhold til retningslinjene –prosessere dokumenter ved publisering for å fjerne klassifisert informasjon •Med andre ord, emnekart kan ikke bare formidle informasjon, de kan også stoppe den...


Laste ned ppt "© 2002 Ontopia AS 1 Emnekart i praksis Hvordan komme igang Lars Marius Garshol Ontopia Emnekart Norge 2002."

Liknende presentasjoner


Annonser fra Google