Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

Hvordan komme igang Lars Marius Garshol Ontopia Emnekart Norge 2002

Liknende presentasjoner


Presentasjon om: "Hvordan komme igang Lars Marius Garshol Ontopia Emnekart Norge 2002"— Utskrift av presentasjonen:

1 Hvordan komme igang Lars Marius Garshol Ontopia Emnekart Norge 2002
Emnekart i praksis Hvordan komme igang Lars Marius Garshol Ontopia Emnekart Norge 2002

2 Oversikt over foredraget
Forsøk på å forklare hvordan man kommer igang med et emnekartprosjekt Svar på spørsmål som hva slags prosjekt bør man starte med? hva må man ta hensyn til? hva trenger man? hva slags verktøy finnes? Sannheten er at 45 minutter ikke er nok til å besvare alle spørsmål

3 #1: Det er lettere enn du tror!
Nå som dette er nytt virker det kanskje komplisert og vanskelig Sannheten er at emnekart er utrolig enkelt Alle emnekart består av ting forhold mellom ting ressurser om tingene navn på tingene Du trenger ikke mer for å lage et nyttig emnekart!

4 Ting, forhold, ressurser
Dette er ikke ordentlig tekst, bare noe jeg skrive for at dette skal se ut som et dokument, selv om det altså egentlig ikke er noe dokument, men bare juks som jeg skal bruke i denne presentasjo|nen. Nuvel. ressurs

5 Erfaring er den beste lærer
Hvis du er litt teknisk anlagt velg et tema du synes er interessant last ned Omnigator sett i gang med en teksteditor og LTM en kveld er nok til å lage et enkelt utkast Hvis du ikke er teknisk anlagt overhodet bruk papir og blyant rundinger er ting, streker er forhold, bokser er ressurser se hva du får til! En tredje mulighet 1-2 dager kurs hjelper særlig dersom en interaktiv "lag et emnekart"-sesjon inngår

6 Du kan velge ambisjonsnivå
Du trenger ikke lage "alle leksikons mor" med én gang Du kan godt starte med en liten del av informasjonsmengden Dersom denne er interessant i seg selv kan du gjøre et komplett prosjekt på denne delen som neste skritt velge et annet utvalg av informasjonen resultatet fra neste skritt kan hektes inn i det første emnekartet Emnekartet kan med andre ord vokse organisk etter behov

7 Smått er trygt Et lite prosjekt er tryggere enn et stort
kompleksiteten er mindre prislappen er mindre ambisjonene som regel mindre Etter første prosjektet har man lært mer om hva som er realistisk å få til hvor man får mest ut av emnekart hva som fungerer og ikke fungerer i egen organisasjon Det er fullt mulig å gjennomføre en pilot uten å betale en krone! ved å bruke gratisverktøy og ikke leie inn hjelp mange har gjort det allerede

8 Emnekartet er et register

9 #2: Du trenger en ontologi!
"Ontologi" høres skummelt og vanskelig ut Det er bare typene av ting, forhold, og ressurser "person, barn-av, fødselsdato" er en minimal ontologi Ontologien bestemmer hva du kan si i emnekartet ditt Dette er på samme måten som DTD-en (eller XML Schema) for XML databaseskjemaet for en relasjonsdatabase kolonneoppsettet i et Excel-regneark

10 Ontologier kan gjenbrukes
Ontologien kan du utvikle selv, gjenbruke om det finnes en kilde, eller litt av begge deler (som forsking.no gjorde) Ofte kan mye løftes rett ut av offentlige emnekart employed-by, located-in, part-of, created-by, ... Kan være lurt å be om hjelp konsulenter kan designe hele greia for deg eller de kan vurdere det dere har laget Har du eksisterende data kan idéer hentes derfra

11 Eksempel på inspirasjon
Artikkel <gcapaper> <title>Topic Maps, The Business Case</title> <author> <fname>Kal</fname> <surname>Ahmed</surname> <jobtitle>Founder</jobtitle> <address><affil>Techquila</affil> <city>Oxford</city> [...] skrevet-av Person har-stilling Stilling ansatt-i Firma har-kontor-i By

12 Ontologier biter ikke! Ofte vanskelig å lage ontologien med en gang
hvilke typer ting og forhold har vi egentlig? Du kan velge hvor presis du vil være det går an å bare ha én forholdstype: har-forhold-til mer presisjon er bedre, men vanskeligere Det går an å forandre ontologien underveis eksisterende data ødelegges ikke av en endring RDBMS-er har et rigid skjema, emnekart er mye lettere slik Siden emnekartet ligger utenfor dataene det snakker om... Ofte starter man nokså upresist presisjonen økes ved behov

13 Emnet som knutepunkt, #1 Parent topic Guidance topic Child topic

14 Emnet som knutepunkt, #2 Master topic Parent topic Guidance topic
Child topic Derived topic

15 Emnet som knutepunkt, #3 Master topic Parent topic Guidance topic
Child topic Derived topic Responsible person Concept Workflow state

16 Forfatterne må kunne ontologien!
Dersom mennesker skal produsere emnekartet må de vite hvordan den fungerer hva som er tanken bak Ellers blir det umulig for dem å bruke den riktig Et inkonsistent emnekart er... Løsninger opplæring selv-dokumentasjon

17 #3: Kjenn dine data! I alle informasjonsprosjekter er det dataene som bestemmer All funksjonalitet lages på dataenes premisser Dette kan bety ett av to ting det avgjørende er temaene du vil beskrive, eller det avgjørende er hvilke data du allerede har Dette er det aller viktigste og det du bør fokusere på først hva skal emnekartet handle om? hva skal det si om disse tingene? Nå har du råmateriale til en ontologi allerede...

18 Informasjon oppstår ikke av seg selv
prosjektet og ut informasjon inn

19 Kjenn dine kilder Dette er det nest viktigste spørsmålet
hvor kommer informasjonen fra? Som regel er det fire muligheter den skrives inn av mennesker (fra andre kilder) den genereres av maskiner (fra andre kilder) den skrives av mennesker, og annoteres av maskiner den genereres av maskiner, og annoteres av mennesker

20 Garbage in, garbage out Ved automatisk generering er formen på data uhyre viktig Å speile formen på inndata i emnekart er veldig lett Med veldig strukturerte data er det en lek å lage emnekart Med helt flate data er det fortsatt mulig maskiner kan skjønne at "Lars Marius" er navnet på en person og at "Ontopia A/S" er et firma Maskinene kan gjøre en bedre jobb hvis du allerede har et emnekart hvis emnekartet sier "topic maps er en teknologi" kan maskiner skjønne at dokument X handler om teknologien topic maps

21 Litt manuell innsats kan oppnå mye
Det er mulig å lage emnekart fra dokumenter helt automatisk Selv uten å ha en god ontologi på forhånd Men, hvis du skaffer deg en god ontologi først, og har noen til å finpusse det maskinen produserer kan du ofte få et mye bedre resultat

22 Identitet Det sentrale i alle emnekart er identitet
Du kommer mye lenger hvis du kan identifisere emnene Bruk identifikatorer! i eksisterende data, se etter hva som identifiserer ting kommunenummer, postnummer, epostadresser, fagkoder, ... i nye data, få med identifikatorer der det går an Med identifikatorer har du et mye bedre grunnlag

23 #4: Bruk emnekart-programvare!
Det går an å gjøre emnekartprosjekter uten Noen har f.eks klart seg med Excel, XML og XSLT Med emnekartprogramvare er det dog mye lettere Siden utviklingen blir lettere kan du også få til mye mer

24 Emnekartmotor Sentralt i all emnekartprogramvare står emnekartmotoren
Forholder seg til emnekartprogramvare som en motor til en bil bilen fungerer ikke uten du kan ikke se den uten å åpne panseret du forholder deg ikke til den med mindre du er mekaniker Typisk motorfunksjonalitet er innlesing av emnekartfiler fletting av emnekart oppslag av informasjon tilby API til utviklere lagring i database En god motor kan puttes inn i hva som helst

25 Visualisering og redigering
Visualiseringsverktøy brukes for å lage framvisning av emnekart som nettsted i vindusgrensesnitt grafisk med sirkler og streker Bygger på motoren, men gir den ekstra funksjonalitet To typer generisk: kan vise alle emnekart, men viser dem på samme måte rammeverk: kan brukes for å utvikle egne visualiseringer Omnigator er generisk Redigeringsverktøy legger til muligheten for å endre emnekartet

26 Automatisk generering
Verktøy for å lage emnekart automatisk fra kildedata Kildedata kan være alt mulig strukturert: regneark, databaser, CSV-filer, XML, ... ustrukturert: websider, Word-dokumenter, epost, ... Typisk funksjonalitet kan settes opp for å konvertere fra kildedata til din ontologi oppsett kan innebære alt fra programmering til bare konfigurasjon Ustrukturert informasjon håndteres av NLP-programvare dette er "magisk" programvare som leser og "forstår" tekst med begrenset presisjon kan man få til en god del

27 De tre lagene Ontology Mennesker Mennesker/ maskiner Instances
Resources

28 #5: Se framover! Når emnekartprosjektet er i drift vil du oppdage anvendelser du ikke hadde forestilt deg i forkant Informasjonen som ligger i emnekartet har en verdi i seg selv Jo mer presis ontologien er, jo mer kan du bruke den til Å tenke litt rundt dette vil ofte betale seg

29 Eksempel #1: Biprodukt Kunde A er et amerikansk forlag som foredler og republiserer offentlig informasjon Et stort område er lovinformasjon, og domsavsigelser Domsavsigelser kommer inn i bolker en ansatt fører opp dommene i et Excel-regneark dette regnearket gir en del bakgrunn og setter opp arbeidsflyten etter at dommen er ferdigbehandlet kastes regnearket bakgrunnsinformasjonen kastes samtidig! Løsning: prosessér regnearket til et emnekart...

30 Eksempel #2: Starbase Produserer verktøy for å støtte store grupper utviklere Bruker emnekart for å sy sammen egne programvareprodukter verktøy for oppfølging av kravspesifikasjon database over feil og ønskede forbedringer i programvare versjonskontrollsystem for kildekode Disse produktene er utviklet av ulike oppkjøpte firmaer De snakker derfor ikke sammen Starbase bruker emnekart for å sy sammen informasjonen Fra dette lager de en portal til all informasjonen i hele systemet

31 Real SmartTags!

32 Real SmartTags!

33 Eksempel #3: Department of Energy, USA
Energidepartementet driver med både kjernekraft og kjernevåpen Derfor produserer de håndbøker til klassifisering av informasjon om disse temaene Hovedhåndbøkene produseres sentralt i Washington nye håndbøker spesialiserer disse for forskjellige avdelinger laboratorier rundt om i landet spesialiserer dem igjen Dette systemet har hittil vært svært primitivt DOE jobber med et innholdssystem for å håndtere denne informasjonen der alt lagres som et emnekart

34 Emnet som knutepunkt Master topic Parent topic Guidance topic Child
Derived topic Responsible person Concept Workflow state

35 Automatisk sensur "Guidance topics" kobles mot ulike konsepter som omtales i dem Konseptene kobles videre mot slutningsregler Dette brukes av en slutningsmotor som kalles Ferret til å lese epost og automatisk sensurere den i henhold til retningslinjene prosessere dokumenter ved publisering for å fjerne klassifisert informasjon Med andre ord, emnekart kan ikke bare formidle informasjon, de kan også stoppe den...


Laste ned ppt "Hvordan komme igang Lars Marius Garshol Ontopia Emnekart Norge 2002"

Liknende presentasjoner


Annonser fra Google