Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

Semantisk web - Semantisk hva?.

Liknende presentasjoner


Presentasjon om: "Semantisk web - Semantisk hva?."— Utskrift av presentasjonen:

1 Semantisk web - Semantisk hva?

2 Scientific American May 2001
Artikkelen som på mange måter fanget folks interesse for semantisk web i mai 2001. Samtidig er dette en artikkel som kan få skylden for mye hype, mange misforståelser, overdrevne forhåpninger og kritikk mot semantisk web. Selv 8 år etter er vi langt unna å realisere en enkel versjon av det som ble beskrevet her. For meg er dette Tim Berners-Lee’s Utopia og flørting med kunstig intelligens (AI). Vi er imidlertid mye nærmere en enklere semantisk web der datamaskiner kan koble informasjon fra ulike informasjonskilder automatisk – linked data. PDF-versjonen av artikkelen er absolutt verdt en titt: The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation. Scientific American May 2001

3 Hva betyr egentlig semantikk?
Studiet av mening i språk (lingvistikk) Ironisk nok er det selv innenfor lingvistikk ikke enighet om hva semantikk er på et mer detaljert nivå... Selvrefererende tittel - Innenfor lingvistiske miljøer (og andre steder) er det ironisk nok stor variasjon i definisjon av hva semantikk egentlig er på et mer detaljert nivå.  Nivået over syntaks: Regler for å sette sammen ord til større enheter For både naturlige språk og konstruerte grammatikker Kun form og struktur, - uavhengig av mening

4 Tolkning av elektronisk tekst
Tekst med lite struktur (txt, html, pdf) <h1>SOSANT Psykologisk antropologi</h1> Strukturert tekst (xml) <tittel> <emnenavn>Psykologisk antropologi</emnenavn> <emnekode>SOSANT2540</emnekode> </tittel> Men hva betyr dette? <НомерОбъекта> </НомерОбъекта> XML er ikke en semantisk teknologi, men vi kan bruke det strukturerte innholdet til å generere semantisk informasjon. I xml kan ha mer logisk struktur. Elementnavn er merkelapper som beskriver innholdet. Dette er imidlertid kun svært korte tekstlige beskrivelser, som må tolkes av et menneske innenfor en domenespesifikk kontekst. Elementnavnene er imidlertid vanligvis ikke veldefinert, I den forstand at man kan si om samme elementnavn i to dokumenter (med ulikt schema) faktisk har samme betydning. Tittel kan f.eks. i noen sammenhenger bety en persons tittel, f.eks. Overingeniør, mens i andre sammenhenger er det tittelen på dokumentet. Eks. fra Jon Bings foredrag på Emnekart 2009: Kungsbacka-saken (Sverige) Omtrent personer politianmeldt for mistanke om trygdemisbruk, dommer. Mer enn 25 rettslige definisjoner av ”inntekt”.

5 Metadata Metadata er strukturerte data som beskriver en digital informasjonsressurs Hva handler det om? (sammendrag og emneord) Forfatter? - Eller hvordan ble datasettet/informasjonen laget? Dokument opprettet, sist endret dato? Hvem har ansvaret for informasjonen, og hvordan kan man kontakte vedkommende? Dublin Core (DC) Metadatastandard med (delvis) definert semantikk Metadata kan være et godt grunnlag for å generere semantisk informasjon Tenk deg at du leter etter informasjon om noe, og har funnet en informasjonsressurs som kanskje er interessant. I tillegg til selve innholdet i informasjonsressursen, som i denne sammenhengen bl.a. kunne være et dokument, en podkast eller en video., er det heldigvis ofte en del annen informasjon man kan bruke til å vurdere innholdet: En vanlig definisjon av metadata er at det er data om data. Historien om metadata kan sies å ha startet i bibliotekene, der bøkenes metadata var i kortkatalogen, som var en forkortet representasjon av informasjonen i bøkene utfylt med bibliotekarenes kunnskap om boken. Vår definisjon i en websammenheng er at metadata er strukturerte data som beskriver en digital informasjonsressurs. Alt dette kan karakteriseres som metadata, og man kan godt tenke på det som ulike typer merkelapper på informasjonsressursene. Hvis det knyttes metadata til et dokument har vi bedre muligheter for å finne frem til og vurdere relevans for enkeltdokumenter innenfor mengden av alle dokumenter som er tilgjengelig. Strukturerte data vil her si at syntaksen og semantikken for dataene er kjent, slik at dataene kan tolkes som informasjon. Vi kan dermed si at metadata i denne sammenhengen er informasjon om informasjon. Ref. Rapport om Metadata fra fase 1 av ”Ny UiO-web”-prosjektet ved UiO:

6 Data eller metadata? Uklar grense
En glidende overgang fra administrative metadata til semantisk web Metadataaktiviteten i W3C ble for flere år siden flyttet over i gruppen som arbeider med semantisk web The Semantic Web is a web of data It is about common formats for integration and combination of data drawn from diverse sources (where the original Web mainly concentrated on the interchange of documents) It is also about language for recording how the data relates to real world objects. Grensen mellom data og metadata har alltid vært uklar. Ttittelen for en bok, er både data (informasjon i boken) og metadata (informasjon om boken). I et XML-dokument kan i prinsippet alt som står i dokumentet være både data og metadata. I den ene enden av skalaen er metadata begrenset til administrative metadata, som for eksempel opprettet-dato og sist-endret-dato for et dokument. Denne typen metadata er uunnværlige i et publiseringssystem, og det er ingen diskusjon om at dette er metadata. Informasjonen finnes ofte ikke som tekst i dokumentet, men publiseringssystemet administrerer informasjonen og vil ofte vise den frem i signaturen for dokumentet. I forhold til UiO er dette viktig for å klare å integrere informasjon fra autoritative informasjonskilder, for å unngå duplisering av informasjonen. Ref. Rapport om Metadata fra fase 1 av ”Ny UiO-web”-prosjektet ved UiO:

7 Semantisk web i dag Noen nøkkelord Hva kan vi oppnå?
Begrepet Semantisk web RDF (m/familie) Emnekart (Topic Maps) (m/familie) Linked Data Hva kan vi oppnå? Begrepet blir ofte brukt, bl.a. av W3C som samlebetegnelse for RDF-teknologier, men Emnekart er også en semantisk teknologi som brukes på web. Semantiske teknologier: RDF (Resource Description Framework) W3C-standard Emnekart (Topic Maps) ISO-Standard

8 Treffliste ved søk etter ”Paris”
Paris : By Hovedstaden i Frankrike Paris : Person I gresk mytologi sønn av kong Priamos av Troja Paris Hilton : Person Kjendis, modell, plateartist og skuespiller Paris, Texas : Film Regissør: Wim Wenders, 1984 Paris : Musikk Album: The Cure, 1993 Paris : By By i Texas, USA Et imaginært elektronisk leksikon som bruker semantisk teknologi.

9 Treffliste ved søk etter ”Paris”
Navn Emnetype (kategori/klasse) Paris : By Hovedstaden i Frankrike Paris : Person I gresk mytologi sønn av kong Priamos av Troja Paris Hilton : Person Kjendis, modell, plateartist og skuespiller Paris, Texas : Film Regissør: Wim Wenders, 1984 Paris : Musikk Album: The Cure, 1993 Paris : By By i Texas, USA Kort beskrivelse Vi velger Paris, hovedstaden i Frankrike.

10 Paris Paris, hovedstad i Frankrike, ved Seinen, 2,12 mill. innb., med forsteder og drabantbyer 9,7 mill. Landets dominerende sentrum både når det gjelder administrasjon, samferdsel, industri, finans og handel. Tre flyplasser, bl.a. Charles de Gaulle og Orly. Tunnelbane. Betydelig europeisk kultursentrum med ca. 60 museer (bl.a. Louvre) og enda flere teatre, samt et av verdens eldste universiteter (Sorbonne). Motesentrum, turisme. Bykjernen La Cité er en øy i Seinen med katedralen Notre-Dame og slottskapellet Sainte-Chapelle. På sørbredden (Rive Gauche) ligger studenterkvarteret Quartier Latin og Montparnasse, samt Quai d'Orsay med utenriksdepartement og nasjonalforsamling. Eiffeltårnet er Paris' landemerke. På nordbredden (Rive Droite) ligger Louvre, paradegaten Champs Elysées, Triumfbuen, Operaen og Pompidou-senteret samt Montmartre med Sacré-Coeur-kirken. Hovedstad fra 1200-tallet. Byplanen ble omformet av Haussmann i 1850—70. Han skapte de brede avenyer og åpne "stjerneplasser". Nye monumentalbygg: Operaen på Bastilleplassen, biblioteket, glasspyramiden ved Louvre og buen i La Defense. Mer informasjon om Paris: bilder kart kunsthistorie politisk historie Inkluderer geografisk: Champs Elysées: gate La Defense: bydel Eiffeltårnet: monument Louvre: bygning Metro: kollektivtransport Notre-Dame: kirke Triumfbuen: monument Er en geografisk del av: Frankrike: land Dette ligner jo endel på wikipedia

11 Linked data Tim Berners-Lee’s nye fronting av Semantisk web.
Ref TED-video med Tim Berners-Lee feb 2009 Linked Open Data er åpne informasjonsressurser som er tilgjengelsige wia web og dyplenking.

12 Ja takk, begge deler En kombinasjon vil gi store synergieffekter
Metadata Xml og strukturert informasjon (også DB) Søketeknologi Fasettert navigasjon Emnekart (og gjerne RDF) BL.a. automatisk generering av emnekart fra metadata og strukturert informasjon Semantiske søk Kombinert med automatisk klassifisering Bruker-tagging (emneord)


Laste ned ppt "Semantisk web - Semantisk hva?."

Liknende presentasjoner


Annonser fra Google