Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

1 Web 2.0, Emnekart og ssb.no Are Gulbrandsen, USIT, UiO o.

Liknende presentasjoner


Presentasjon om: "1 Web 2.0, Emnekart og ssb.no Are Gulbrandsen, USIT, UiO o."— Utskrift av presentasjonen:

1 1 Web 2.0, Emnekart og ssb.no Are Gulbrandsen, USIT, UiO o

2 2 Evolusjon eller revolusjon? Det har helt klart kommet en bølge av nye webapplikasjoner Det har nærmest skjedd en revolusjon i måten web brukes på –En bølge med nye typer nettsteder og tjenester –Massevis av nye typer brukere og ny bruk av web Web 2.0 er fellesnavnet som gjerne brukes Hva er web 2.0? –Og hva er i så fall web 3.0? –Og hvordan passer Emnekart inn i denne sammenhengen?

3 3 Hva er Web 2.0? Ikke enighet om definisjon og avgrensinger –A phrase coined by O'Reilly Media in 2004 (Eneste info om Web 2.0 i Wikipedia i februar 2007) Den sosiale og deltagende web –Alle kan publisere over alt En web av data Web gjort riktig –Dvs evolusjon og nettverkseffekt på den tekniske siden Alt som er nytt og kuult på web

4 4 Eksempler på web 2.0

5 5 Den sosiale web A powerful global conversation has begun. Through the Internet, people are discovering and inventing new ways to share relevant knowledge with blinding speed.... These markets are conversations. The Cluetrain Manifesto –Alle kan publisere over alt –En web av sosial interaksjon Møtested Kommunikasjonsorientert Bygging av identitet –Bygging av en kollektiv kunnskapsbase

6 6 Deltagende interaktiv web Kommunikasjon og samtaler –Blogger med diskusjoner og kommentarer –Facebook og Twitter Anbefale innhold til andre –Stemmegivning, forbruksmønstre og popularitet Flest treff, flest stemmer, mest kjøpt,... –Anmeldelser, kommentarer, lister Web er også et sted for alle nisjene i den lange halen (the long tail) Samarbeid om å skape innhold –Wikipedia artikler på engelsk, i den norske utgaven Encyclopedia Britannicas 32 bind har ca artikler

7 7 Flickr Deling av bilder Tagging Grupper Kommentarer

8 8 Flickr - bilder og geografi –Bruk av geografiske metadata

9 9 En web av sosial interaksjon The idea of the Web as interaction between people is really what the Web is. That was what it was designed to be - as a collaborative space where people can interact. Tim Berners-Lee –Jeg tror allikevel at Berners-Lee var mer opptatt av informasjonsteknologi enn kommunikasjonsteknologi –Web har dreiet mot mer kommunikasjon Chat The wall i facebook Kommentarer (f.eks. i Flickr) Mange har problemer med å se forskjellen på dette og f.eks. SMS

10 10 As we may think Artikkel skrevet av Vannevar Bush i 1945 Så potensialet i samarbeid om å skape en kollektiv kunnskapsbase –Lett tilgjengelig og gratis for alle. –Bush så for seg datidens mikrofilm-teknologi istedet for vår vev av markup og ymse elektroniske formater. Wikipedia er et godt eksempel på realisering av ideene hans

11 11 En web av data Web som platform, og data som drivkraft –Fra informasjonssilo til en kilde for både informasjon og data Tjenester (webservice) som en basis for "mash-up” –Kombinere data fra ulike kilder til nytt innhold (Remixability) Amazon webservices Google Maps Flickr Syndikering med RSS og Atom Microformater –Kodekonvensjoner for å få mer semantikk inn i html –F.eks. Geografiske data og tidspunkter/intervaller

12 12 Yahoo Pipes - Rewire the web YouTunes - en brukerdesignet tjeneste –Henter Top10 fra iTunes og prøver å finne musikkvideoene i YouTube

13 13

14 14 YouTube Videodeling Stemmegivning Kommentarer Relaterte videoer Tagger: maroon maroon5 makes me wonder new single mtv rtl full video premiere premier jpalanca

15 15 Tag cloud

16 16 The long tail - nisjene erobrer web Popularitet vs bredde –En gjennomsnittlig Barnes & Noble bokhandel har titler –Halvparten av Amazons salg kommer fra andre titler, dvs den lange halen. Gullet i enden av den lange halen –Utfordringen er dermed å gjøre det mulig for interesserte brukere å finne frem i hele samlingen

17 17 Hvordan finne frem? SSBs brukerundersøkelse viser bl.a: –Brukerne er bare ganske godt fornøyd med ssb.no For mye innhold Vanskelig å finne frem Verktøyene for å hjelpe er ikke gode nok Kun 39% er svært eller ganske fornøyd med søk –17% er ganske eller veldig misfornøyd Mye innhold gjør utfordringen med å finne frem større –The long tail har ført til et stort fokus på bedre søk og alternative veier inn i informasjonen –Amazon har delvis klart det –Det finnes ikke lenger én måte å sortere innholdet på som er best Men det finnes flere som er forventet av brukerne

18 18 Fasettert navigasjon I stedet for ett stort emnehierari kan man bruke flere uavhengige fasetter –Flere metadata-felter knyttet til informasjonen –Kjent teori fra klassifisering i biblioteksystemer –Flere akser eller dimensjoner å klassifisere informasjonen etter –Disse kan brukes til å gi brukeren flere alternative veier inn i informasjonen –Kan også brukes til å filtrere vekk informasjon ved søk Fasetter: –Tid Tidspunkt eller periode Nyheter er en variant av dette –Rom (geografisk klassifisering) –Mange alternative emnehierarkier (fasetter) F.eks. Befolkningsgruppe –Barn, ungdom, voksne, eldre, kvinner, menn, homofile, innvandrere, osv

19 19 Øyeblikkets tyranni Nyheter er push-teknologi, litt som reklame. Vi bestemmer hva som er interessant for deg. Søk og navigasjon er pull-teknologi Brukeren bestemmer selv hva som er interessant. RSS abonnering basert på nyheter innen et emne er en mellomting mellom push og pull Fagfolk er sannsynligvis interessert i nyheter innen sitt område Folk med spesielle interesseområder Dette fordrer metadata som dekker alle emner folk kan være interessert i Metadata kan her være lagt på av brukerne (tagget) Er det viktig og riktig med et så sterkt nyhetsfokus på førstesiden? –Burde noen av de andre mulighetene til gjenfinning være mer sentrale?

20 20

21 21 Web 3.0? The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation."-- –"The Semantic Web”, Scientific American, May 2001, Tim Berners-Lee, James Hendler, Ora Lassila –Semantisk web bruker standardene RDF og OWL –Semantikk betyr her logikk Fokus bl.a. i miljøer som har jobbet innen AI tidligere Problemet med versjonering er at man fokuserer på neste versjon –Web 1.0, 2.0 og 3.0 kommer sannsynligvis til å eksistere side om side

22 22 Den sosiosemantiske web Tradisjonelle strukturerte metadata finnes som trær. Tagger er som blader som rakes sammen i hauger. Alle vet hva som skjer med hauger av blader om høsten, de råtner og gir næring til trær Peter Morville, Ambient Findability, 2005 –Taksonomi vs folksonomi "Ontology is Overrated" av Clay Shirky, 2005 –Utfordringen ligger i å kombinere, - Ja takk til begge deler

23 23 Emnekart ISO-standard for representasjon og utveksling av informasjon Semantisk teknologi som ligner semantisk web, men med et litt annet fokus –Visjonen er systemintegrasjon og sømløs kunnskap –Generell datamodell for beskrivelse av kunnskaps-strukturer Metadata Taksonomier og thesaurus Ontologier Kan like gjerne brukes sammen med web 1.0, 2.0 og 3.0

24 24 Noen emnekarteksempler Mye brukt til systemintegrasjon og temabasert navigasjon, spesielt i offentlig forvaltning –Norge.no og Los (tidl. LivsIT) Klassifiseringssystem for informasjon om offentlige tjenester –Regjeringen.no –Ny kommuneportal for Bergen –Forskning.no –Skatteetaten –Grep Nasjonal base for fag, læreplaner og opplæringstilbud i grunnskole og videregående opplæring. –Forbrukerrådets informasjonsportal –Mattilsynets informasjonsportal –Kulturnett –Det internasjonale polaråret

25 25 En kort introduksjon til Emnekart Et emnekart lar deg definere emner som –Har emnetype –Har et eller flere navn

26 26 En kort introduksjon til Emnekart Et emnekart lar deg definere emner som –Har emnetype –Har et eller flere navn

27 27 En kort introduksjon til Emnekart Et emnekart lar deg definere emner som –Har emnetype –Har et eller flere navn Det kan være en relasjon mellom to eller flere emner –En assosiasjon

28 28 En kort introduksjon til Emnekart Et emnekart lar deg definere emner som –Har emnetype –Har et eller flere navn Det kan være en relasjon mellom to eller flere emner –En assosiasjon –Assosiasjoner går begge veier

29 29 En kort introduksjon til Emnekart Et emnekart lar deg definere emner som –Har emnetype –Har et eller flere navn Det kan være en relasjon mellom to eller flere emner –En assosiasjon –Assosiasjoner går begge veier Men jeg forenkler figuren litt

30 30 En kort introduksjon til Emnekart En forekomst er en peker til ulike typer informasjonsressurser knyttet til emnet –Tekst, bilder, lyd, foto, kart, video –Adressert via URI

31 31 En kort introduksjon til Emnekart En forekomst er en peker til ulike typer informasjonsressurser knyttet til emnet –Tekst, bilder, lyd, foto, kart, video –Adressert via URI

32 32 En kort introduksjon til Emnekart Emnekart kan sies å bestå av to lag –Et semantisk lag –Et lag med informasjonsressurser

33 33 Elektronisk leksikon Vi ønsker å slå opp i et emnekartbasert leksikon –Emnekartet blir som stikkordregisteret (en indeks) –Emnenavnene er oppslagsordene –Emnetypene beskriver treffene, og kan også slås opp på –Forekomstene er selve innholdet (f.eks. artikler) Anta at vi søker etter ”Paris” i det imaginære leksikonet

34 34 Treffliste ved søk etter ”Paris” –Paris : By Hovedstaden i Frankrike –Paris : Person I gresk mytologi s ø nn av kong Priamos av Troja –Paris Hilton : Person Kjendis, modell, plateartist og skuespiller –Paris, Texas : Film Regiss ø r: Wim Wenders, 1984 –Paris : Musikk Album: The Cure, 1993 –Paris : By By i Texas, USA

35 35 Treffliste ved søk etter ”Paris” –Paris : By Hovedstaden i Frankrike –Paris : Person I gresk mytologi s ø nn av kong Priamos av Troja –Paris Hilton : Person Kjendis, modell, plateartist og skuespiller –Paris, Texas : Film Regiss ø r: Wim Wenders, 1984 –Paris : Musikk Album: The Cure, 1993 –Paris : By By i Texas, USA Emnetype Navn på emne Kort beskrivelse av emne

36 36 Paris Paris, hovedstad i Frankrike, ved Seinen, 2,12 mill. innb., med forsteder og drabantbyer 9,7 mill. Landets dominerende sentrum både når det gjelder administrasjon, samferdsel, industri, finans og handel. Tre flyplasser, bl.a. Charles de Gaulle og Orly. Tunnelbane. Betydelig europeisk kultursentrum med ca. 60 museer (bl.a. Louvre) og enda flere teatre, samt et av verdens eldste universiteter (Sorbonne). Motesentrum, turisme. Bykjernen La Cité er en øy i Seinen med katedralen Notre-Dame og slottskapellet Sainte-Chapelle. På sørbredden (Rive Gauche) ligger studenterkvarteret Quartier Latin og Montparnasse, samt Quai d'Orsay med utenriksdepartement og nasjonalforsamling. Eiffeltårnet er Paris' landemerke. På nordbredden (Rive Droite) ligger Louvre, paradegaten Champs Elysées, Triumfbuen, Operaen og Pompidou-senteret samt Montmartre med Sacré-Coeur-kirken. Hovedstad fra 1200-tallet. Byplanen ble omformet av Haussmann i 1850—70. Han skapte de brede avenyer og åpne "stjerneplasser". Nye monumentalbygg: Operaen på Bastilleplassen, biblioteket, glasspyramiden ved Louvre og buen i La Defense. Mer informasjon om Paris: bilder kart kunsthistorie politisk historie Inkluderer geografisk: –Champs Elys é es: gate –La Defense: bydel –Eiffelt å rnet: monument –Louvre: bygning –Metro: kollektivtransport –Notre-Dame: kirke –Triumfbuen: monument Er en geografisk del av: –Frankrike: land

37 37 Fletting og Published Subjects Fletting –Hvis to emnekart har emner som er felles vil disse danne sammenbindingspunkter mellom de to emnekartene –Emnekartene vil flettes sammen i disse emnene –Fletting er innebygget i standarden Published Subjects (PS) –Definerer navnerom for ulike vokabularer. –Gjør det mulig å løse et hovedproblem som oppstår ved forsøk på fletting. –Hvordan er det mulig å vite at vi snakker om det samme?

38 38 Synonymer, homonymer og PSI Synonymproblemet –Hvordan vet vi om to emner med ulike navn er det samme emnet? Frankrike, France og Republique Francaise? Inflasjon, prisstigning eller prisvekst? Antall innbyggere, innbyggertall eller folketall? –PSID (Published Subject identifier) Emnekartstandarden lar oss referere til en ID som viser hva vi snakker om F.eks. som referanse for å betegne landet Frankrike: –http://psi.oasis-open.org/geolang/iso3166/#FRA Homonymproblemet –Hvordan vet vi om to emner med like navn faktisk er forskjellige emner? Paris som i eksempelet -> by, person, film eller musikk? Piratvirksomhet -> sjørøveri eller illegal kopiering?

39 39 Emnekart og metadata To sider av samme sak –Det som lagres i et emnekart er i stor grad metadata –Vi kan modellere ulike metadata og klassifiseringsmodeller som et emnekart Fasettert klassifikasjon Taksonomier Thesaurus Ontologier Automatisk generering av emnekart –Strukturert informasjon og metadata er gode kilder –Ref. arbeidet som er gjort i regjeringen.no (tidl. Odin)

40 40 Ja takk, begge deler Jeg tror en kombinasjon er best. –Metadata –Xml og strukturert informasjon (f.eks. database) –Søking –Fasettert navigasjon –Emnekart Automatisk generering av emnekart fra metadata og strukturert informasjon Semantiske søk Kombinert med automatisk klassifisering –Bruker-tagging

41 41 IT-politisk dagsorden Emnekart er på den offentlige IT-politiske dagsordenen –St.meld. nr. 17 ( ) "Eit informasjonssamfunn for alle" er ble sluppet i sluppet og regjeringen har startet en systematisk satsning på interoperabilitet. –Standardiseringsrådet under Fornyings- og administrasjonsdepartementet (FAD) bygger opp en referansekatalog over tekniske, semantiske og organisatoriske IT-standarder. –Emnekart er en kandidat –Se artikkelreferanser i notatene

42 42 Emnekart og syndikering Sømløs kunnskap –Automatisk integrering av informasjon og kunnskap fra ulike kilder –F.eks. statistikk der folk er og har bruk for den –Webservice-protokollen TMRAP Sømløs kunnskap i offentlig og privat sektor –Keynote av Steve Pepper på Emnekart 2004


Laste ned ppt "1 Web 2.0, Emnekart og ssb.no Are Gulbrandsen, USIT, UiO o."

Liknende presentasjoner


Annonser fra Google