Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

Web – browsere, søking, m.m. Pensum: Olsen, kap. 8, 9, 10.

Liknende presentasjoner


Presentasjon om: "Web – browsere, søking, m.m. Pensum: Olsen, kap. 8, 9, 10."— Utskrift av presentasjonen:

1 Web – browsere, søking, m.m. Pensum: Olsen, kap. 8, 9, 10

2 Historikk 1991 – første Browser utviklet av Tim Berners-Lee 1993 Mosaic (NCSA, Marc Andreessen) 1995 Netscape (Andreessen et al) 1995 Internet Explorer (Microsoft, basert på Mosaic) I dag også: Firefox, Safari, Opera, Crome, …

3 Oppgave Vise Web sider Utfører GET-kommandoer for å hente sidene Presenterer sidene ut fra tag- informasjonen Forenkle administrasjon (favoritter, sidehistorikk, oppsett…) Utføre programmer (script og applets)

4 Surfing på Web Nettbruk karakterisert ved: Kort tid mellom klikkene Skanner sider mer enn å lese Trenger godt organiserte sider med lite tekst, som understøtter kjapp navigering Følger linker Krever kjappe responstider

5 Skjema - form Meget viktig funksjon Vi kan nå bruke HTML også for inndata Gir muligheter for en lang rekke applikasjoner: Billettbestilling Banksystemer Ordresystemer m.m. Data fra forms blir hentet ut på serversiden Med form-begrepet kan vi altså bruke HTML som et grensesnitt mot andre systemer Gir standardisering på brukersiden, grunnlaget er nå lagt for B2C applikasjoner

6 Mer Script, applets: En del kontroller kan gjøres i brukergrensesnittet i Browseren Mer dynamiske brukergrensesnitt Cookies: Små filer med ID som legges på din maskin. Server kan da identifisere bruker. Plug-ins: Vi kan utvide funksjonaliteten til browseren Sertifikater: Browseren kan identifisere serverapplikasjonen (f.eks. et banksystem), serveren kan identifisere bruker (en bankkunde), kryptografert overførsel (HTTPS)

7 Web Inhomogene data: Hjemmesider til personer Hjemmesider til organisasjoner Offisielle rapporter Stiler, kursinnleveringer, øvingsoppgaver Amatørorganisasjoner Aviser Blogger …

8 Lavt formaliseringsnivå Mesteparten av data er formalisert på tegn/layout nivå (HTML, PDF) Samtidig er noe formalisert på høyt nivå (billettbestillingssystem, banksystem) Vi må skille mellom systemer: der data er lagret som tilgjengelig som f.eks. HTML (”ekte Web”) der data ligger i lukkede databaser og der Web brukes kun for brukergrensesnitt denne siste del blir stadig viktigere (bank, billett, Facebook, YouTube, …)

9 Tilgjengelig/utilgjengelig Mye er tilgjengelig for alle, men ikke alt Mye data er lukket inne bak innloggings-prosedyrer: Banksystemer Bibliografiske databaser Sosiale nett (Facebook) Noen avisarkiv Studieinformasjon (?) m.m. Her har en ofte høyere formaliseringsnivå Men data kan være utilgjengelig for søkemotorer som Google

10 Enveis linker Vi kan linke dit vi vil, ingen sentralisering Men ulempen er at linken kan gå til en side som er fjernet/endret Toveis linker ville rettet på dette, men ville vært langt vanskeligere å administrere Vi kan være glad for at Tim Berners Lee valgte det enkleste her også.

11 Søking Precision = # relevant returned # returned Recall = # relevant returned # relevant in total

12 Web søking Komplisert ved: Datamengden Inhomogen database Naturlig språk Forenklet ved: At vi ofte ute etter å finne noe informasjon, og der mye av det vi finner løser vårt informasjonsbehov Gode søkemotorer

13 Søkemotorer Stikkordbasert Tradisjonell tekstsøking: Prioritering basert på antall forekomster av søkeordet Prioritering basert på betydningen av siden (Google), definert som: Hvor mange sider linker til denne siden? Hvor viktige er de sidene som linker? m.m. Prioritering basert på betaling, annonser

14 Eks.: Information overload NoQuery# returned 1.information AND retrieval80,000 2.“information retrieval”20,000 3.full AND text AND information AND retrieval10,000 4.“information retrieval” AND “full text” 2,000 5.“full text information retrieval” 40 6.information AND overload10,000 7.“information overload” 4,000 8.“information retrieval” AND “information overload” 40

15 Filtrering Vi ønsker kanskje å fjerne en viss type sider fra søket eller fra e-posten (porno, SPAM..) Kan eliminere ut fra ord i teksten, ut fra farge på bilder (hudfarge) Kan eliminere sider på visse adresser, e-post fra visse avsendere Kan la noen kategorisere sidene for oss

16 I praksis Ingen av metodene fungerer 100% Et filter kan fjerne mesteparten av SPAM men ikke alt Fjerner også noen genuine meldinger/sider Problem: Formalisering Dagens løsning: Egne firma som utvikler Spam filtre, filtre som hele tiden tilpasses det som sendes ut. Dette fungerer godt.

17 Kvalitet Siden alle kan legge inn data på Web får vi et demokratisk system Til gjengjeld har vi ingen kontroll med kvaliteten av det som blir lagt ut Derfor må vi vurdere informasjonen ut fra hvem som har generert denne Det er kanskje en fordel, som vi ser er verken myndigheter eller media ”objektive”.

18 Wikipedia Leksikon laget av brukere Har 3.3 millioner søkeord på engelsk Alle kan redigere artikler Gjør det meget godt i tester på kvalitet. Slår alle andre leksikon på antall søkeord Har vært nødt til å innføre en viss kontroll på kontroversielle emner, men stort sett fungerer systemet meget godt

19 Portaler Organiserer informasjonen på Web Hele Web (Yahoo) For et firma, bransje, markedsplass, etc. ”Alt på ett sted” tanke Data organiseres ofte i menyer, greit om vårt informasjonsbehov kan klassifiseres på samme måte Kjente organisasjoner i den fysiske verden (f.eks. vg, nrk, tv2) forsøker å utnytte sin posisjon til å etablere portaler

20 Tilstedeværelse på Web Mange har sin hjemmeside på nettet Demokratisk at vi alle kan ha vår side her Problemet er å skape trafikk – hvordan gjør vi det? Kan vi gjøre linken kjent? Kan vi bli ”utvalgt” av søkemotorene? Lettere for VG enn for Ola Nordmann Lettere for et hotell i Honningsvåg enn i London Undersøkelser viser at 75% av trafikken går til noen få Web steder I de siste årene har noen nykommere klart å etablere seg med kjente nettsider: Facebook, YouTube, Nettby… og også flere blogger Men det kan være problematisk å opprettholde trafikken over tid

21 Nye portaler Facebook satser på å bli en portal Dvs. en skal kunne nå mange andre tjenester herfra Om en får brukerne til å gå inn på disse stedene via Facebook får en mer data om brukerne Dette kan en bruke til mer målrettet reklame, m.m. Fordelen for brukerne er at de kan bruke Facebook’s innloggingsrutine (krever nok at denne blir sikrere) Om Facebook oppnår dette vil operativsystemet få mindre betydning.


Laste ned ppt "Web – browsere, søking, m.m. Pensum: Olsen, kap. 8, 9, 10."

Liknende presentasjoner


Annonser fra Google