Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

03.01.13 1 Del 5: Kap. 28-36 Internet and WW Basics How Information Technology Is Conquering the World: Workplace, Private Life, and Society Professor.

Liknende presentasjoner


Presentasjon om: "03.01.13 1 Del 5: Kap. 28-36 Internet and WW Basics How Information Technology Is Conquering the World: Workplace, Private Life, and Society Professor."— Utskrift av presentasjonen:

1 03.01.13 1 Del 5: Kap. 28-36 Internet and WW Basics How Information Technology Is Conquering the World: Workplace, Private Life, and Society Professor Kai A. Olsen, Universitetet i Bergen og Høgskolen i Molde

2 Kai A. Olsen, 10.07.2014 2 Opplegg for forelesningene Del 5 er stort sett grei lesning. Da dekker jeg bare utvalgte emner i forelesningen. Skulle dere ha behov for hjelp så send e- post.

3 Kai A. Olsen, 10.07.2014 3 Kap 28 HTML og XML HTML Språk for å beskrive layout av en Web-side HTTP Protokoll for å oversende Web-sider XML Språk for å lage standarder for dokument og dataoverføring

4 Kai A. Olsen, 10.07.2014 4 Web mål WWW utviklet av Tim Berners Lee ved CERN i 1991 (her tok vi innersvingen på amerikanerne!). Han ville lage et system for å presentere forskningsresultater (dokumenter, linker til referanser...) Berners Lee mål for WWW var: Enkelhet Hypertext (linker) Alle skulle kunne utvikle Web-sider. Universelt Distribuert Det fikk han til, sannsynligvis fordi han jobbet alene (en komité ville nok laget noe som var langt mer komplekst)

5 Kai A. Olsen, 10.07.2014 5 HTML – HyperText Markup Language Et tag-språk der ideen er å omslutte data med tags, for eksempel: SAS Ideer tatt fra SGML, en ISO standard for å beskrive tag-språk utviklet på 80-tallet, blant annet med den hensikt å kunne beskrive komplekse dokumenter HTML beskriver layout på Web sider HTML er enkelt, fleksibelt og kan brukes nesten som et blankt ark. Stadig nye versjoner med nye funksjoner.

6 Kai A. Olsen, 10.07.2014 6 Mer om HTML Beskriver layout Link-muligheten sentral (til bilder, andre sider, m.m.), f.eks.: UiB Når vi klikker på denne linken (vist som UiB) vil browseren utføre en GET-kommando for å få denne sidenUiB HTML er enkelt, men det er også språkets store styrke! HTML kan programmers av mennesker, eller av dataprogrammer. Det siste er mest vanlig. ”View Source” – viktig kommando! Feil blir ignorert

7 Kai A. Olsen, 10.07.2014 7 … Eksamen Tidligere eksamensoppgaver (fra IDA 105) ligger på nettsiden. For 2007 vil vi bruke samme eksamensform som i 2006. Oppgavene for dette året er derfor relevante. Eksamensettet vil bestå av to deler…. (tilsvarende oppgavene i eksamenssett fra før 2006). Begge deler må bestås for at en skal kunne få bestått på eksamen! Før 2006 ble det delvis brukt andre lærebøker, likevel er kursinnholdet er ganske likt Viktig: Oversikt godkjente øvinger (Excel) Forelesningsplan (sist oppdatert 09.08.07) Hjelpelærerplan (felles med IBE150) ….. Eksempel (kursside) Merk! Feil

8 Kai A. Olsen, 10.07.2014 8 XML - eXtensible Markup Language, Mens HTML kun beskriver layout kan vi bruke XML til å beskrive strukturen i dokumenter.. Vi får formalisert dataoverføring. Men XML er bare verktøyet. Vi må selv utvikle standarder for tagging.

9 Kai A. Olsen, 10.07.2014 9 Kap 29 Protokoller Kommunikasjon er en viktig del, kanskje den viktigste del, av moderne databehandling Med det får vi tilgang til data Kan utføre oppgaver mot sentrale systemer Kan kommunisere med andre Kan hente data, programvare og oppdateringer fra nett

10 Kai A. Olsen, 10.07.2014 10 Kommunikasjonsprotokoll Rutiner for å administrere og kontrollere oversending av data: For å kontrollere at avsenderen er den han sier han er At bare mottakeren (e) får data At data er mottatt At data kommer fram akkurat slik de ble sendt At data kommer fram innen rimelig tid

11 Kai A. Olsen, 10.07.2014 11 Nødvendig også uten datamaskinen Telefonsamtale: ”Hallo” ”Dette er Nils” ”Ha det” Radiosamtale (enveissamband): ”Over” ”Over og ut”

12 Kai A. Olsen, 10.07.2014 12 Pakke-svitsjet nettverk Vi deler komplekse oppgaver (store filer) inn i mange små, enklere oppgaver: Store filer deles inn i mange pakker Pakkene har fast størrelse ”Mange” er som kjent intet problem for moderne datautstyr Fordel: Pakkene kan sendes forskjellig vei Mister vi en pakke, eller er det feil i en pakke, trenger vi bare å sende denne på nytt Enklere protokoller Vi utnytter nettet bedre med pakke- enn med linjesvitsjing Pakke-svitsjing er robust

13 Kai A. Olsen, 10.07.2014 13 Internet IP – Internet Protocol Brukes av maskinene i begge ender av en kommunikasjonsvei, og av alle mellomstasjoner (rutere) 32-biters adresse. 4 milliarder forskjellige adresser – ikke nok! Ny standard (IPv6 ) bruker 128 biter For å kunne leses presenteres IP-adressene i punktnotasjon, f.eks: 158.38.10.00

14 Kai A. Olsen, 10.07.2014 14 Domains Vi mennesker trenger noe enklere: Navnekonvensjon, f.eks. himolde.no, uib.no IP adressene gis en mer brukervennlig form med tekst, der vi deler verden inn i ”domains” Navneservere konverterer fra navn til IP-adresser. ICANN har ansvaret for å tildele domener og navn. Dette er en organisasjon styrt av USA. Krav om at den blir mer internasjonal (aktualisert gjennom NSA overvåkning). Hvis ikke ønsker EU og andre å opprette egne organisasjoner.

15 Kai A. Olsen, 10.07.2014 15 Lagdeling for datatransmisjon Nettene deles inn i lag. Nederst finner vi de fysiske nettene. Øverst applikasjonene. En applikasjon trenger altså bare bry seg med transportlaget (TCP - Transmission Control Protocol), eller enklere med enda høyere lag. Resten tas av de underliggende lagene. Fra lav- til høynivå formalisering.

16 Kai A. Olsen, 10.07.2014 16 Høynivå protokoller Simple Mail Transfer Protocol (SMTP) File Transfer Protocol (FTP) Internet Message Access Protocol (IMAP) Multipurpose Internet Mail Extensions (MIME) Hypertext Transfer Protocol (HTTP) Simple Object Access Protocol (SOAP) for å sende XML dokumenter

17 Kai A. Olsen, 10.07.2014 17 Oppgavefordeling Om vi skal sende en ePost vil epost- programmet bruke SMTP (høyeste nivå) SMPT kan benytte IMAP IMAP protokollen vil bruke TCP/IP TCP/IP vil bruke nettverksprotokoller for å få sendt pakkene Nettverksprotokollene vil bruke fysiske innretninger for å få sendt signalene (laveste nivå)

18 Kai A. Olsen, 10.07.2014 18 Svakhet ved dagens epost-protokoller Lett å endre på innhold Lett å endre på avsenderadresse Dette utnyttes av dem som sender SPAM, virus m.m. til å skjule avsender eller bruke falsk avsender Vi trenger sikrere protokoller for e-post I dag velger enkelte organisasjoner å unngå e- post pga SPAM og lignende. Ingen god idé. Posten og andre organisasjoner tilbyr sikrere e-post (Digipost m.m.)

19 Kai A. Olsen, 10.07.2014 19 Kap 30. Web protokoller Når vi klikker på en link. Vil ”browseren” utføre en GET-kommando, med URL fra linken som adresse (f.eks. www.himolde.no/index.html) www.himolde.no/index.html En navneserveren vil finne adressen, sende forespørselen dit, og mailserveren vil da hente fram og returnere Web-siden Browseren vil så vise denne. Overføringsprotokollen er HTTP, eller HTTPS om en vil ha sikrere (kryptert) overføring.

20 Kai A. Olsen, 10.07.2014 20 HTTP (HyperText Transfer Protocol) Bygget opp-på TCP/IP GET-kommando: Ber om å få den aktuelle Web side Siden identifisert med en URL (”Uniform Resource Locator”) URL identifiserer server og adresse til siden, f.eks. http://www.ii.uib.no/persons/index.html Visual Basic og andre språk har innebygget moduler som kan hente Web sider for oss, om vi vil gjøre dette fra et program

21 Kai A. Olsen, 10.07.2014 21 Web side (eksempel)

22 Kai A. Olsen, 10.07.2014 22 Kap 31. E-post, chat, SMS og tweets Tekstbasert Standardiserte protokoller (kan brukes overalt) Unike adresser (e-post eller telefonnummer) Krever liten båndbredde Asynkront Billig eller gratis (gitt at vi har Internettforbindelsen)

23 Kai A. Olsen, 10.07.2014 23 Store fordeler Kjapt og enkelt Kan arkiveres Kan videresendes Kan genereres av datamaskin Lite forstyrrende for mottaker (i hvertfall sammenlignet med telefon) Sending fra adressebok, gruppeutsending

24 Kai A. Olsen, 10.07.2014 24 Eksempel Sykehusene klager over at mange ikke møter til time. Da kan en spørre seg hva de har gjort med det. Her er en mulighet: Send påminnelse på SMS to dager i forveien. Her med opplysninger om hva det gjelder, hva en bør ta med, hvor lenge det vil vare, etc. Ny påminnelse to timer i forveien. Nå med kontaktinformasjon (adresser, kart, osv.) Med et elektronisk bestillingssystem (som alle sykehus har) er dette nesten kostnadsfritt.

25 Kai A. Olsen, 10.07.2014 25 Sammenligning av media for kommunikasjon

26 Kai A. Olsen, 10.07.2014 26 Kap. 32 Browsere 1991 – første Browser utviklet av Tim Berners-Lee 1993 Mosaic (NCSA, Marc Andreessen) 1995 Netscape (Andreessen et al) 1995 Internet Explorer (Microsoft, basert på Mosaic) I dag også: Firefox, Safari, Opera, Crome, …

27 Kai A. Olsen, 10.07.2014 27 Oppgave Vise Web sider Utfører GET-kommandoer for å hente sidene Presenterer sidene ut fra tag- informasjonen Forenkle administrasjon (favoritter, sidehistorikk, oppsett…) Utføre programmer (script og applets)

28 Kai A. Olsen, 10.07.2014 28 Surfing på Web Nettbruk karakterisert ved: Kort tid mellom klikkene Skanner sider mer enn å lese Trenger godt organiserte sider med lite tekst, som understøtter kjapp navigering Følger linker Krever kjappe responstider

29 Kai A. Olsen, 10.07.2014 29 Skjema - form Meget viktig funksjon Vi kan nå bruke HTML også for inndata Gir muligheter for en lang rekke applikasjoner: Billettbestilling Banksystemer Ordresystemer m.m. Data fra forms blir hentet ut på serversiden Med form-begrepet kan vi altså bruke HTML som et grensesnitt mot andre systemer Gir standardisering på brukersiden, grunnlaget er nå lagt for B2C applikasjoner

30 Kai A. Olsen, 10.07.2014 30 Mer Script, applets: En del kontroller kan gjøres i brukergrensesnittet i Browseren Mer dynamiske brukergrensesnitt Cookies: Små filer med ID som legges på din maskin. Server kan da identifisere bruker. Plug-ins: Vi kan utvide funksjonaliteten til browseren Sertifikater: Browseren kan identifisere serverapplikasjonen (f.eks. et banksystem), serveren kan identifisere bruker (en bankkunde), kryptografert overførsel (HTTPS)

31 Kai A. Olsen, 10.07.2014 31 Tilstandsløs (stateless) protokoll Serveren utfører HTTP oppgaver, uten å ”huske” hva den har gjort F.eks: Om vi først ber om å få se de 10 første resultater av et søk, deretter de 10 neste Så må serveren få beskjed om at vi vil se 11-20 i det andre søket En tilstandsløs protokoll er meget enkel, og vi håndterer greit det at brukere stopper midt i en prosess Men vanskeliggjør applikasjoner med innlogging osv. Vi skal komme tilbake til dette senere.

32 Kai A. Olsen, 10.07.2014 32 Kap. 33 Web Inhomogene data: Hjemmesider til personer Hjemmesider til organisasjoner Offisielle rapporter Stiler, kursinnleveringer, øvingsoppgaver Amatørorganisasjoner Aviser Blogger …

33 Kai A. Olsen, 10.07.2014 33 Lavt formaliseringsnivå Mesteparten av data er formalisert på tegn/layout nivå (HTML, PDF) Samtidig er noe formalisert på høyt nivå (billettbestillingssystem, banksystem) Vi må skille mellom systemer: der data er lagret som tilgjengelig som f.eks. HTML (”ekte Web”) der data ligger i lukkede databaser og der Web brukes kun for brukergrensesnitt denne siste del blir stadig viktigere (bank, billett, Facebook, YouTube, …)

34 Kai A. Olsen, 10.07.2014 34 Tilgjengelig/utilgjengelig Mye er tilgjengelig for alle, men ikke alt Mye data er lukket inne bak innloggings-prosedyrer: Banksystemer Bibliografiske databaser Sosiale nett (Facebook) Noen avisarkiv Studieinformasjon (?) m.m. Her har en ofte høyere formaliseringsnivå Men data kan være utilgjengelig for søkemotorer som Google

35 Kai A. Olsen, 10.07.2014 35 Enveis linker Vi kan linke dit vi vil, ingen sentralisering Men ulempen er at linken kan gå til en side som er fjernet/endret Toveis linker ville rettet på dette, men ville vært langt vanskeligere å administrere Vi kan være glad for at Tim Berners Lee valgte det enkleste her også.

36 Kai A. Olsen, 10.07.2014 36 *WWW i dag Vi har et åpent nett der vi kan søke fritt Data formalisert som HTML, pdf eller doc. Det ”egentlige” WWW. Men så bruker vi også HTML og HTTP for å ha kommunikasjon med spesialsystemer: internett bank, flybestilling, streaming tjenester, osv. Her kan vi operere på et høyere formaliseringsnivå, f.eks. vil SAS sitt Web-system forstå begrep som fra, til, dato, tid… Fordelen er at vi kan bruke vår standard browser for å kommunisere med disse systemene.

37 Kai A. Olsen, 10.07.2014 37 Ikke åpent Innholdet i spesial databasene er som oftest ikke tilgjengelig. For eksempel vil informasjon i Studentportalen ikke bli sett av Google’s søkemotor. Da får vi den paradoksale situasjon at universitetene og høgskolene betaler for annonser på Google, men skjuler informasjon slik at Google ikke finner dette med vanlige søk.

38 Kai A. Olsen, 10.07.2014 38 Kap 34. Søking Precision = # relevant returned # returned Recall = # relevant returned # relevant in total

39 Kai A. Olsen, 10.07.2014 39 Web søking Komplisert ved: Datamengden Inhomogen database Naturlig språk Forenklet ved: At vi ofte ute etter å finne noe informasjon, og der mye av det vi finner løser vårt informasjonsbehov Gode søkemotorer

40 Kai A. Olsen, 10.07.2014 40 Søkemotorer Stikkordbasert Tradisjonell tekstsøking: Prioritering basert på antall forekomster av søkeordet Prioritering basert på betydningen av siden (Google), definert som: Hvor mange sider linker til denne siden? Hvor viktige er de sidene som linker? m.m. Prioritering basert på betaling, annonser

41 Kai A. Olsen, 10.07.2014 41 Eks.: Information overload NoQuery# returned 1.information AND retrieval80,000 2.“information retrieval”20,000 3.full AND text AND information AND retrieval10,000 4.“information retrieval” AND “full text” 2,000 5.“full text information retrieval” 40 6.information AND overload10,000 7.“information overload” 4,000 8.“information retrieval” AND “information overload” 40

42 Kai A. Olsen, 10.07.2014 42 Søking Google bruker sin PageRank algoritme for å sortere søkeresultatet. I prinsippet prioriterer den sider som mange linker til, spesielt om de som linker til også har høy prioritet. I tillegg brukes et hundretall andre faktorer. Det er særdeles viktig å komme høyt opp på resultatlisten, mange scroller ikke, få går til neste side.

43 Kai A. Olsen, 10.07.2014 43 Turbokforlaget Vi oppdaget at vår side www.turbok.no kom langt ned på Google med de søkeordene kundene ville benytte.www.turbok.no Fikk mange til å søke til oss (NRK, kommuner) La inn en link fra min hjemmeside på Høgskolen. Kom mye høyere opp.

44 Kai A. Olsen, 10.07.2014 44 SERP (Search Engine Results Page) Antall treff Sponsor- linker (reklame) Vanlige treff (skal være ikke- kommersielle)?

45 Kai A. Olsen, 10.07.2014 45 Reklamelinker Keyword pricing: Nøkkelordene auksjoneres ut til høystbydende Nielsen Norman Group (som holder seminarer om brukergrensesnitt) betaler f.eks. 31 cent for ”usability training” Dvs. for hvert klikk som fører til deres site Alternativ modell Pris pr. view

46 Kai A. Olsen, 10.07.2014 46

47 Kai A. Olsen, 10.07.2014 47 Nytte-kostnad Hvor mange av de som kommer til siden (fra søkemotoren) kjøper noe? Hvor mye tjener vi på dette? Regnes opp til fortjeneste pr. klikk Vi kan by opp til dette Også en mulighet for at søkeren vil komme tilbake direkte neste gang (framtidige salg)

48 Kai A. Olsen, 10.07.2014 48 En svakhet med Googles forretningsmodell?

49 Kai A. Olsen, 10.07.2014 49 mer…

50 Kai A. Olsen, 10.07.2014 50 Interne søk Her har vi full kontroll, vi kan ”tune” søket F.eks. kan vi kople søkeord direkte til en side. F.eks. om vi søker på ”informatikk-studier” ved UiB bør vi få en oversikt over alle relaterte studier (dette var ille før, bedre nå)

51 Kai A. Olsen, 10.07.2014 51 Google søk virker ofte bedre Et søk i hele verden gir altså bedre resultat enn søk på NSB!

52 Kai A. Olsen, 10.07.2014 52 Miniøving Hvorfor tilbyr Google og andre søkemotorer resultater fra sider som ingen har betalt for? Dvs. hvorfor har de ikke bare ”sponsored links”?

53 Kai A. Olsen, 10.07.2014 53 Generelt problem med søking F.eks. søk etter ”Universitetet i Bergen” eller ”Høgskolen i Molde” går greit, vi søker på et spesifikt navn og bruker samme navn i søket som på Web-siden, 1 til 1 kopling Søk etter bilen ”Golf”. Flere meninger av dette ordet skaper problemer. Jeg forsøkte å finne tilbake til eksperimenter gjort med formalisert e-post (skjema) men ble overveldet av at ord som email, form, schema, research er så mye benyttet. Vanskelig å beskrive mitt informasjonsbehov med søkeord.

54 Kai A. Olsen, 10.07.2014 54 Filtrering Her har vi også problemer med å formalisere vårt ønske. F.eks. å blokkere pornografi. Mange muligheter, men ikke virker i praksis.

55 Kai A. Olsen, 10.07.2014 55 Informasjonskvalitet På Web finner vi alt, fra vitenskapelige artikler til hjemmesider for lugubre organisasjoner. Kan vi stole på det vi leser? Svaret er nei, men det kan være en fordel! Vi må selv vurdere troverdighet, sjekke hvem som sier dette, finne andre kilder, osv. Det kan være bedre enn å blindt akseptere at læreboken, politikeren, avisen, osv. forteller sannheten.

56 Kai A. Olsen, 10.07.2014 56 Miniøving Vi skal i fellesskap lage en enkel Web- side, basert på: Direkte innskriving (Notepad) Direkte innskriving forenklet (uten tags) Endring av eksisterende Web-side (bruk av ”source”) Bruk av verktøy (her Word)

57 Kai A. Olsen, 10.07.2014 57 Kap 35. Portaler Organiserer informasjonen på Web Hele Web (Yahoo) For et firma, bransje, markedsplass, etc. ”Alt på ett sted” tanke Data organiseres ofte i menyer, greit om vårt informasjonsbehov kan klassifiseres på samme måte Kjente organisasjoner i den fysiske verden (f.eks. vg, nrk, tv2) forsøker å utnytte sin posisjon til å etablere portaler

58 Kai A. Olsen, 10.07.2014 58 Kap. 36. Tilstedeværelse på Web Mange har sin hjemmeside på nettet Demokratisk at vi alle kan ha vår side her Problemet er å skape trafikk – hvordan gjør vi det? Kan vi gjøre linken kjent? Kan vi bli ”utvalgt” av søkemotorene? Lettere for VG enn for Ola Nordmann Lettere for et hotell i Honningsvåg enn i London Undersøkelser viser at 75% av trafikken går til noen få Web steder I de siste årene har noen nykommere klart å etablere seg med kjente nettsider: Facebook, YouTube, Nettby… og også flere blogger Men det kan være problematisk å opprettholde trafikken over tid

59 Kai A. Olsen, 10.07.2014 59 Startups IT har åpnet nye muligheter. Ofte kan nye firma (startups) være flinkere til å se mulighetene enn eksisterende firma (som kan være opphengt i gamle rutiner) Mange land forsøker å stimulere oppstartingsselskaper Selvfølgelig basert på suksessen til Microsoft, Apple, Google, Facebook, Twitter m.m.

60 Kai A. Olsen, 10.07.2014 60 Finland Finland har lykkes godt med flere av sine nye selskaper Start-up sauna, en inkubator for nye firma. Finansiert av stat, universiteter og næringslivet. Studenter har stått sentralt. Kopler sammen design og utvikling.

61 Kai A. Olsen, 10.07.2014 61 Eksempel: Rovio Entertainment Utviklet suksessen Angry Birds Lastet ned mer enn 600 millioner ganger i 2011. Har kapital blant annet fra Microsoft. 500 ansatte i Finland.


Laste ned ppt "03.01.13 1 Del 5: Kap. 28-36 Internet and WW Basics How Information Technology Is Conquering the World: Workplace, Private Life, and Society Professor."

Liknende presentasjoner


Annonser fra Google