Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

SIF8076 Planl/drift av IT-syst

Liknende presentasjoner


Presentasjon om: "SIF8076 Planl/drift av IT-syst"— Utskrift av presentasjonen:

1 SIF8076 Planl/drift av IT-syst
SIF8076 Planlegging og drift av IT-systemer :52 SIF8076 Planl/drift av IT-syst Del 1 - Introduksjon Systemsadmins rolle, oppgaver, målsetting og filosofi Målsettingen med første forelesning er å gå igjennom kapittel 1 i læreboka. I tillegg vil en del ekstra materiale bli lagt til, spesielt i forbindelse med systemadministrators rolle og målsetting. Videre vil vi se på systemadministrasjon som karrierevei, og se litt på rene driftsorganisasjoner. SIF8076 Planl/drift av IT-syst Foiler fra vårsemesteret 2001

2 SIF8076 Planlegging og drift av IT-systemer
:52 Definisjon (forslag) Systemadministrasjon er ingeniørfeltet som omfatter design, igangsetting, drift, overvåking og vedlikehold av komplekse datasystemer som primært skal brukes av andre, basert hovedsakelig på preeksisterende komponenter. På engelsk brukes dels ”System Administration” og dels ”Systems Administration”. Feltet skiller seg fra ”vanlig” utvikling ved at man i mindre grad utvikler noe, og i større grad limer sammen mer eller mindre ferdige komponenter. I tillegg er fokus ved systemadministrasjon lagt på driftsfasen, og oppgavene er ikke tidsavgrensede. Det vil si at en systemadministrator skal holde noe igang, mens en utvikler primært skal ferdigstille og avslutte noe. Likevel vil mindre utviklingsprosjekter inngå i hverdagen til en systemadministrator. Mange har sammenlignet systemadministrasjon med akkuttmottaket på et sykehus. De har nok felles høyt tidspress og stor bredde på de problemene som dukker opp. Merk at denne definisjonen ikke omfatter drift av egen maskin. Vi forutsetter altså en situasjon der rollene som systemadministrator og bruker innehas av forskjellige personer. SIF8076 Planl/drift av IT-syst Foiler fra vårsemesteret 2001

3 SIF8076 Planlegging og drift av IT-systemer
:52 Ordbruk Systemansvarlig Systemadministrator (sysadm) Systemintegrator Operatør/systemoperatør Drifter Mange ord brukes om hverandre om systemadministratorer. Her er en liste over ulike ord, og en beskrivelse av hvilken valør det enkelte ordet har. Systemansvarlig er den som har det overordnede operative ansvaret for et dataanlegg. Systemadministrator er den som faktisk gjør jobben med å drive et dataanlegg. Systemintegrator er den som tilrettelegger deler av et dataanlegg, f.eks. setter opp e-postsystemet slik at andre senere kan drive det. Operatør er en person som utfører hovedsakelig rutineoppgaver i driftsstaben. Drifter er en person som gjeter kyr (i hvert fall sist jeg sjekke ordboka) Forskjellen mellom systemansvarlig og systemadministrator er tåkete, men vi kan si at systemansvarlig fokuserer på ansvarsforhold, mens systemadministrator fokuserer på utføring av oppgaver. I de fleste mindre organisasjoner blir dette en og samme person. Jeg vil bruke ”sysadm” som forkortelse for systemadministrator. SIF8076 Planl/drift av IT-syst Foiler fra vårsemesteret 2001

4 SIF8076 Planlegging og drift av IT-systemer
Paradigmeskifte: Da Kalle oppgraderte fra VMS til SGI :52 Historikk Maskiner var dyrere enn personer Mange ”tilfeldige” utøvere Behovsdrevet og selvlært Inkrementell oppskalering Drift er reaktivt Ikke ansett som fagfelt Opprinnelig var datamaskiner ekstremt dyre, slik at utgiftene til personene som skulle drive dem var bokstavelig talt forsvinnende små. Selv i 1985, da NTNU og Sintef kjøpte sin første Cray-maskin for 82 mill kroner, så kom maskinen med to teknikere fra Cray ”på kjøpet”. En kunne simpelt hen ikke kjøpe en Cray uten disse. Etter hvert har imidlertid antallet maskiner gått opp, og prisen på maskinene gått ned, slik at personalkostnadene er blitt en betraktelig del av kostnadene ved en datamaskin. Veldig mange systemansvarlige har ikke selv bevisst valgt sitt yrke. De har simpelt hen blitt trukket inn i arbeidet fordi ”noen må gjøre jobben”. Noen har begynt fordi har måttet drive en maskin før de kan bruke den. Andre har blitt mer eller mindre dyttet inn i jobben fordi de var nyttigere for arbeidgiver der enn andre steder. Det er symtomatisk at mange systemadministratorer ser på sin egen arbeidssituasjon som temporær … når de blir ”voksne” så skal de bli programmere, eller ta doktorgraden sin, eller gjøre noe annet ”skikkelig” arbeid. De fleste systemansvarlige er selvlærte. De har måttet sette seg inn i det de trenger å kunne, ofte ”på overtid”. Det har gjort at feltet er preget av en ad-hoc-holdning. Ofte prioriteres dagens problemer fremfor planlegging av morgendagen, og man prioriterer ofte neste problem såsnart forrige problem er sånn omtrent fikset. En driftsorganisasjon har en tendens til å øke antall datamaskiner inkrementelt, uten at dette for konsekvenser for antall ansatte og for driftsmetoder og organisering. At drift tradisjonelt er reaktivt betyr at man har forsøkt å besvare problemer etter hvert som har man oppdaget dem, fremfor å komme problemene i forkjøpet ved å planlegge. Man har forsøkt å la være å gjøre noe så lenge ting virker. Som fagfelt har drift av datamaskiner ikke vært ansett som et eget fagfelt, bare som en overhead og et nødvendig onde som bør holdes minst mulig. Men dette er også et resultat av de momentene som er angitt over. SIF8076 Planl/drift av IT-syst Foiler fra vårsemesteret 2001

5 SIF8076 Planlegging og drift av IT-systemer
:52 Diskusjon: hva mener tilhørerne? Mulige målsetninger ”Keep the users happy” ”Keep the system running” Oppnå det perfekte system Overflødiggjøre seg selv Hjelpe brukerne til å oppnå sine mål Komme igjennom jobbkøen En person har spissformulert seg slik: ”The task of a system administrator is not to keep the users happy, but to keep the system running, and then the users are likely to be more happy than if he tried to cater for the expressed wishes of the users”. I praksis bør man kanskje velge en middelvei. Merk at en del brukere får et hat-forhold til sine systemansvarlige, nettopp fordi den nevnte holdningen virker provoserende. De mener at de skal settes i sentrum for systemansvarligs fokus, og at andre forhold er underordnet. På mange måter har de rett! I de færreste organisasjonene er IT-drift noe annet enn en administrativ overhead som bør holdes så lavt som mulig; mens brukerne like ofte er den faktiske fokus for organisasjonens aktivitet. Husk at det er brukerne som definerer sine egne mål. Siden IT-drift stort sett er en administrativ overhead, så bør det være et mål for systemansvarlig å overflødiggjøre seg selv; omtrent slik som tannleger. Det er neppe noen umiddelbar fare for at datasystemene blir så vedlikeholdsfrie at man ikke trenger systemansvarlig. En del systemansvarlige får et urealistisk forhold til sitt dataanlegg … det blir et mål i seg selv i stedet for å være et redskap for brukerne; og brukerne blir ubehagelige plageånder som bare er ute etter å lage trøbbel. Jeg mener at den beste definisjonen er å hjelpe brukerne til å oppnå sine mål, ved å sørge for at datamaskinene tilbyr relevante verktøy for brukerne. Systemansvarlig skal helst være mer veivesen enn trafikkpoliti. SIF8076 Planl/drift av IT-syst Foiler fra vårsemesteret 2001

6 SIF8076 Planlegging og drift av IT-systemer
:52 Målsetting (forslag) Holde et system av datamaskiner i gang for brukerne slik at de kan få utført sine oppgaver - til alles felles beste og organisasjonens uttrykte mål - ved å balansere tilgjengelige ressurser og søke å minimalisere den administrative overhead. Merk at i en organisasjon er brukernes eget beste ofte eksternt definert. Derfor skal du være like forsiktig med å påstå at du vet hva som er best for brukerne. Det spøkes med at et udokumentert og kaotisk system betyr jobbsikkerhet for systemansvarlig, og det det derfor er en målsetting å gjøre seg uunnværlig. Det er totalt misforstått. En arbeidsgiver har langt mer bruk for en person som eliminere en administrativ overhead, enn en som etablerer en oppgave som må vedlikeholdes i all overskuelig fremtid. Når vi snakker om å balansere ressurser, så regnes også tid, kunnskap og oppmerksomhet som ressurser. Ved universitetene kan selv billig maskinvare være vanskelig å få penger til å kjøpe, mens arbeidstid synes å være gratis. Mens andre steder er det omvendt. Husk at systemadministrasjon (som all annen administrasjon) er en sekundær aktivitet og en overhead, og derfor aldri et mål i seg selv (med enkelte hederlige unntak, som dette faget). SIF8076 Planl/drift av IT-syst Foiler fra vårsemesteret 2001

7 SIF8076 Planlegging og drift av IT-systemer
:52 Trekk sammenligningen med ”engineers” litt lengre Sysadm som fagfelt Et typisk ingeniørfag Et datafag Grensesnitt til elektrofagene Grensesnitt til organisasjonsfag og prosjektstyring Statistikk, psykologi og kommunikasjon mellom mennesker er viktig Ordet ”ingeniør” kommer av engelsk ”engineer”, som refererer ”engine”, altså maskin, og henviser til de som ”drev” dampmaskinene på 1800-tallet. Innen datafagene, er sysadm beslektet med utvikling, dels fordi sysadm inneholder mindre utviklingsprosjekter, og dels fordi man skal drive de produktene utviklerne har laget. Videre er faget relatert til kommunikasjonsteknologi, siden nettet er en viktig, integrert del av et datasystem; og til datamaskinsystemer, siden det kreves god innsikt i hardware. Andre beslektede felt er databaser, operativsystemer, informasjonssystemer og mennske-maskin-grensesnitt. Faget inneholder svært mye kommunikasjon med brukere og andre sysadm. SIF8076 Planl/drift av IT-syst Foiler fra vårsemesteret 2001

8 Sysadm som ingeniørfag
SIF8076 Planlegging og drift av IT-systemer :52 Tidl fulgte lokføreren med lokomotivet Sysadm som ingeniørfag Fokus på konvensjoner og standarder Fundert på vitenskap Basert på tommelfingerregler Basert på prøving og feiling Mye tilgjengelig litteratur Ingen helt perfekte metoder Mange temmelig gale metoder Selv om ingeniørvirksomhet er basert på vitenskap, så er det en anvendelse, og den er i stor grad basert på prøving og feiling, på konvensjoner og tommelfingerregler. Over tid venter jeg at sysadm blir strukturert og forenklet, og at man trenger langt mindre kunnskap og ressurser til å drive datamaskiner. En sammenligning med lokomotivenes utvikling er illustrerende. Tidligere måtte lokomotivføreren og fyrbøteren ha inngående innsikt i lokomotivet, og nærmest være i stand til å reparere enhver feil, kjenne særegenhetene til de ulike lokomotivene. Signaler, vekslere og slikt måtte håndteres manuelt. I dag har man automatisert bort det meste, og lokføreren er blitt nærmest en sjåfør. SIF8076 Planl/drift av IT-syst Foiler fra vårsemesteret 2001

9 Sysadm som karrierevei
SIF8076 Planlegging og drift av IT-systemer :52 Sysadm som karrierevei Livslang karrierevei Varierte jobbmuligheter Grenseflater mot andre fagfelt Vitenskapelige muligheter Interaksjon med andre – utadvendt Jeg mener at sysadm er en livslang karrierevei, selv om det sikkert fremdeles er mange som er uenige i det. Med at det er en livslang karrierevei, mener jeg at det er et fagfelt der man ikke er ”utlært” etter noen få år, men der det hele tiden er nye utfordringer som skal mestres. I tillegg er feltet bredt, slik at det er mange underområder, noe som gir varierte jobbmuligheter. At faget har grenseflater mot andre fag betyr blant annet at det er mulig å gli over i andre jobber dersom det er ønskelig (for eksempel innen utvikling og administrasjon). Etterhvert som sysadm har begynt å bli universitetsfag rundt om i verden, betyr det også at man velge en vitenskapelig karriere med fokus på sysadm. Systemadministrasjon føles også motiverende – det er noe som skjer hele tiden, det er personer som faktisk benytter det man gjør, og det er en stor grad av interaksjon med andre. SIF8076 Planl/drift av IT-syst Foiler fra vårsemesteret 2001

10 SIF8076 Planlegging og drift av IT-systemer
:52 Egenskaper I Fokus på både detalj og helhet Balansere små ressurser Balansere mange oppgaver samtidig Håndtere de lange rytmene Kunne angrepe problemer systematisk Kunne samarbeide med andre Hvis vi skal sammenfatte den viktigste egenskapen til en dyktig sysadm, så er det kanskje ”bakkekontakt” og ”balanse”. Det er viktig at man kan balansere mellom detaljene og helheten, at man kan balansere mellom ressurser og oppgaver. Det er nesten gitt at det alltid vil være flere oppgaver enn man er i stand til å løse, og nettopp derfor er det viktig at man kan prioritere, og skille mellom det som er viktig og det som er uvesentlig. Videre, man må klare å balansere mellom oppgaver som haster og oppgaver som ikke brenner, men som vil komme til å gjøre det; eksempelvis periodisk vedlikehold. Dersom alle ressurser blir satt inn på å slukke de buskbrannene som er, så har man ikke gjort noe for å hindre at nye oppstår, og man kommer på etterskudd. En annen viktig egenskap er evnen til å systematikk i ting. I stedet for å rette samme feilen mange ganger, bør en dyktig sysadm at problemet heller burde løses en gang for alle på et høyere nivå. Generelt er også samarbeid viktig. Når en maskinpark blir moderat stor er det ikke lengre mulig for én person å drive det hele, og når man da blir flere om jobben er det essensielt at man klarer å samarbeide om jobben. SIF8076 Planl/drift av IT-syst Foiler fra vårsemesteret 2001

11 SIF8076 Planlegging og drift av IT-systemer
:52 Å følge oppskrift når den ikke virker Egenskaper II Kunne feilsøke Kunne få jobben gjort Takle at det skjer ”uforklarlige” ting Stadig lære seg nye verktøy Må ”grokke” teknologien Må kunne ”best practice” Forstå og respektere tradisjon Den viktigste ferdigheten en sysadm trenger er feilsøking – det vil si utfra symptomer å kunne lete og finne den egentlige årsaken til en feil. Altfor ofte retter man ikke feilene, men symptomene, eller man ignorerer feil som burde vært rettet. Tidvis skjer det uforklarlige ting, og systemansvarlig må være i stand til å akseptere det. Slikt er bare normale ting som man ikke har ressurser til å finne ut av. Fordi fagfeltet går så fort fremover, er det viktig at man er i stand til å lære seg nye verktøy. Slike verktøy er det man trenger for å behandle systemet. Merk at du trenger å lære å bruke verktøyet før du plutselig trenger det – da er det nemlig for sent. For å kunne håndtere teknologien må man forstå den. Å ”grokke” betyr å ha inngående innsikt i. Dersom du ikke har slik inngående innsikt i de systemene du skal drive, blir feilsøkingen og driften oftest til en frustrerende blindebukk-lek eller magiske ritualer. Det er nødvendig at man kjenner til ”best practice”, selv om man ikke følger det. Det er stor forskjell på å velge en dårlig løsning fordi man ikke vet bedre, og å velge samme løsning som en kalkulert risiko. Kunnskap om tradisjon er viktig, så du kan forstå bakgrunnen til valg som andre har tatt før deg. Med mindre du har tenkt til å gjøre alle ting selv, så trenger du å bygge på det andre har gjort (og andre må bygge på det du gjør), og da trenger du å vite hva som er normalt. SIF8076 Planl/drift av IT-syst Foiler fra vårsemesteret 2001

12 SIF8076 Planlegging og drift av IT-systemer
:52 Egenskaper III Kunne lytte og informere Kunne takle fullt kaos Tåle å få dårlig tilbakemelding Kunne håndtere tidspress Respektere brukerne Kunne leve i en ikke-perfekt verden Kommunikasjon med andre er viktig. Husk at kommunikasjon har flere aspekter enn det man vanligvis tenker på. Det er kommunikasjon når du skriver dokumentasjon som andre kanskje skal bruke neste år, og når du leser dokumentasjon andre har skrevet. SIF8076 Planl/drift av IT-syst Foiler fra vårsemesteret 2001

13 SIF8076 Planl/drift av IT-syst
Egenskaper IV Kunne lære og kunne utføre Kunne lære av andre Kunne improvisere Alltid tenke litt på sikkerhet ”God nok” fremfor perfekt Kunne finne ad-hoc-løsninger Kunne eliminere ad-hoc-løsninger SIF8076 Planl/drift av IT-syst

14 Planlegging og drift av IT-tjenester
Del II Logging SIF8076 Planl/drift av IT-syst

15 SIF8076 Planlegging og drift av IT-systemer
Ikke for å snoke! :52 Hvorfor logger vi? Ønsker å fakturere Planlegge utfasing av utstyr Monitorere ytelsen Detektere feil og abnormaliteter Post Mortem-analyse Dokumentere hva som har skjedd SIF8076 Planl/drift av IT-syst Foiler fra vårsemesteret 2001

16 Fakturering av forbruk
Alt er dyrere når det faktureres Påstand: (udokumentert) 90% av telefonkostnadene er fakturering SIF8076 Planl/drift av IT-syst

17 Regel nr 1 Logging for fakturering
Kvaliteten på logging må være høyere dersom loggen skal bruke eksternt til fakturering enn dersom loggen kun skal brukes internt til monitorering. Dette koster igjen mer enn ”vanlig” logging. SIF8076 Planl/drift av IT-syst

18 Logger og Datatilsynet
Logger kan ha personopplysninger Beskytt sensitive logger Trenger konsesjon for personoppl. Taushetsplikt Hvor lenge lagrer du loggene? NB: logger kan ligge på backup! SIF8076 Planl/drift av IT-syst

19 Regel nr 2 Logger og oppsporing
Dersom du bruker logger til å spore opp hvem som har gjort et eller annet ved for eksempel innbrudd, så vær oppmerksom på at logger kan være endret på eller de kan være gale i utgangspunktet. Skaff deg krysspeilinger for å bli sikker. SIF8076 Planl/drift av IT-syst

20 Logger og tilstandsdata
Logger inneholder historisk informasjon Tilstandsdata forteller om nåsituasjonen Eks: lastcomm kontra ps Tilstandsdata er mindre problematisk Logger kan anonymiseres Persondata: data som kan knyttes til personer (dvs f.eks. til brukernavn) SIF8076 Planl/drift av IT-syst

21 SIF8076 Planl/drift av IT-syst
Regel nr 3 Korrekt tid Sørg for å ha rett klokke på alle maskinene dine, og pass på at tidssoner og vinter/sommertid er korrekt SIF8076 Planl/drift av IT-syst

22 Sentralisering av logger
Syslog kan sentralisere loggene Gir mer logistikk Enklere å søke i loggene Enklere å preprosessere loggene Lettere å oppdage feil SIF8076 Planl/drift av IT-syst

23 Regel nr 4 Read-only-logging
Dersom du er paranoid nok, bør du logge til et write-once-read-many-media (CD-ROM eller utskrift), eller til en maskin som ikke svarer omverden og som er fysisk godt sikret. SIF8076 Planl/drift av IT-syst

24 Regel nr 5 Big Brother ser deg
Bruk av logger for å gi tilbakemelding til de som gjør tvilsomme eller uønskede ting sender et veldig effektivt budskap, og reduserer slik aktivitet kraftig. SIF8076 Planl/drift av IT-syst

25 SIF8076 Planlegging og drift av IT-systemer
Del III Systemprivilegier SIF8076 Planl/drift av IT-syst

26 SIF8076 Planl/drift av IT-syst
Systemprivilegier Tilgang til spesielle ressurser Unix: ingenting stopper root Win: Administrator kan gi seg selv tilgang til alle ressurser VMS: har setprv-privilegium SIF8076 Planl/drift av IT-syst

27 Privilegier: Unix vs Windows
Enkelt og oversiktlig Enkelte får for mange privilegier ACL virker ikke ordentlig over nett Konfigurerbart Programvaren er problemet SIF8076 Planl/drift av IT-syst

28 SIF8076 Planl/drift av IT-syst
Principle 1 Privilege Restriction of unnecessary privilege protects a system from accidental and malicious damage, and infection by viruses, and prevents users from concealing their actions with false identities. It is desirable to restrict users’ privileges for the greater good of everyone on the network. SIF8076 Planl/drift av IT-syst

29 Ikke bruk systembrukere
Dårlig sporbarhet når flere har tilgang Farligere å glemme å logge ut Kult men ikke særlig klokt Generelt for felleskontoer Ikke lovlig iht NTNUs IT-reglement! Unix: dårlig granularitet Veldig synlig innbruddsmål SIF8076 Planl/drift av IT-syst

30 SIF8076 Planl/drift av IT-syst
Corollary 2 Privilege No one should use a privileged root/Administrator account as a user account. To do so is to place the system in jeopardy. SIF8076 Planl/drift av IT-syst

31 SIF8076 Planl/drift av IT-syst
Unix: Bruk sudo Lar deg konfigurere privilegier for hver enkelt bruker Gir sporbarhet Synlig hvem som bruker privilegier ”Ingen” har root Det er fiklete Må ikke kunne starte et skall SIF8076 Planl/drift av IT-syst

32 Regel nr 6 Systempassord
Skift passord med jevne mellomrom, du vil komme til å bli forbauset over hvor mange som etterpå kommer og spør om å få det nye passordet også. SIF8076 Planl/drift av IT-syst

33 SIF8076 Planl/drift av IT-syst
Hardware siste 12 år Floppy: 4 ganger større Nettverk: 10 ganger raskere Magnettape: 50 ganger større Minne: 100 ganger mer CPU: 200 ganger raskere Harddisk: 500 ganger mer Gir endrede forutsetning! SIF8076 Planl/drift av IT-syst

34 SIF8076 Planl/drift av IT-syst
Regel nr 7 Vær jordnær Når du arbeider med elektronikk, så skal du alltid sørge for å være tilstrekkelig jordet. Om du ikke har jordingsarmbånd, så hold i alle fall i chassis eller noe annet som reduserer risikoen. SIF8076 Planl/drift av IT-syst

35 SIF8076 Planl/drift av IT-syst
Del IV Uniformitet SIF8076 Planl/drift av IT-syst

36 SIF8076 Planl/drift av IT-syst
Principle 3 Uniformity A uniform configuration minimizes the number of differences and exceptions one has to take into account later. This applies to hardware and software alike. SIF8076 Planl/drift av IT-syst

37 SIF8076 Planl/drift av IT-syst
Uniformitet i praksis HW-revisjoner skifter stadig En ønsker å kjøpe det aller siste Billigere å kjøpe nytt Vanskelig å få tak i gammelt Bærbare er svært ”personlige” SIF8076 Planl/drift av IT-syst

38 SIF8076 Planl/drift av IT-syst
IDI og uniformitet Ca 800 PC-er (intel-plattform) Ca 400 kombinasjoner av hw Ca varianter av hver enkelt HW-komponent (SW-konfigurering kommer i tillegg) SIF8076 Planl/drift av IT-syst

39 Uniformitet for enhver pris?
Uniformitet er ikke noe primært mål! Viktigere med funksjonalitet Viktigere med stabilitet SIF8076 Planl/drift av IT-syst

40 Hvordan oppnå uniformitet
Variantbegrensning Bruk pisk på brukere Bruk gulrot på brukere Kapsle inn forskjeller La forskjeller være uavhengige (dvs la dem eksistere i ulike dimensjoner) SIF8076 Planl/drift av IT-syst

41 Regel 8 Uniformitet er sekundært
Uniformitet er bare et sekundært mål, fordi det hjelper oss å nå mer primære mål, så som stabilitet på systemet, rasjonell drift, at brukerne kan kjenne seg igjen fra maskin til maskin. Dersom uniformiteten blir et mål i seg selv, kan det lett gå ut over de egentlige målene. SIF8076 Planl/drift av IT-syst

42 Nyttig med variasjoner
Fase over mellom to versjoner Varierende brukerbehov Gir en slags fail-over-løsning Lisens- og HW-messig billigere Gir mer ”interessant” hverdag Fordrer et mer robust oppsett SIF8076 Planl/drift av IT-syst

43 Regel nr 9 Kjøp noen ekstra
Dersom du skal kjøpe mange maskiner, og det er viktig at de er like, så bør du kjøpe et par ekstra som du kan kanibalisere på etterhvert. Dette gjelder selv om du har garantiavtale. La brukerne av de ekstra maskinene være oppmerksom på det. SIF8076 Planl/drift av IT-syst

44 SIF8076 Planl/drift av IT-syst
Standardisering av SW Letter dokumentasjon, installasjon, brukerstøtte og kommunikasjon Nytteverdien begrenset til en organisasjon Kan være vanskelig å kombinere med ”dynamiske” organisasjoner SIF8076 Planl/drift av IT-syst

45 SIF8076 Planl/drift av IT-syst
Produktstandarder Fungerer best i tette, lukkede miljøer Best dersom du har én driftsorganisasjon Helst lite sofistikerte brukere Bør holde på et valg over en temmelig lang periode Krever lojalitet fra brukerne SIF8076 Planl/drift av IT-syst

46 SIF8076 Planl/drift av IT-syst
Formatstandarder Øker kompleksiteten Nødvendig i løst knyttede organisasjoner Dersom flere driftsorganisasjoner Dersom flere økonomiske enheter Dersom varierte brukere SIF8076 Planl/drift av IT-syst

47 Lisenser og uniformitet
Sitelisens er uniformitet Flytende lisenser er uproblematisk Nodelocked lisenser reduserer uniformiteten fordi de fordrer at spesialtilpassing for hver maskin. SIF8076 Planl/drift av IT-syst

48 SIF8075 Planl/drift av IT-syst
Del 5 Dokumentasjon av driftssystemer SIF8076 Planl/drift av IT-syst

49 SIF8076 Planl/drift av IT-syst
Tre driftsroller Systemoperatør. Håndterer daglige rutineoppgaver og utfører forhåndsdefinerte oppgaver. Systemadministrator. Håndterer feilsøking og -retting, og annet forefallende og løpende vedlikehold. Systemintegrator. Planlegger, utvikler og igangsetter nye driftssystemer og -rutiner. SIF8076 Planl/drift av IT-syst

50 Merknader til ”roller”
Det er mulig for én person og fylle flere roller. SIF8076 Planl/drift av IT-syst

51 SIF8076 Planl/drift av IT-syst
Kart og terreng Kart Terreng Dokumentasjon System SIF8076 Planl/drift av IT-syst

52 Regel nr 10 Når terrenget er galt
Når dokumentasjon og system (kart og terreng) ikke stemmer overens, så er det systemet som er feil, ikke dokumentasjonen. SIF8076 Planl/drift av IT-syst

53 Driftsstabens oppgaver
Systemoperatør. Skal holde seg innenfor det som allerede er forutsett og beskrevet i dokumentasjonen. Systemadministrator. Skal korrigere systemet når det avviker fra dokumentasjonen. Systemintegrator. Skal videreutvikle system og dokumentasjon i parallell. SIF8076 Planl/drift av IT-syst

54 De tre vanligste feilene
At man ikke har dokumentasjon At man har gammel dokumentasjon At man for mye dokumentasjon SIF8076 Planl/drift av IT-syst

55 SIF8076 Planl/drift av IT-syst
Kjettersk utsagn: Systemdokumentasjonen og systemet er tilsammen alt du trenger; fordi den første forklarer alle sammenhenger og den siste definerer alle tilstander entydig. SIF8076 Planl/drift av IT-syst

56 SIF8076 Planl/drift av IT-syst
Problem med dette Systemdok’en er for omfattende Systemet er ikke intuitivt å finne frem i. Systemdok’en er for generell Systemet er for spesifikt Gir ingen historikk Gir ikke rom for planlegging SIF8076 Planl/drift av IT-syst

57 SIF8076 Planl/drift av IT-syst
Løsningen: lokaldok Skal være kortfattet men relevant Peke på viktige deler i systemet Peke på relevante deler i dok’en Skal fortelle om intensjonene Skal formidle strategiene Skal angi historikken SIF8076 Planl/drift av IT-syst

58 SIF8076 Planl/drift av IT-syst
Regler for lokaldok Ikke gjenta det som står i systemdok’en Referer indirekte der det er mulig Lime sammen system og sys.dok Fortell endel om hvorfor Formidle rammene rundt systemet SIF8076 Planl/drift av IT-syst

59 SIF8076 Planl/drift av IT-syst
Varianter av lokaldok Konfigurasjonsbeskrivelse Strategier og planer Oversikt over konfigurasjon og organisering Rutiner og prosedyrer Problem- og erfaringsdatabase Logger Endringsbeskrivelser SIF8076 Planl/drift av IT-syst

60 Konfigurasjonsbeskrivelse
Knutepunkt for dok om et subsystem Startpunkt for pekere og løse tråder Skal ikke være selvstendig Være tilstrekkelig til at en ny sysadm kan overta driften om nødvendig Oppdateres etter formell prosedyre Oppdateringsfrekvens 2-6 mnd. SIF8076 Planl/drift av IT-syst

61 SIF8076 Planl/drift av IT-syst
Konf.besk. – eksempel Oversikt Dokumentasjon Strategi Konfigurasjon Ansvarsforhold Systemoversikt Installasjons- prosedyre Sikkerhetskopiering Katastrofeplan Alternativ driftsplan Testprosedyrer Operasjonsrutiner Merknader Identifikasjon SIF8076 Planl/drift av IT-syst

62 SIF8076 Planl/drift av IT-syst
Strategier og planer Oppgave/problemstilling Situasjonsvurdering Økonomiske vurderinger Tiltak med tidsplaner Retningslinjer Ansvarsforhold SIF8076 Planl/drift av IT-syst

63 SIF8076 Planl/drift av IT-syst
Systemoversikt Gi detaljer om systemkonfigurasjon Kan være delvis autogenerert Kortfattet men spesifikk ”Kart” i krisesituasjoner Oppdateres ved behov uten formell prosesdyre SIF8076 Planl/drift av IT-syst

64 SIF8076 Planl/drift av IT-syst
Rutiner Forutsigbare operasjoner Skal utføres likt hver gang Tilrettelegges for systemoperatører av systemintegratorer Andre må kunne vikariere Skal være komplette Må inneholde testing SIF8076 Planl/drift av IT-syst

65 Rutiner (SOP) – eksempel
Oversikt Hensikt og ansvar Kompleksitet Antatt nedetid Tilbakerullingsplan Merknader Dokumenasjon Trinnvis prosedyre Testplan Identifikasjon SIF8076 Planl/drift av IT-syst

66 SIF8076 Planl/drift av IT-syst
Problemdatabase Angir utestående problemer Løsninger på tidligere problemer Grunnlag for evaluering av org Kontaktpunkt mellom drift og brukere ”Anonymisering” av oppgaver SIF8076 Planl/drift av IT-syst

67 SIF8076 Planl/drift av IT-syst
Probl.db – eksempel Bruker som feilmeldte Symtomer Kategorisering Eierskap i drift Jobbtilstand Løpende status Viktighet Skissering av løsning Alle transaksjoner og vurderinger Intern prioritering Søkemulighet ETA (hvis relevant) Kontaktinformasjon Tidsstempler SIF8076 Planl/drift av IT-syst

68 SIF8076 Planl/drift av IT-syst
Logger Hva er blitt gjort Hvorfor er det gjort Hvem har gjort det Når har det skjedd Hvordan rulle endringene tilbake Krever arbeidsdisiplin SIF8076 Planl/drift av IT-syst

69 SIF8076 Planl/drift av IT-syst
Logger – eksempler RCS eller CVS-logger ”readme”-filer (dvs Changelog) E-post-liste Konferansesystem Endringsbeskrivelser SIF8076 Planl/drift av IT-syst

70 Endringsbeskrivelser
Beskrive et behov Beskrive en løsning Planlegger selve endringen Varsle om endringer Grunnlag for ”peer review” Blir et historisk dokument SIF8076 Planl/drift av IT-syst

71 Endringsbesk – eksempel
Oversikt/ident. Problembeskrivelse Løsningsbeskrivelse Endringens omfang Ansvarsforhold Kompleksitet Nullalternativet Estimert nedetid Prioritet Mulige bieffekter Tilbakefallsplan Merknader Dokumentasjon Prosedyre Testplan (Intern arbeidsplan) SIF8076 Planl/drift av IT-syst

72 SIF8076 Planl/drift av IT-syst
Endringsbekrivelse Hensikten med en endringsbeskrivelse er tredelt: de som skal gjøre tilstrekkelig forarbeid ved å utarbeide en plan; omgivelsene skal kunne vurdere og respondere i forkant av endringen; og i ettertid skal man ha oversikt over hva som har skjedd. SIF8076 Planl/drift av IT-syst

73 Prosedyre for endringbeskr.
Utarbeide forslag til plan Teste på et alfa-system Bearbeide planen Peer-review av plan og eventuell formell behandling Opplæring og andre forberedelser Igangsetting av planen SIF8076 Planl/drift av IT-syst

74 SIF8076 Planl/drift av IT-syst
Intern arbeidsplan Oversikt Beskrivelse Ansvarlig Tidsrammer Skrittvis plan Testpunkter underveis Merknader SIF8076 Planl/drift av IT-syst

75 SIF8076 Planl/drift av IT-syst
Hvor mye dok er nok? Avhenger av systemets størrelse (personer, maskiner, applikasjoner) Avhenger av kompetansen til de driftsansvarlige Avhenger av tilgjengelige ressurser Avhenger av ambisjoner om oppetid og driftssikkerhet SIF8076 Planl/drift av IT-syst

76 SIF8076 Planl/drift av IT-syst
Del VI Arbeidsdeling SIF8076 Planl/drift av IT-syst

77 SIF8076 Planl/drift av IT-syst
Tre forsvarslinjer 1. linje. Brukerstøtte, FAQ, enkel feilsøking, rutiner, enkel adm. 2. linje. Feilsøking og feilretting, tyngre administrasjon. 3. linje. Konfigurering, design av systemer, feilsøking på dypt nivå. SIF8076 Planl/drift av IT-syst

78 SIF8076 Planl/drift av IT-syst
Tredeling - hvorfor Konsentrere og reservere høy kompetanse til vanskelige jobber. Fungerer som lokal ’karrierevei’. Gir organisatorisk sporbarhet (hvem gjør hva). Gir ’single point of entry’ for feilmeldinger. SIF8076 Planl/drift av IT-syst

79 SIF8076 Planl/drift av IT-syst
Eksempler Skifte passord (1) Restore sletta filer (1) Manglende toner (1) Ingen utskrift (1+2) Nettet er tregt (1+2+3) Installere ISDN på bærbar (2) Nytt backupsystem (3) SIF8076 Planl/drift av IT-syst

80 SIF8076 Planl/drift av IT-syst
Dokumentasjon 1.linje (systemoperatører) utfører dokumenterte rutiner 2.linje (systemadministratorer) feilsøker og feilretter basert på dokumentasjonen 3.linje (systemintegratorer) produserer dokumentasjonen SIF8076 Planl/drift av IT-syst

81 SIF8076 Planl/drift av IT-syst
Single point of entry Alle henvendelser og feilmeldinger bør gå gjennom et felles inngangspunkt, slik t brukerne genererer oppgaver til 1.linje. Deretter skal 1.linje (om nødvendig) sende dem videre til 2.linje som igjen (om nødvendig) sender dem videre til 3.linje. SIF8076 Planl/drift av IT-syst

82 SIF8076 Planl/drift av IT-syst
Single entry – hvorfor Beholde kontroll over tempoet Gjøre det enklere for brukerne Prioritering mellom oppgaver Oversikt over hva som er utestående La avbrytelser bare ’ødelegge’ i en enkelt del av organisasjonen SIF8076 Planl/drift av IT-syst

83 SIF8076 Planl/drift av IT-syst
Roller De tre linjene er roller Personer vil typisk ha litt av alle roller Nødvendig for alle i staben å se saken fra ’den andre siden’ SIF8076 Planl/drift av IT-syst

84 SIF8076 Planl/drift av IT-syst
Probl.db - statistikk Svartid ved henvendelse Tid til ferdig analysert Tid til ferdig løst Totalt antall jobber over tid Treffsikkerhet på ETA Identifisere ’virring’ før løsning SIF8076 Planl/drift av IT-syst

85 SIF8076 Planl/drift av IT-syst
Statistikk - hvorfor Måltall for balansering av belastning Argumenter ifm budsjettering Identifisere hot-spots som kan automatiseres Erfaringsdata for ressursplanlegging SIF8076 Planl/drift av IT-syst

86 SIF8076 Planl/drift av IT-syst
Antallet linjer Det er ingenting magisk med tre nivåer, og det kunne godt være flere, men helst ikke færre. Det må tilpasses den enkelte organisasjon. SIF8076 Planl/drift av IT-syst

87 SIF8076 Planl/drift av IT-syst
Del VII Nettverk SIF8076 Planl/drift av IT-syst

88 SIF8076 Planl/drift av IT-syst
Historikk Gamle stormaskiner, brukerne oppsøkte maskinene Minimaskiner, terminalbruk PC-er, plassert hos brukeren Nettverkssystemer, maskinen ’oppsøker’ brukerne SIF8076 Planl/drift av IT-syst

89 Principle 4 Communities
What one member of a cooperative community does affects every other member, and vice versa. Each member of the community therefore has a responsibility to consider the well-being of the other members of the community. SIF8076 Planl/drift av IT-syst

90 Principle 5 Multi-user communities
A multi-user computer system does not belong to any one user. All users must share the resources of the system. What one user does affects all other users, and vice versa. Each user has a responsibility to consider the effect of his/her actions on all the other users. SIF8076 Planl/drift av IT-syst

91 Principle 6 Network communities
A computer which is plugged into the network is no longer just ours. It is part of a society of machines which shares resources and communicates with the whole. What that machine does affects other machines. What other machines do affects that machine. SIF8076 Planl/drift av IT-syst

92 Principle 7 Delegation I
Leave experts to do their jobs. Assigning responsibility for a task to a body which specializes in that task is an efficient use of resources. SIF8076 Planl/drift av IT-syst

93 Tjener eller peer-to-peer
Peer-to-peer: Maskinene er autonome enheter som deler hverandres ressurser. Eks: Win workgroups, Mac Tjener: Sentrale deler av systemet er samlet på dedikerte maskiner. Eks NT og Novell SIF8076 Planl/drift av IT-syst

94 Fordeler med peer-to-peer
Enkelt å komme igang med Skalerer bra initielt Autonomt, trenger ikke felles organisering Basert på naturlige ’power users’ Adm kostnader er innbakt SIF8076 Planl/drift av IT-syst

95 Fordeler med sentrale tjenere
Styrbart (gjennom f.eks strategier) Klare ansvarsforhold Adm overhead blir synlig Gjenbruk og deling av ressurser Variantbegrensning Tillater arbeidsdeling/spisskompetanse Utnyttbart økonomisk SIF8076 Planl/drift av IT-syst

96 Principle 8 Adaptability
Optimal structure and performance are usually found only with experience of changing local needs. The need for system recision will always come. Make network solutions which are adaptable. SIF8076 Planl/drift av IT-syst

97 Principle 9 One name for one object I
Each unique resource should have a unique name which labels it and describes its function. SIF8076 Planl/drift av IT-syst

98 SIF8076 Planl/drift av IT-syst
Corollary 10 Aliases Sometimes it is adavantageous to use aliases or pointers to unique objects so that a generic name can point to a spesific resource. SIF8076 Planl/drift av IT-syst

99 SIF8076 Planl/drift av IT-syst
Fordeler med aliases Indireksjon Lettere å flytte tjenester Kortere og enklere navn Kan ivareta historiske ordninger Kan gi beskrivende og funksjonelle navn Som ad hoc-løsninger SIF8076 Planl/drift av IT-syst

100 SIF8076 Planl/drift av IT-syst
OSI-modellen Physical layer Data link layer Network layer Transport layer Session layer Presentation layer Application layer SIF8076 Planl/drift av IT-syst

101 Etterforskning av gamle nett
Kabelsniffer Pakkesniffer Følg kablene i veggen Bruk SNMP Bruk ping Snakk med veteraner Tegne opp et diagram! SIF8076 Planl/drift av IT-syst

102 Planlegging av systemer
Hva er planlagt bruk Hvilke avveininger må vi ta hensyn til Hva har vi av eksisterende systemer Hva trenger vi av nye systemer Hva har vi av ’penger’ Hvordan kommer vi i mål SIF8076 Planl/drift av IT-syst

103 SIF8076 Planl/drift av IT-syst
Momenter mht bruk Applikasjoner Levetid Ytelse Lokalisering Brukere Oppetid Utvidelser Sikkerhet Stabilitet Tjenester Driftskostnader SIF8076 Planl/drift av IT-syst

104 Avveining 1: En eller mange tjenere
Skal du samle alle de tjenestene du skal tilby på en felles, stor, dyr maskin; eller skal du spre dem ut mellom flere, mindre, billigere maskiner? SIF8076 Planl/drift av IT-syst

105 Avveining 2: Tykke eller tynne klienter
Skal du la klientmaskinene være ’skikkelige’ maskiner som fungerer selvstendig og mer eller mindre isolert; eller skal du gjøre dem tynnest mulige og konsentere innsatsen mot noen få tjenermaskiner? SIF8076 Planl/drift av IT-syst

106 Avveining 3: Hvor skal pengene brukes
Skal du bruke pengene på å oppgradere klientmaskinene lokalt med f.eks cacheminne; eller skal du samle mest mulig at slike ressurser på tjenerne, der de kan deles og komme alle til gode? SIF8076 Planl/drift av IT-syst

107 Avveining 4: Oppetid eller ytelse?
Skal du satse på dyr, men maksimal opptid og stabilitet på systemet ditt; eller skal du heller bruke pengene på flere og bredere tjenester og så reparere problemene ad hoc? SIF8076 Planl/drift av IT-syst

108 Avveining 5: Speiling eller sentralisering
Skal du speile ut kopier av systemdata som ikke endrer seg, og dermed få et ekstra vedlikeholdsansvar; eller skal du heller investere i mer og kraftigere nettverk? SIF8076 Planl/drift av IT-syst

109 Avveining 6: Enkle eller utvidbare navn
Når du skal navngi ressursene dine, skal du satse på et kort, enkelt og pragmatisk navnesystem; eller skal du satse på en navngiving som tillater deg å skalere betraktlig opp i fremtiden? SIF8076 Planl/drift av IT-syst

110 Principle 11 Inter-dependency
Avoid making one service reliant on another. The more independent a service is, the more efficient it will be, and the fewer possibilities there will be for its failure. SIF8076 Planl/drift av IT-syst

111 SIF8076 Planl/drift av IT-syst
Avhengigheter Bør fjernes permanent (ikke bare fikses) Test om det er avhengigheter Planlegg evt avhengigheter Lag en avhengighetsgraf Avhengighet kan være til personer! SIF8076 Planl/drift av IT-syst

112 Fire selvstendige dimensjoner
Konti, brukerdata, hjemmekataloger Operativsystem og konfigurering Hardware Applikasjoner SIF8076 Planl/drift av IT-syst

113 Suggestion 1 File servers with common data
Place all file servers which serve the same data on a common host, e.g. WWW, FTP and NFS serving user files. Place them on the host which physically has the disks attached. This will save an unnecessary doubling of netwirk traffic and will speed up services. A fast host with a lot of memory and perhaps several CPUs should be used for this. SIF8076 Planl/drift av IT-syst

114 SIF8076 Planl/drift av IT-syst
Del VII Casestudie: Backup SIF8076 Planl/drift av IT-syst

115 Situasjonsbeskrivelse
Brevjournalen var korrupt Kjører på SQL-server Backup fra de to siste dagene korrupt Lignende har skjedd to ganger tidligere Måtte rekonstruere for to dager Journalen skulle vært faset ut 0,01% av systemet har 50% av feilene SIF8076 Planl/drift av IT-syst

116 SIF8076 Planl/drift av IT-syst
Eksisterende system Bruker Database Backup1 Backup2 Alarm! SIF8076 Planl/drift av IT-syst

117 SIF8076 Planl/drift av IT-syst
Problemfaktor 1 Backupen er drevet rent reaktivt – det vil si at man korrigerer og justerter etter feil; men man er uten kvalitetskontroll før situasjonen har nådd en kritisk grense. Ingen brannøvelser. SIF8076 Planl/drift av IT-syst

118 SIF8076 Planl/drift av IT-syst
Problemfaktor 2 Implementering og igangsetting av databasen skjedde uten hensyn til innspill fra drift, innen områder som teknologivalg og driftskostnader. Databasen var ’gratis’. SIF8076 Planl/drift av IT-syst

119 SIF8076 Planl/drift av IT-syst
Problemfaktor 3 Databasen måtte kjøre på et mer eller mindre selvstendig system – dels for å isolere dens egen ustabilitet, og dels fordi den forutsatte andre enn standard teknologivalg. SIF8076 Planl/drift av IT-syst

120 SIF8076 Planl/drift av IT-syst
Problemfaktor 4 Kvaliteten på backup av databasen fikk lov til å bli redusert uten at det ble oppdaget og korrigert (hvis bare databasen selv fungerte). SIF8076 Planl/drift av IT-syst

121 SIF8076 Planl/drift av IT-syst
Problemstilling 5 Ingen merket feilmeldingene fra den nattlige backupkjøringen i vrimmelen av andre daglige meldinger. SIF8076 Planl/drift av IT-syst

122 SIF8076 Planl/drift av IT-syst
Mulig løsning 1 Introduser avhengighet! La databasen være avhengig av backup, slik at defekter i backup umiddelbart blir synlige. SIF8076 Planl/drift av IT-syst

123 SIF8076 Planl/drift av IT-syst
Løsning 1a – diagram Trinn 2 bytte Bruker Database Backup Trinn 1 kopiering SIF8076 Planl/drift av IT-syst

124 SIF8076 Planl/drift av IT-syst
Løsning 1a - momenter Tvinger evt backup til å være konsistent (ellers vil brukerne klage) Men: detekterer ikke hvorvidt backup faktisk er tatt SIF8076 Planl/drift av IT-syst

125 SIF8076 Planl/drift av IT-syst
Løsning 1b – diagram Trinn 2 bytte Bruker Database Backup Trinn 1 kopiering Alarm2 Alarm1 SIF8076 Planl/drift av IT-syst

126 SIF8076 Planl/drift av IT-syst
Løsning 1b – momenter Som løsning 1a, samt ... En alarm detekterer om backup ikke tas – og varsler brukerne For å sikre seg mot at alarmen slutter å virke, kan man legge til enda en alarm som sjekker den første. Men: kan ikke sikre seg at ikke alle alarmene slutter å virke på en gang SIF8076 Planl/drift av IT-syst

127 SIF8076 Planl/drift av IT-syst
Løsning 1c – di agram Trinn 2 bytte Bruker Database Backup Trinn 1 kopiering Alarm2 Alarm1 SIF8076 Planl/drift av IT-syst

128 SIF8076 Planl/drift av IT-syst
Løsning 1c – momenter Som løsning 1b, samt ... Alarmene er uavhengige av hverandre (helst på to ulike OS) Alarmene er symmetriske (dvs at de vokter på hverandre) Alarmene går til noen som vil reagere, dvs brukerne SIF8076 Planl/drift av IT-syst

129 Fire strategier for feilretting
Korrigere før feilen oppstår Automatisk korrigere idet feilen oppstår Manuell korrigering når de første symptomene melder seg Opprydding når problemet er blitt merkbart SIF8076 Planl/drift av IT-syst

130 SIF8076 Planl/drift av IT-syst
Kostnader 4 Nede tid 3 2 1 Utgifter SIF8076 Planl/drift av IT-syst

131 SIF8076 Planl/drift av IT-syst
Akkumulative feil En kritisk feilsituasjon har sjelden bare ett enkelt problem som årsak. Dersom problemer korrigeres ASAP, kan man hindre at de blir delårsaker i komplekse feilsituasjoner. SIF8076 Planl/drift av IT-syst

132 SIF8076 Planl/drift av IT-syst
Del IX Konfigurering av maskiner SIF8076 Planl/drift av IT-syst

133 Det går fort i databransjen
”Today, disk is so cheap that it is not uncommon for even personal workstations to have several GB of local storage” SIF8076 Planl/drift av IT-syst

134 SIF8076 Planl/drift av IT-syst
Maskinprofil Anslått bruk Avhenger av hardware Avhenger av tilknytning til datanett Organisatorisk avhengig Økonomiske følger Historikk i driftsorganisasjonen SIF8076 Planl/drift av IT-syst

135 SIF8076 Planl/drift av IT-syst
Fire hovedprofiler Selvstendig maskin PC sammenknyttet med nettjenester PC avhengig av nettjenester Tynn klient Supertynn klient SIF8076 Planl/drift av IT-syst

136 SIF8076 Planl/drift av IT-syst
1. Selvstendig PC Alle nødvendige data er lokale, men kan bruke nettjenester i den grad de er oppe. Kan klare seg uten nett. Bruksområde: tjenere, hjemme-PC, spesialsystemer, testsystemer, bærbare. SIF8076 Planl/drift av IT-syst

137 SIF8076 Planl/drift av IT-syst
2. PC med nettjenester Alle systemfiler og de fleste applikasjonene er lagret lokalt, men er typisk konfigurert til å hente brukerdata, tjenester etc fra nett Bruksområder: kontor-PC, hjemme-PC med nett, regneressurser og ’robuste’ sal-PC’er. SIF8076 Planl/drift av IT-syst

138 SIF8076 Planl/drift av IT-syst
3. Nettbasert PC Lokalt ligger det kun data for å boot’e maskinen, samt temporære filer, de fleste maskinspesifikke filer og svært ofte brukte filer. Bruksområde: sal-PC, kontor-PC, regneressurser, PC som tynn klient. SIF8076 Planl/drift av IT-syst

139 4. (Super)tynne klienter
Maskinen har lite persistent minne, og det brukes hovedsaklig som BIOS for bootstrapping, evt som basalt operativsystem. Bruksområde: sal-PC og kontor-PC der man har klart definerte behov. SIF8076 Planl/drift av IT-syst

140 Valg av hardware – momenter
Egnethet for bruk Variantbegrensning Standardkomponenter HMS-krav Merkantile krav Organisatorisk strategi SIF8076 Planl/drift av IT-syst

141 SIF8076 Planl/drift av IT-syst
Variantbegrensning Begrenser fokus (og kostnader) for drift Helst 1-3 modeller til enhver tid Aktualitet for modell min 3-4 mnd Helst max 20 modeller over levetid Må dekke både høy- og lav-ende Styrt overfasing til nye modeller SIF8076 Planl/drift av IT-syst

142 SIF8076 Planl/drift av IT-syst
Standardkomponenter Må ha std grensesnitt (kontakter) Ombytting, gjenbruk, oppdatering Drivere og spesifikasjon tilgjengelig Gir pris- og kvalitetskontroll SIF8076 Planl/drift av IT-syst

143 SIF8076 Planl/drift av IT-syst
HMS-krav Støy (vifter og harddisk). Variabel? Stråling, spesielt skjerm Ergonomi Okkupert bordplass Brannfare Kabling SIF8076 Planl/drift av IT-syst

144 SIF8076 Planl/drift av IT-syst
Merkantile krav Pris/ytelse Garanti, service og reservedeler Levering, dagbøter, logistikk, emballasje Kontakt med salgsledd Tilgang til duplikate system Avtaler SIF8076 Planl/drift av IT-syst

145 Former for lokale data Persistente data Semiperm. data Temporære data
Maskin- spesifikke Privat kryptonøkkel Logger Swapspace System- spesifikke OS-programvare Kjerne Organisa-toriske data KA-maler motd Personlige data E-post Mellomlagra filer /tmp-filer Globale data Distribuert lager FTP-område Parallell-prossesering SIF8076 Planl/drift av IT-syst

146 Lagring lokalt/sentralt
Lokal lagring. Dataene ligger kun på lokal disk, hver maskin sin original. Lokal speiling. Originalen ligger ett felles sted, men blir kopiert ned systematisk (f.eks hver natt). Fjernbruk. Dataene brukes etter behov fra et sentralt lager. SIF8076 Planl/drift av IT-syst

147 Fordeling av diskplass
Operativsystem Swapping-område Semitemporære systemdata (logger) Applikasjoner Brukerdata (permanent/tmp) Informasjonsdatabaser Eksporterte data SIF8076 Planl/drift av IT-syst

148 SIF8076 Planl/drift av IT-syst
Operativsystem Generert fra originalversjon Kan oppdateres automatisk Bør sette av plass til neste versjon Trenger ikke å ta backup Bør ligge lokalt SIF8076 Planl/drift av IT-syst

149 SIF8076 Planl/drift av IT-syst
Swapping-område Bedre med for mye enn for lite Tommelfingerregel 2-3 ganger RAM Rent temporært Aldri backup Alltid lokalt dersom mulig SIF8076 Planl/drift av IT-syst

150 Semitemporære systemdata
Logger og andre genererte data Bør tas backup av hvis logger Sett av godt med plass! Separeres fra andre data SIF8076 Planl/drift av IT-syst

151 SIF8076 Planl/drift av IT-syst
Lokale brukerdata Bør være kun for temporære data Bruker bør være oppmerksom på hvorvidt det tas backup Bør ikke blandes med systemdata SIF8076 Planl/drift av IT-syst

152 Netteksporterte data fra klient
Distribuert lagersystem Bør kunne kutte ut backup Kan aldri stole på at det er oppe Salderingspost for diskplass SIF8076 Planl/drift av IT-syst

153 SIF8076 Planl/drift av IT-syst
Informasjonsbaser Databaser og konfigurasjonsfiler Bør autogenereres fra master, eller ... ... ha backup hvis systemgenerert Bør ligge separat fra operativsystem SIF8076 Planl/drift av IT-syst

154 Principle 12 Separation I
Data which are separate from the operating system should be kept in a separate directory tree, preferably on a separte disk partition. If they are mixed with the operating system file-tree it makes re-installation or upgrade of the operating system unnescessarily difficult. SIF8076 Planl/drift av IT-syst

155 Principle 13 Separation II
Data which are logically separate belong in separate directory trees, perhaps on separate diskpartitions. SIF8076 Planl/drift av IT-syst

156 Forskjell tjener/klient
RCS av konfigfiler Generell backup Spesielle tjenester Redundans Fallback-mekanisme Feilsøking Overvåking Regenerering Reinstallering Slå dem helst av Kjøp nytt, reinstaller Reinstaller 1.trinn: reinstaller Overvåking SIF8076 Planl/drift av IT-syst

157 Principle 14 Separation III
Independent systems should not interfere with one another, or be confused with one another. Keep them in separate storage areas. SIF8076 Planl/drift av IT-syst

158 SIF8076 Planl/drift av IT-syst
Suggestion 3 Vigilance Be on the lookout for software which is configured, by default, to install itself on top of the operating system. Always check the destination using make –n install before actually committing to an installation. Programs which are replacements for standard operating system components often break the principle of separtion. SIF8076 Planl/drift av IT-syst

159 Principle 15 Limited privilege
No process of file should be igiven more privileges than it needs to do its job. To do so is a security hazard. SIF8076 Planl/drift av IT-syst

160 Principle 16 Temporary files
Temporary files or sockets which are opened by any program should not be placed in any publicly writable directory like /tmp. This opens for the possibility of race conditions and symbolic link attacks. If possible, configure them to write to a private directory. SIF8076 Planl/drift av IT-syst

161 Principle 17 Flagging customization
Customizations and deviations from standards should be made conspicuous to users and administrators. This makes the system easier to understand for ourselves and our successors. SIF8076 Planl/drift av IT-syst

162 SIF8076 Planl/drift av IT-syst
Spesial-maskiner Utfører en tjeneste enkelt og effektivt Ofte lette å drive Fungerer ofte som en ’black box’ Avhengig av prod. for oppgradering Avhengig av prod. for sikkerhetspatcher Øker variasjonen SIF8076 Planl/drift av IT-syst

163 SIF8076 Planl/drift av IT-syst
Del X Konfigurering av maskiner II SIF8076 Planl/drift av IT-syst

164 Forskjell tjener/klient
RCS av konfigfiler Generell backup Spesielle tjenester Redundans Fallback-mekanisme Feilsøking Overvåking Regenerering Reinstallering Slå dem helst av Kjøp nytt, reinstaller Reinstaller 1.trinn: reinstaller Overvåking SIF8076 Planl/drift av IT-syst

165 SIF8076 Planl/drift av IT-syst
Fordeler med RCS (el.l) Inneholder historiske data Angir hvem som endret hva Angir eksakt hva som var endret Angir tidspunkt for endring Låsemekanisme for filene SIF8076 Planl/drift av IT-syst

166 Principle 14 Separation III
Independent systems should not interfere with one another, or be confused with one another. Keep them in separate storage areas. SIF8076 Planl/drift av IT-syst

167 SIF8076 Planl/drift av IT-syst
To vinklinger Slik driftsansvarlig ønsker å se tingene: systematisk og adskilt Slik brukerne (og programmene) ønsker å se tingene: Blandet sammen til ett felles system SIF8076 Planl/drift av IT-syst

168 SIF8076 Planl/drift av IT-syst
Suggestion 3 Vigilance Be on the lookout for software which is configured, by default, to install itself on top of the operating system. Always check the destination using make –n install before actually committing to an installation. Programs which are replacements for standard operating system components often break the principle of separtion. SIF8076 Planl/drift av IT-syst

169 Inst.skripts: problemer
Åpner på tilgang til filer Legger inn brokker i konfig.filer og i databaser Slår på demoner og innstillinger Gir privilegier til egne programmer (som ikke er sikkerhetsklarert) SIF8076 Planl/drift av IT-syst

170 Principle 15 Limited privilege
No process of file should be given more privileges than it needs to do its job. To do so is a security hazard. SIF8076 Planl/drift av IT-syst

171 Kostnader og sikkerhet
Tidsmessig avveining Krever høy kompetanse Sikkerhet er ren ”utgift” Trenger brukeren sikkerheten? SIF8076 Planl/drift av IT-syst

172 Principle 16 Temporary files
Temporary files or sockets which are opened by any program should not be placed in any publicly writable directory like /tmp. This opens for the possibility of race conditions and symbolic link attacks. If possible, configure them to write to a private directory. SIF8076 Planl/drift av IT-syst

173 Principle 17 Flagging customization
Customizations and deviations from standards should be made conspicuous to users and administrators. This makes the system easier to understand for ourselves and our successors. SIF8076 Planl/drift av IT-syst

174 SIF8076 Planl/drift av IT-syst
Spesial-maskiner Utfører en tjeneste enkelt og effektivt Ofte lette å drive Fungerer ofte som en ’black box’ Avhengig av prod. for oppgradering Avhengig av prod. for sikkerhetspatcher Øker variasjonen SIF8076 Planl/drift av IT-syst

175 SIF8076 Planl/drift av IT-syst
Del X Brukeradministrasjon SIF8076 Planl/drift av IT-syst

176 Brukeradm en egen dimensjon
Brukere OS og hardware Applikasjoner SIF8076 Planl/drift av IT-syst

177 SIF8076 Planl/drift av IT-syst
Brukerdimensjonen Uavhengig av tilgjengelige applikasjoner Uanhengig av hvilke maskiner som kjører hvilke OS og har hvilken HW Uavhengig av suborganisasjon Uavhengig av geografi SIF8076 Planl/drift av IT-syst

178 Principle 18 Distributed accounts
Users move around from host to host, share data and collaborate. They need easy access to data and workstatios all over an organization. SIF8076 Planl/drift av IT-syst

179 SIF8076 Planl/drift av IT-syst
Lokale adminbrukere Gir bruker privs på én maskin En viss sikkerhetsrisiko Tidvis eneste utvei ’Privilegier under ansvar’ Gjør dem oppmerksom på sitt ansvar ... (og få det skriftlig) SIF8076 Planl/drift av IT-syst

180 SIF8076 Planl/drift av IT-syst
Brukerdatabase Felles brukerkonto ’overalt’ Felles passord ’overalt’ Kobles til autorativ database Unngå upersonlige brukere Bør ikke inneholde klartekst-passord SIF8076 Planl/drift av IT-syst

181 SIF8076 Planl/drift av IT-syst
Suggestion 4 Passwords Give users a common username on all hosts, of no more than eight characters. Give them a common password on all hosts, [...] SIF8076 Planl/drift av IT-syst

182 SIF8076 Planl/drift av IT-syst
Valg av passord Ha en minimum lengde Krev noen spesialtegn Forby bruk av ordliste-ord La brukeren selv velge passord Bruk vanskelige førstepassord Let etter gjettbare passord Tving frem regelmessige passordskift SIF8076 Planl/drift av IT-syst

183 Bør brukeren velge passord?
Ja: Lettere huske, unødvendig å skrive ned, kan gjenbrukes på flere systemer. Nei: Gjenbrukes på usikre systemer, Kan velge dårlige passord, kan beholde samme passord lenge. SIF8076 Planl/drift av IT-syst

184 Principle 19 Environment
It should always be clear to users which host they are using and what operating system they are working with. [...] SIF8076 Planl/drift av IT-syst

185 SIF8076 Planl/drift av IT-syst
Oppstartsmiljø Enkelt, er bare et startpunkt Utbyggbart for brukeren Må dekke de flestes behov Koble tilbake ifm feilsøking/retting Bør ligge lokalt (må for sysadm) Være adskilt fra OS Adskill programoppsett fra brukere SIF8076 Planl/drift av IT-syst

186 Suggestion 5 Clear prompts
Try to give users a command prompt which includes the name of the host they are working on. [...] SIF8076 Planl/drift av IT-syst

187 Suggestion 6 Unix shell defaults
Avoid the host-wide files for shell setup in /etc. [...] Use an over-ridable include strategy in the user’s own shell setup to read in global defaults. [...] SIF8076 Planl/drift av IT-syst

188 SIF8076 Planl/drift av IT-syst
Typer av brukere Passive brukere. Godtar de de får. Aktive brukere. Bevisste om hva de vil ha. Eksperimenterer og konfigurerer. Finner feil og problemstillinger. Hjelpsomme brukere. Gir fornuftige feilmeldinger, og reparerer ting selv. SIF8076 Planl/drift av IT-syst

189 Suggestion 7 Problem users
Keep a separate partition for problem users’ home directories, so thay they only cause trouble for one another, not for the more considerate users. SIF8076 Planl/drift av IT-syst

190 Hjemmekatalogpartisjoner
Geografisk nær bruker Adskille etter brukerprofil Større adm overhead Mindre optimal diskutnyttelse SIF8076 Planl/drift av IT-syst

191 SIF8076 Planl/drift av IT-syst
Fjerning av filer Slette de største filene Slette de eldste (uleste) filene Slette de avledede filene Komprimere filene Flytte filene (se om noen klager) Kjøpe mer diskplass (dvs jukse ) SIF8076 Planl/drift av IT-syst

192 SIF8076 Planl/drift av IT-syst
Diskkvoter Hard-limits. Kan ikke bruke over denne grensen – får ikke laget nye filer. Soft-limits. Får bare advarsel når grensen overskrides. Peer pressure. Offentliggjør hvem som bruker hvor mye diskplass. La parisjonene begrense plassbruken. SIF8076 Planl/drift av IT-syst

193 SIF8076 Planl/drift av IT-syst
Sletting av brukere Ta backup Gi en ’grace period’ Sett metadata (f.eks uid) i karantene Ta vare på metadata Sett opp evt forward – tidsavgrenset SIF8076 Planl/drift av IT-syst

194 SIF8076 Planl/drift av IT-syst
Principle 20 Freedom Quotas, limits and restrictions tend to antagonize users. Users place a high value on personal freedom. Restrictions should be minimized. Workaround solutions which avoid rigid limits are preferable, if possible. SIF8076 Planl/drift av IT-syst

195 SIF8076 Planl/drift av IT-syst
Sysadm-ettikette Ikke se umotivert på personlige data Informer når du har ’snoket’ Anonymiser logger om mulig Ikke gi info videre uten god grunn Sky personkonflikter SIF8076 Planl/drift av IT-syst

196 SIF8076 Planl/drift av IT-syst
Disiplinærsaker Undersøk før du handler Før en logg over saken Ta kopi av data – frys situasjonen Informer brukeren La brukeren forklare seg Hvis i tvil, dytt saken opp/bortover Ikke rot med småsaker ... SIF8076 Planl/drift av IT-syst

197 Principle 21 Mind control
Computers have a perceived authority. We need to be ont he look-out for abuses of that authority, whether by accident or by design. SIF8076 Planl/drift av IT-syst

198 SIF8076 Planl/drift av IT-syst
Mistro datamaskinen Klokka kan være feil Meldingene kan være gamle Noen kan ha ’mekket’ på loggene Systemet kan ha selv-krasjet Noen kan ha misbrukt brukerid’en Noen kan ha blitt feilidentifisert SIF8076 Planl/drift av IT-syst

199 SIF8076 Planl/drift av IT-syst
Del XI Modeller for nettverksadministrasjon SIF8076 Planl/drift av IT-syst

200 SIF8076 Planl/drift av IT-syst
De fire veiene Reboot (brute force) Manuelt (hele folket i arbeid) Kontroll (Stasi-metoden) Immunologi (’selvreparasjon’) SIF8076 Planl/drift av IT-syst

201 SIF8076 Planl/drift av IT-syst
Reboot-metoden Dersom noe ikke virker, hopp over all feilsøking (for denslags har vi ikke tid til) og reinstaller i stedet maskinen. Test at det virker og friskmeld. SIF8076 Planl/drift av IT-syst

202 Reboot-metoden – fordeler
Enkelt, trenger lite kompetanse Rask å utføre, lav TTR SIF8076 Planl/drift av IT-syst

203 Reboot-metoden – ulemper
Lav grad av proaktivitet Skalerer dårlig (lineært) Håndterer klasse-feil dårlig Gir liten systeminnsikt Fungerer dårlig for tjenere SIF8076 Planl/drift av IT-syst

204 SIF8076 Planl/drift av IT-syst
Manuell drift Ansett ’tilstrekkelig’ med folk, la dem ta hver sin del av systemet (eller samarbeide om det). Gi dem nærmest full frihet, og la dem selv finne frem til sine egne arbeidsformer. SIF8076 Planl/drift av IT-syst

205 Manuell drift – fordeler
Ypperlig i små systemer Kan virke godt for subsystemer Stor frihet for den enkelte Kan fungere som ’nærdrift’ SIF8076 Planl/drift av IT-syst

206 Manuell drift – ulemper
Vanskelig å fase inn nye folk Åpner for personlige (u)vaner Lett for å ’partisjonere’ systemene Vanskelig å styre ovenfra Vanskelig å linjedele driften SIF8076 Planl/drift av IT-syst

207 SIF8076 Planl/drift av IT-syst
Kontrollmetoden Kjøp et verktøy for å drive maskinene. La verktøyet overvåke alt som skjer, og si ifra hva som må gjøres. Konfigurer systemet gjennom verktøyet, og la alle ansatte bruke det, og bare det. SIF8076 Planl/drift av IT-syst

208 Kontrollmetoden – fordeler
Enkelt å anskaffe (kan kjøpes) Gir et felles rammeverk Skalerer sublineært Kan linjedeles (operatør/sysadm) Enkelt å skaffe nye folk SIF8076 Planl/drift av IT-syst

209 Kontrollmetoden – ulemper
Ufleksibelt rammeverk Skjuler kompleksitet ’Information overflow’ Binder opp mot teknologivalg Begrenset/endelig funksjonalitet Fordrer at ’databasen’ ikke blir korrupt SIF8076 Planl/drift av IT-syst

210 SIF8076 Planl/drift av IT-syst
Immunologi Systemet skal settes opp inkrementelt av sysadm til å fikse problemer som måtte oppstå. Når et nytt problem oppstår, så fikses det generelt, og løsningen gjøres gjeldende for alle maskiner til all tid. Sysadm jobber bare med de ’nye’ problemene. SIF8076 Planl/drift av IT-syst

211 SIF8076 Planl/drift av IT-syst
Immunologi – fordeler Gjenbruk av løsninger Kort TTR Bare ’interessante’ jobber Sterk sublineær skalering Automatisert (uten manuell intervensjon) Rette feil ’en gang for alle’ SIF8076 Planl/drift av IT-syst

212 SIF8076 Planl/drift av IT-syst
Immunologi – ulemper Krever mye lokal konfigurering Skaper nye komplekse systemer Begrenser endringstakten Brute-force løsning på en del problemer (selv om den er automatisert) Vanskelig å fase inn nye folk Krever høy grad av kompetanse SIF8076 Planl/drift av IT-syst

213 SIF8076 Planl/drift av IT-syst
Løsningsforslag Hent elementer fra alle fire metoder Vektlegg endringshåndtering Vektlegg kommunikasjon Vektlegg dokumentasjon SIF8076 Planl/drift av IT-syst

214 SIF8076 Planl/drift av IT-syst
Del XII Installasjonssystemer SIF8076 Planl/drift av IT-syst

215 De fire driftsmetodene
Manuell detektering Manuell drift Reboot- metoden Kontroll- metoden Immunologi Automatisk detektering Manuelt fikset Automatisk fikset SIF8076 Planl/drift av IT-syst

216 SIF8076 Planl/drift av IT-syst
”Immunologi” Nokså ny metode Analogi med kroppen Desentralisert/lokalt fokus Inkrementelle forbedringer Konvergens mot ønsket tilstand Oppnå balanse på systemet SIF8076 Planl/drift av IT-syst

217 Immunologi: konvergens
Korrigering består av flere deloppgaver Hver deloppgave fikser litt Tilsammen konverger det SIF8076 Planl/drift av IT-syst

218 SIF8076 Planl/drift av IT-syst
Tilstandsmodell Mulige tilstander 4 6 3 Bootbare tilstander Ønskelige tilstander Kjørbare tilstander Fungerende tilstander 2 1 5 Obs: bare en Tilnærming! SIF8076 Planl/drift av IT-syst

219 SIF8076 Planl/drift av IT-syst
Tilstandsmodell II Datamaskiner er digitale Har et endelig antall ulike tilstander Også: N-dimensjonalt rom Persistent minne (overlever boot) Temporært minne (resettes ved boot) Relevant minne (det som betyr noe) SIF8076 Planl/drift av IT-syst

220 SIF8076 Planl/drift av IT-syst
Immunologi, eksempel For alle relevante problemer, definer en korrigerende aksjon på forhånd. Prosesser alle korrigerende aksjon som trengs å kjøres. Gjenta dette inntil en OK tilstand er nådd; dvs konvergering. Feiltil- stand 1 OK tilstander Kombina- sjonsfeil Feiltil- stand 2 SIF8076 Planl/drift av IT-syst

221 SIF8076 Planl/drift av IT-syst
Immunologi Dyrt å forberede/sette opp Umulig å bli ”ferdig” (alltid enda et problem som må håndteres) Bør operere på et stabilt/låst system (dvs unngå bevegelige mål) Kan løpe løpsk SIF8076 Planl/drift av IT-syst

222 Tilnærmelser til problemet
Automatisk fikse enkeltproblemer med lokal fokus Sentralstyrt uniformering Drift à la reguleringsteknikk Drift à la genetisk programmering SIF8076 Planl/drift av IT-syst

223 Inst- og driftssystemer
Økende nytteverdi av gjenbruk Scripts cfengine Sammen- satt Store Økende nytteverdi i vedlikehold Win install Keyboard recording Monolittisk Ghost Automagisitet Aksjons- basert Tilstands- basert SIF8076 Planl/drift av IT-syst

224 SIF8076 Planl/drift av IT-syst
Push og pull ... Push er initiert fra sentral maskin. Gir oversikt, enkle nettverk og muliggjør en hierarkisk arbeidsform. Pull er initiert fra desentrale klienter. Gir lokal autonomitet, asynkronitet og muliggjør anarkistisk arbeidsform. SIF8076 Planl/drift av IT-syst

225 Hovedelementer push/pull
Initiativ til oppstart Tjener Klient Database over filer som skal distribueres Konfigura- sjonsfiler SIF8076 Planl/drift av IT-syst

226 SIF8076 Planl/drift av IT-syst
Push/pull – diagram Push (Kontroll- problem) rdist Sentalt initiativ store Lokalt initiativ cfengine track (Kaotisk vedl.ansvar) Pull Lokale konfigfiler Sentrale konfigfiler SIF8076 Planl/drift av IT-syst

227 Principle 22 Homogeneity/Uniformity I
System homogeneity or uniformity means that all hosts appear to be essentially the same. This makes hosts predictable [...]. SIF8076 Planl/drift av IT-syst

228 SIF8076 Planl/drift av IT-syst
Uniformitet – avvik Inkrementelle innkjøp Paritsjonering av ressurser Ulike bruksprofiler Duplisering/fall-back Distribuering/cache’ing Ekstra ytelse SIF8076 Planl/drift av IT-syst

229 SIF8076 Planl/drift av IT-syst
Maskinressurser Billigere (?) Kompleksitet i mengde En maskin - en jobb Optimalisert Strømlinje- forming Kompleksitet i variasjon For helt spesielle oppgaver Regnesenter- modellen En maskin til alt og alle Generelle maskiner Spesielle maskiner SIF8076 Planl/drift av IT-syst

230 Suggestion 8 Delegation II
For large number of hosts, distributed over several locations, consider a policy of delegation responsibility to a local administrator with closer knowledge of the hosts’ patterns of usage. [...] SIF8076 Planl/drift av IT-syst

231 SIF8076 Planl/drift av IT-syst
Delegering Kan forholde seg til maks 150 personer Kan forholde seg til ca 7 ’ting’ samtidig Anta: 4000 maskiner med 200 konfigurasjoner og 3000 ’varierte’ brukere SIF8076 Planl/drift av IT-syst

232 Delegering – løsningsrom
Deleger ansvar nedover Del opp organisasjonen Standardisér brutalt Kvitt deg med noen av oppgavene Out-sourcing av oppgavene SIF8076 Planl/drift av IT-syst

233 SIF8076 Planl/drift av IT-syst
Del XIII Eksempler på installasjons- og driftssystemer SIF8076 Planl/drift av IT-syst

234 SIF8076 Planl/drift av IT-syst
Eksempler Track Rdist Store Cfengine SIF8076 Planl/drift av IT-syst

235 SIF8076 Planl/drift av IT-syst
Track Mekanisme: pull Domene: alle typer filer Autonome lokale systemer Lokal konfigurasjonsfil SIF8076 Planl/drift av IT-syst

236 SIF8076 Planl/drift av IT-syst
Rdist Mekanisme: push Domene: alle typer filer Sentralisert konfigurasjon Sentralisert fil-database Klienter må stole på tjener SIF8076 Planl/drift av IT-syst

237 SIF8076 Planl/drift av IT-syst
Store Mekanisme: pull Domene: kun tredjepartsapplikasjoner Støtter multiple versjoner/arkitekturer Autonome maskingrupper Distribuert fil-database SIF8076 Planl/drift av IT-syst

238 SIF8076 Planl/drift av IT-syst
Cfengine Mekanisme: pull Domene: alle typer filer Sentralisert fil-database Sentralisering av konfig-filer Innebygging av mekanismer SIF8076 Planl/drift av IT-syst

239 SIF8076 Planl/drift av IT-syst
Del XIV Stabil infrastruktur og høy tilgjengelighet SIF8076 Planl/drift av IT-syst

240 Høy tilgjengelighet – spørsmål
Hvilke oppgaver er prioritert? Hva er akseptabel nedetid-lengde? Hva er kostnadene ved nedetid? Hvor hyppig kan man tåle nedetid? Hvor mye er man villig til å investere for å få opp nedetiden? Hvilke oppgaver er irrelevante? SIF8076 Planl/drift av IT-syst

241 Kostnader ved høy oppetid
Pris Nytteverdi Driftskostnad Økende oppetid SIF8076 Planl/drift av IT-syst

242 SIF8076 Planl/drift av IT-syst
Corollary 25 Redundancy Reliability is safeguarded by redundancy, or backup services running in parallel, ready to take over at a moment’s notice. SIF8076 Planl/drift av IT-syst

243 SIF8076 Planl/drift av IT-syst
Tre typer redundans Failover – sømløs overgang fra en komponent til annen som er lik. Backup – (ikke-automatisk) overgang til en reserveenhet som ikke er i bruk. Duplisering – flere enheter som løser samme oppgave, og som kan dekke opp for hverandre. SIF8076 Planl/drift av IT-syst

244 SIF8076 Planl/drift av IT-syst
Hva redundans ikke er! Kjøp dobbelt så mange ... – og skift dem halvparten så ofte. Kjør to instanser av samme program Erstatning for ikke å monitorere Garanti for at noe går galt Vedlikeholdsfritt ... (dvs, må testes!) SIF8076 Planl/drift av IT-syst

245 SIF8076 Planl/drift av IT-syst
Stabil infrastruktur Abstraksjon og generalisering Forenkling og lavere kompleksitet Dok og rutiner Forutsigbarhet Ver-kontroll og problemdatabase Historikk Gode valg og planlegging Kompetanse Monitorering Logger, SNMP etc SIF8076 Planl/drift av IT-syst

246 Principle 28 Abstraction generalizes
Expression tasks in an operating-system independent language reduces time spent debugging, promotes homogeneity and avoids unnecessary repetition. SIF8076 Planl/drift av IT-syst

247 Monitorering ved feilover
retting Single point of failure Bruker- problem Feil Brukerne merker ingenting Automatisk failover Loggføring Monitorering SIF8076 Planl/drift av IT-syst

248 SIF8076 Planl/drift av IT-syst
Drift i 24x7 Failover på alt utstyr Monitorering av ’alle’ feil Tidligst mulig varsling Vaktordning Høy kompetanse Rutiner for alle situasjoner Godt dokumentert system SIF8076 Planl/drift av IT-syst

249 Principle 24 Reliability
Any model of system infrastructure must have reliability as one of its chief goals. Down-time can often be measured in real money. SIF8076 Planl/drift av IT-syst

250 SIF8076 Planl/drift av IT-syst
Det man ikke tenkte på .... Strømaggregat Flere disker går samtidig Redundant kabling i samme kabelgate Når det klikker for noen Skattemyndighetene & Co Diverse ’katastrofer’ SIF8076 Planl/drift av IT-syst

251 Corollary 27 Reproducibility
Avoid improvising system modifications, on the fly, which are not reproducible. It it easy to forget what was done [...] SIF8076 Planl/drift av IT-syst

252 Kombinering av systemer
Felles opsys- base Felles Appl.- base Felles bruker DB Samme OS home dirs Høy Lav store samba NetBSD BDB cfengine Tetthet av integrasjon SIF8076 Planl/drift av IT-syst

253 Sjekkliste for høy oppetid
Fungererer alt etter neste boot? Kan du minste en hvilke som helst maskin uten tap av tjenester? Hvor lang tid bruker en fremmed på å lære seg systemet ditt? Er alt dokumentert? Har du single-points-of-failure? SIF8076 Planl/drift av IT-syst

254 SIF8076 Planl/drift av IT-syst
Sjekkliste II Har du tilstrekkelig backup Har du fjernlagret backup Hvor flytter du når alt brenner ned? Når sjekket du backup’en sist? Finnes det ansatte du ikke kan klare deg uten (og driver de med ekstremsport)? SIF8076 Planl/drift av IT-syst

255 SIF8076 Planl/drift av IT-syst
Sjekkliste III Er du sikret mot innbrudd? Hvilke eksterne tjenester er du helt avhengig av? Hvor raskt kan du få byttet komponenter i systemet ditt? Har du ’disasters waiting to happen’? Har du en katastrofeplan? SIF8076 Planl/drift av IT-syst

256 SIF8076 Planl/drift av IT-syst
Noen nyttige verktøy SNMP – monitorering over nett RCS/CVS – revisjonskontroll av filer Logganalysator for å detektere unormaliteter tcpdump – monitorere nettrafikk SIF8076 Planl/drift av IT-syst

257 SIF8076 Planl/drift av IT-Syst
Del XIV Konfigurguering, installasjon og vedlikehold SIF8076 Planl/drift av IT-syst

258 SIF8076 Planlegging og drift av IT-systemer
:52 Tre aktiviteter Konfigurering – tilpassing av en installasjonsbase for et sett maskiner Installering – opplasting av installasjonsbase til en ny maskin Vedlikehold – daglig kamp for å holde seg i målområdet og rette opp problemer som måtte ha oppstått Skiller mellom disse for aa unngaa aa opptre som en hobbygartner SIF8076 Planl/drift av IT-syst Foiler fra vårsemesteret 2001

259 SIF8076 Planl/drift av IT-syst
Principle 30 Disorder All systems will eventually tend to a state of disorder unless a rigid and automated policy is maintained. SIF8076 Planl/drift av IT-syst

260 SIF8076 Planl/drift av IT-syst
Kaos og uorden Feil- reduksjon Feil- akkumu- lering Mange personer Dokumentering Rutiner Kaos Orden Automatisering Divergens Variant- begrensning Variasjon Automatisk oppdating Bitråte SIF8076 Planl/drift av IT-syst

261 SIF8076 Planl/drift av IT-syst
Feilakkumulering Feil som far lov til ‘overleve’, fordi de ikke er kritiske Feil der symptomene er undertrykket, uten at feilen er rettet Kombinasjonsfeil, der bare noen av delkomponentene er rettet Feil i sovende systemer SIF8076 Planl/drift av IT-syst

262 SIF8076 Planl/drift av IT-syst
Virkningen av feil Systemets oppetid (under enkelte forutsetninger): Senke M og øke N Redusere hyppighet og levetid. Fjerne unødvendig funksjonalitet SIF8076 Planl/drift av IT-syst

263 Redusere en feils levetid
Automatisere deteksjon av kjente feil Automatisere retting av kjente feil Ikke vente på feilmelding fra bruker Bruker symptom Feil- melding Tilbake- melding Feilsøk Logg- melding Feil- retting Feil Forvarsel Autofiksing SIF8076 Planl/drift av IT-syst

264 Redusere en feils hyppighet
Unngå symptombehandling, finn heller den virkelige årsaken til feilen. Rett mer enn en forutsetning for at feilen skal opptre igjen. Introduser redundans i systemet og monitorer denne jevnlig. SIF8076 Planl/drift av IT-syst

265 SIF8076 Planl/drift av IT-syst
Dele opp i subsystemer Introduser heller flere ‘uavhengige’ subsystemer Reduser antallet kritiske komponenter i hvert subsystem Dvs: fjern avhengighetene mellom komponentene SIF8076 Planl/drift av IT-syst

266 Forflytt funksjonalitet
Feil har ‘følger’ bare i operativ fase Flytt funksjonalitet ut av denne Revurder helautomatisk konfigurering, uten manuell overvaking Planlegging Operativt Konfigurering Installasjon Driftsfase SIF8076 Planl/drift av IT-syst

267 SIF8076 Planl/drift av IT-syst
Fjern funksjonalitet Dersom ressursene er knappe og oppgavene mange, så se på hvilke oppgaver du ikke trenger å gjøre, og refokuser frigjorte ressurser. SIF8076 Planl/drift av IT-syst

268 SIF8076 Planl/drift av IT-syst
Preventivt vedlikehold SIF8076 Planl/drift av IT-syst

269 To typer preventivt vedlikeh.
Forbruksbasert. Vedlikehold på komponenter som har en levetid eller som brukes opp (f.eks ifm skrivere). Likevektsbasert. Vedlikehold på systemer med en endelig mengde ressurser som skal deles (f.eks ifm kjøring på datamaskin). Kommunikasjonsmessig. SIF8076 Planl/drift av IT-syst

270 SIF8076 Planl/drift av IT-syst
Forbruksbasert Monitorer levetiden vs forbruket Monitorer bruken vs feilmeldinger Estimer ’optimalt’ tidspunkt for skifte av forbruksdeler Unngå lagerhold av rekvisita Fyll på i store kvanta SIF8076 Planl/drift av IT-syst

271 SIF8076 Planl/drift av IT-syst
Skrivere på IDI Ca 30 skrivere Ca modeller Spredd på 11 blokker i 5 bygg Bruker 2 mill ark i året Toner for pr år Feil fra 1/100 til 1/ sider SIF8076 Planl/drift av IT-syst

272 Spørsmål ifm skriverbruk
Hvem skriver ut hvor mye? Hva koster hver side? Hva er MTBF? Hva er TTR? Har skriverne kvalitetssenkning? Hvor mye er feilutskrifter? Hvor mye er ’unødvendig’ utskrift? SIF8076 Planl/drift av IT-syst

273 SIF8076 Planl/drift av IT-syst
Vedlikeholdsbasert Preventivt vedlikehold Garbage- collection Stikk- prøver AUP Ressurs- forbruk Fokus på funksjonalitet SIF8076 Planl/drift av IT-syst

274 SIF8076 Planl/drift av IT-syst
Acceptable Use Policy Hvem har ansvar Hvem er delegert ansvaret Hvem gjelder denne AUP for Hva kan man bli utsatt for Hvilke plikter har man Hvilke retter har man Hva skal man rapportere Hvilke sanksjoner kan man bli utsatt for Klagemuligheter Verdiområde Brukers underskrift Hvem er utsteder Når er AUP gitt SIF8076 Planl/drift av IT-syst

275 SIF8076 Planl/drift av IT-syst
AUP – momenter Bør være generell og prinsippiell Følges av en veiledning Må være kjent for alle Må følges opp (ellers kan den miste sin kraft siden den er sovende) SIF8076 Planl/drift av IT-syst

276 Grunnleggende forutsetninger
Felles forståelse av driftsmålene Må være forberedt på det verste Brukerne må læres opp SIF8076 Planl/drift av IT-syst

277 SIF8076 Planl/drift av IT-syst
Kriseplaner – minimum Kriseinnkjøp. Hvem kan bestille, og for hvor mye, og i hvilke tilfeller? Overtid. Hvem kan autorisere, hvor lenge og i hvilke tilfeller? Kritiske brukere. Hva slags prioritering finnes for brukere, programmer og ressurser? SIF8076 Planl/drift av IT-syst

278 SIF8076 Planl/drift av IT-syst
Kommunikasjon Ledd1 Ledd2 Ledd3 Drift Sjef/drift Bruker Hva får du høre av hvem? Sjef for bruker SIF8076 Planl/drift av IT-syst

279 For å bedre kommunikasjonen
Etabler sosial kontakt Fortell en vits, slå av en prat Vær eksplisitt og still kontrollspørsmål Lytt og deretter gjenfortell Gå til kildene fremfor rykter Gi tilbakemelding (også god) SIF8076 Planl/drift av IT-syst

280 SIF8076 Planl/drift av IT-syst
Noen tips ... Besøk brukerne, spesielt de som er langt borte, lytt til problemene deres. Empati – forsøk å se det fra synspunktene til brukerne. Aksepter at brukerne en gang i blant kan være frustrerte og ha en dårlig dag. SIF8076 Planl/drift av IT-syst

281 SIF8076 Planl/drift av IT-syst
Stikkprøver Hvem bruker hvor mye ressurser? Hvilke pakker ’går på nettet’? Hva står i loggene og i cron-mail? Hvilke maskiner er brukt hvor mye? Hvilke maskiner har sær utrustning? SIF8076 Planl/drift av IT-syst

282 SIF8076 Planl/drift av IT-syst
Garbage collection To typer: Triggerbasert. Dvs at detekterer en uønsket situasjon. Tilstandsbasert. Dvs at man detekterer fravær av en ønsket tilstand. Uønsket situasjon Trigger Korrigering Korri- gering Regen- erering ’Noe’ er ikke rett SIF8076 Planl/drift av IT-syst

283 Mark om Garbage Collection
Computer systems have no natural waste system. If computers were biological life, they would have perished long ago, poisoned by their own waste. SIF8076 Planl/drift av IT-syst

284 Fokus på funksjonalitet
Er dette en prioritert oppgave? Kan vi fjerne/omgå hele oppgaven? Kan vi betale oss ut av problemet? Kan vi ’standardisere’ på noen enkeltløsninger? SIF8076 Planl/drift av IT-syst

285 Produktivitet og arbeid
Hvis traffikkork: Flere ressurser Mer restriksjoner Hvis høy terskel Færre restriksjoner Fjerne(!) ressurser, men det er ingen god løsning. For lite Trafik- kork Ress- urser Balanse For høy dørterskel Nok Restriksjoner Lite Mange SIF8076 Planl/drift av IT-syst

286 SIF8076 Planl/drift av IT-syst
Feilsøking og -retting SIF8076 Planl/drift av IT-syst

287 SIF8076 Planl/drift av IT-syst
Feilsøking – faser Feil- melding Reprod- usere Feil- isolering Verifi- sere Dobbelt- testing Testing Retting Dok SIF8076 Planl/drift av IT-syst

288 SIF8076 Planl/drift av IT-syst
Feilmeldingsfasen Få tak i mest mulig info om problemet Skaff eksakte feilmeldinger Skaff skjermbilder/transaksjonslogg Forsøk å tolke hva feilmeldingen egentlig sier Hva mener brukeren burde ha skjedd? Hvilke kontekst skjedde det i? SIF8076 Planl/drift av IT-syst

289 SIF8076 Planl/drift av IT-syst
To typer problemer Reproduserbare. De som du på kommando kan reprodusere. Ikke-reproduserbare. De som opptrer mer eller mindre sporadisk, og som du ikke kan fremkalle på kommando. SIF8076 Planl/drift av IT-syst

290 Ikke-reproduserbare feil
Monitorer dem over tid. Iverksett en stresstest. Analyser deg frem til feilen SIF8076 Planl/drift av IT-syst

291 SIF8076 Planl/drift av IT-syst
Reproduserbare feil Det er essensielt at du tidligst mulig i feilsøkingen kan reprodusere feilen ’på kommando’, det er det eneste som setter deg i stand til å verifisere at du har rettet problemet i ettertid. SIF8076 Planl/drift av IT-syst

292 SIF8076 Planl/drift av IT-syst
Feilisolering Kikk på mellomformat Introduser ’print-setninger’ Sjekk opp loggene Analyser symptomene Single-step gjennom programmet Endre parametre og observer SIF8076 Planl/drift av IT-syst

293 SIF8076 Planl/drift av IT-syst
Ulike årsaker Direkte årsak. Det som umiddelbart gjør at det ikke virker. Indirekte årsak. Det som forårsaker den direkte årsaken. Direkte årsak Indir. årsak Årsak SIF8076 Planl/drift av IT-syst

294 SIF8076 Planl/drift av IT-syst
Verifisering Rett feilen midlertidig Verifiser at den forsvant Fjern fiksen Verifiser at feilen er kommet tilbake Repeter etter behov Midl.- retting Testing Fjern fiksen Testing SIF8076 Planl/drift av IT-syst

295 SIF8076 Planl/drift av IT-syst
Retting og testing Retting. Gjør rettingen permanent, og distribuer den til alle maskiner. Testing. Test på mer enn en måte, fokuser fra mer enn en vinkel. Dobbelttest og trippeltest. Dokumentasjon. Dokumenter hva du har gjort, og gi tilbakemelding til bruker SIF8076 Planl/drift av IT-syst

296 SIF8076 Planl/drift av IT-syst
Vikting om testing! Noe du har gjort fungerer ikke fordi du har gjort det, men fordi du har test det, dobbelttestet det, og trippeltestet det. SIF8076 Planl/drift av IT-syst

297 SIF8076 Planl/drift av IT-syst
Noe man ikke skal gjøre Undertrykke symptomene Rette en feil uten å forstå hvorfor den oppstår Rette bare midlertidig SIF8076 Planl/drift av IT-syst

298 SIF8076 Planl/drift av IT-syst
Performance tuning SIF8076 Planl/drift av IT-syst

299 Ytelsesvurdering og feilsøking
Feilsøking skal finne en feil som forårsaker bestemte symptomer. Ytelsesvurdering skal søke å forbedre respons og throughput i et mer eller mindre fungerende system. SIF8076 Planl/drift av IT-syst

300 SIF8076 Planl/drift av IT-syst
Hva er ytelse ... ? Total throughput Responstid for bruker Jevn (eller maksimal) tidsforbruk SIF8076 Planl/drift av IT-syst

301 Probl: snikende ytelsestap
Nesten umerkelig degradering Brukerne ’lærer’ seg å leve med det Når terskelverdi for frustrasjon Ytelse Tid SIF8076 Planl/drift av IT-syst

302 Probl: automatiske mottiltak
Ressursdeling (f.eks CPU) Degradert ytelse (f.eks virtuelt minne) Garantert ytelse (f.eks TCP) SIF8076 Planl/drift av IT-syst

303 SIF8076 Planl/drift av IT-syst
Probl: Avhengigheter Dårlig ytelse på andre ressurser Høyt forbruk av en ressurs Bieffekter Fikse feil problem SIF8076 Planl/drift av IT-syst

304 SIF8076 Planl/drift av IT-syst
Angrepsvinkler Modeller. Bruk metodene fra ytelsesvurdering. Ofte altfor komplekst. Monitorer. Ha målepunkter som er representative for ytelse, og følg med dem over tid. Teste. Bytt ut komponenter og se sjekk oppførsel under belastning. SIF8076 Planl/drift av IT-syst

305 SIF8076 Planl/drift av IT-syst
Case: Introsalene 130 maskiner av 150MHz; 48MB; 1,3GB -> Kompilering av javaprogram: 65 sek -> Lokalt lagret programvare: 20 sek -> Med 128MB minne: 6 sek -> På terminaltjener: 2 sek SIF8076 Planl/drift av IT-syst

306 Case: prosesser på vier
Prosesser som har løpt løpsk -> bruker CPU og systemkall Detekteres med systemkall-monitor Noen få prosesser ødelegger SIF8076 Planl/drift av IT-syst

307 Principle 37 Symptoms and cause
Always try to fix problems at the source, rather than patching symptoms. SIF8076 Planl/drift av IT-syst

308 SIF8076 Planl/drift av IT-syst
Det svakeste ledd En prosess trenger flere ressurser Ressursene er tilgjengelig i ulike monn Den minst tilgjengelige ressursen setter tempoet. Motorvei Motorvei Kjerrevei Motorvei SIF8076 Planl/drift av IT-syst

309 Flaskehalshåndtering
Finn den for svakt dimensjonerte ressursen. Begrens belastningen, og/eller ... ... øk ressursen. Iterer til punkt 1 dersom nødvendig SIF8076 Planl/drift av IT-syst

310 SIF8076 Planl/drift av IT-syst
Fordeler Praktisk metode som er enkel å anvende. Kan brukes på eksisterende systemer. Balanserer systemet slik at man får optimal utnyttelse av hardware. SIF8076 Planl/drift av IT-syst

311 SIF8076 Planl/drift av IT-syst
Ulemper Inkrementell forbedring uten ’kvantesprang’ Vanskelig å kombinere med proaktiv planlegging Vanskelig å bruke på systemer med sterk variasjon i belastning Ofte bare symptombehandling SIF8076 Planl/drift av IT-syst

312 SIF8076 Planl/drift av IT-syst
Materialadministrasjon SIF8076 Planl/drift av IT-syst

313 SIF8076 Planl/drift av IT-syst
Oversikt over utstyr Hvor er utstyret på en gitt faktura? Hvilket utstyr har vært reparert? Hvilket utstyr har hvor lang levetid? Hvor står alt utstyret? Hva er på reparasjon? SIF8076 Planl/drift av IT-syst

314 SIF8076 Planl/drift av IT-syst
Gitt en faktura ... Revisjon – hvordan er pengene brukt. Dokumentasjon – vise at utstyret er en eget. Revisor Økonomer Internktrl Faktura Utstyr Tyveri Gjenbruk Garanti SIF8076 Planl/drift av IT-syst

315 Hvor er alt utstyret? (forts)
Avgrensing av ansvarsområde Planlegging ved oppgrad etc Sikkerhet krevet oversikt Variantbegrensing for å forenkle Overvåkning for å finne feil SIF8076 Planl/drift av IT-syst

316 SIF8076 Planl/drift av IT-syst
Midler for oversikt Nettverkskort – fra switch’er Strekkodemerking – på bokser Serienummer – på alle komponenter Brennmerking – mot tyveri Inventory – automatisk innsamlet Databaser – manuelt oppdatert SIF8076 Planl/drift av IT-syst

317 SIF8076 Planl/drift av IT-syst
Viktig å kunne svare på Hva er typisk kostnad for ulike varianter av utstyr? Hva er feilrate for utstyrstyper? Hvilket utstyr kan gjenbrukes? Hvor mye av utstyret er overkill? SIF8076 Planl/drift av IT-syst

318 SIF8076 Planl/drift av IT-syst
Levetidskostnader Innkjøpskost/levetid Personellkostnader Reservedeler Overkapasitet Brukt rekvisita HW-oppgraderinger SW-oppgraderinger Nettverkskostnader Tjenerkostnader Strøm/kjøling Opplæring Egenadministrasjon Ergonomiske kostn. Arealkostnader SIF8076 Planl/drift av IT-syst

319 SIF8076 Planl/drift av IT-syst
Økonomiske spørsmål Hva er kostnad pr maskin siste år? Bruker vi mer eller mindre enn før? Nedbryting av kostnadene i underposter. Alternative driftsmåter som kan ta kostnadene ned. Hva må vi budsjettere med neste år? SIF8076 Planl/drift av IT-syst

320 SIF8076 Planl/drift av IT-syst
Reservedeler Kort TTR Lavere transportkostnader Restelagre Lagerkosnader Fall i pris/ytelse Høyere forbruk Vanskelig å plassere øknomisk ansvar JIT- innkjøp Minimale lagre SIF8076 Planl/drift av IT-syst

321 SIF8076 Planl/drift av IT-syst
Lagerhold Registrering av uttak Kvitt deg med defekte deler Minimaliser størrelsen på lageret Evt legg genbrukbare deler på lager, men test dem først Utnevn en eneveldig lagersjef SIF8076 Planl/drift av IT-syst

322 SIF8076 Planl/drift av IT-syst
Avhending av utstyr Det kan være dyrt å selge! Garantiansvar Fakturering Annonsering Datautstyr er spesialavfall Husk at utstyret er merket! Pris: 80 kr/kg (?) SIF8076 Planl/drift av IT-syst

323 Eksempel – enkle parametre
Kostnad ved innkjøp: Andel av driftspersonell: Hardwareoppgrad: Softwarevedlikehold: Softwareoppgrad: Rekvisitautgifter: SIF8076 Planl/drift av IT-syst

324 SIF8076 Planl/drift av IT-syst
Innkjøp – ta vare på Tilbud (helst flere) Bestilling – skriftlig Ordrebekreftelse – med lev.dato Fraktbrev ved levering Pakkseddel med vareliste – sjekk! Alle serienumre etc Faktura Listenskoder og betingelser All korrespondanse ved innkjøpet SIF8076 Planl/drift av IT-syst

325 SIF8076 Planl/drift av IT-syst
... og ikke glem ... Merkantile momenter Fraktutgifter Gebyrer Tollutgifter Merverdiavgift (!) Ditt referansenr Tekniske momenter Kabler Batterier Rekvisita Distr.media Dokumentasjon Tomme media SIF8076 Planl/drift av IT-syst

326 Selgere og andre rare dyr ...
Utnytter din iboende høflighet Tåkelegger egne kostnader Eksperter i å avslutte salg Advarsel: leverandørkjeder Er alltid villige til å selge Faresignal: hyppig bytte av arb.giver SIF8076 Planl/drift av IT-syst

327 Tåkelegging av kostnader
Bundling av ekstra varer, så som kurs, support, opplæring, installasjon Ekstragebyrer for f.eks transport Med eller uten MVA? Utdragning i tid? ’Fiktive’ goder du aldri får benyttet Sære betalingsordninger SIF8076 Planl/drift av IT-syst

328 SIF8076 Planl/drift av IT-syst
Variantbegrensning Tvungen Bruk pisken! Planlegges i forkant Funderes hos ledelsen Må være klart for alle i org Må håndheves! Frivillig Bruk gulrota La dem selv betale Annonser/lokk med de OK løsningene Aksepter at ikke alle er med. Hold statistikk SIF8076 Planl/drift av IT-syst

329 SIF8076 Planl/drift av IT-syst
Reklamasjon Avklar garanti på forhånd Ha papirene i orden Forlang skikkelig support Ved innsending: ta vare på fraktbrev! Ta tiden på dem Ha oversikt over hva som er til rep SIF8076 Planl/drift av IT-syst

330 SIF8076 Planl/drift av IT-syst
Reklamering en masse Dersom det er systematiske mangler på en klasse av produkter, så forlang full reparasjon eller bytte av alt. Få det med i kontrakten Dokumenter problemene Ikke aksepter at ’vi tar det underveis’ SIF8076 Planl/drift av IT-syst

331 SIF8076 Planl/drift av IT-syst
Protokoller og verktøy SIF8076 Planl/drift av IT-syst

332 SIF8076 Planl/drift av IT-syst
SMTP Gammel protokoll Simplistisk Opprinnelig uten adgangskontroll Transportmekanisme for andre protokoller SIF8076 Planl/drift av IT-syst

333 SIF8076 Planl/drift av IT-syst
Bruk av SMTP telnet maskin 25 helo vier mail from: rcpt to: data dette er data . SIF8076 Planl/drift av IT-syst

334 NFS – Network file system
Basert på RPC-kall For tett kopling av filsystem mellom maskiner innenfor samme ‘enhet’ Klientside-autentisering Sikkerhetsproblemer: nosuid nodev Bruker mountd for å få magisk nummer Tildels minimalistisk autentisering SIF8076 Planl/drift av IT-syst

335 SIF8076 Planl/drift av IT-syst
Logging – syslog Tekstlig format Kollapsering av meldinger Bruker UDP-protokollen Trenger ekstern loggrotering Har facilities og severity Logger typisk over nett til loghost SIF8076 Planl/drift av IT-syst

336 SIF8076 Planl/drift av IT-syst
Logging – Eventlog Binært format – bundet Logging normalt til lokal maskin Automatisk loggrotering Severity og facility SIF8076 Planl/drift av IT-syst

337 SIF8076 Planl/drift av IT-syst
Printing – lpr Brukerprogrammet må generere utskriftsfila. Printingsystemet ordner (nesten) bare logistikken med utskriften Ikke altfor enkelt for sysadm Utskrift kan settes konsistent opp SIF8076 Planl/drift av IT-syst

338 SIF8076 Planl/drift av IT-syst
Printing – Windows Utskriftstjener har driver Klientmaskin genererer utskriftsfila Typisk problem: må definere egenskapene til skriveren! Støtter vilkårlig (og kaotisk) topologi SIF8076 Planl/drift av IT-syst

339 SIF8076 Planl/drift av IT-syst
Term.tjener – RDP Enkel protokoll for remote vising av desktop Problemer med tilgang til lokale enheter som diskettstasjon, skriver, lyd Innebygd i Windows Veldig simplistisk lastbalansering SIF8076 Planl/drift av IT-syst

340 SIF8076 Planl/drift av IT-syst
Term.tjener – Citrix Protokoll for vising av hel desktop eller enkeltapplikasjon Støtte for en del lokale enheter En del støtte for administrasjon Har mer avansert lastbalansering SIF8076 Planl/drift av IT-syst

341 SIF8076 Planl/drift av IT-syst
Term.tjener – X11 Protokoll for vising av vinduer til enkeltapplikasjon Ting som lastbalansering, lokale enheter etc er eksternt forprotokollen SIF8076 Planl/drift av IT-syst

342 SIF8076 Planl/drift av IT-syst
Sikkerhet SIF8076 Planl/drift av IT-syst

343 SIF8076 Planl/drift av IT-syst
Sikkerhetsproblemer Trygghet Safety Datatap Crash Ulykker Problem ’Ondsinnet’ Bruker Angrep Sikkerhet Security SIF8076 Planl/drift av IT-syst

344 Fysisk sikring av utstyret
Skallsikring Sonesikring Romsikring Klient Tjener Data SIF8076 Planl/drift av IT-syst

345 SIF8076 Planl/drift av IT-syst
Principle 43 Security The fundamental requirement for security is the ability to restrict access and privilege to data. SIF8076 Planl/drift av IT-syst

346 Fire fasetter av sikkerhet
Vern mot innsyn (lås) Autentisering (nøkkel) Autorisering (lås-nøkkel-kopling) Integritet (datas bestandighet) SIF8076 Planl/drift av IT-syst

347 SIF8076 Planl/drift av IT-syst
Vern mot innsyn (lås) (Data er beskyttet av en lås) Fysisk avlåsing (f.eks hengelås) Logisk avlåsing (f.eks kryptering) Nettmessig avlåsing (f.eks ACL) SIF8076 Planl/drift av IT-syst

348 Autentisering (nøkkel)
(Person må besitte en nøkkel) Passord som må huskes Engangspassord på fysisk gjenstand Privat nøkkel for krypteringsalgoritme Annet (irisskanning, fingeravtrykk, stemmegjenkjenning) SIF8076 Planl/drift av IT-syst

349 Autorisering (nøkkel-lås-kopling)
(Sikre at bare rett nøkkel passer) Fjerne bakdører Addere uavhengige låser Senke dirkbarhet Forsterke kopling person-nøkkel SIF8076 Planl/drift av IT-syst

350 SIF8076 Planl/drift av IT-syst
Integritet (Ondsinnet eller tilfeldig) Duplisering av data Sjekksumming av data Geografisk spredning av data Ansvarsspredning for data Kontrollert lagring SIF8076 Planl/drift av IT-syst

351 Hva bestytter vi oss mot
Operasjonsavbrudd (DoS) Dårlig omtale (defacing) Tap av data (diskkrasj) Fikling på data (integritet) Innsyn i data (info-tyveri) SIF8076 Planl/drift av IT-syst

352 Principle 46 Data invulnerability
The purpose of a backup copy is to provide an image of data which is unlikely to be destoyed by the same act that destroys the original. SIF8076 Planl/drift av IT-syst

353 SIF8076 Planl/drift av IT-syst
Parametre for backup Hyppighet (daglig) Full/inkr-fordeling (dynamisk) Syklustid (10-12 dager) Lagertid (60 dager til ’noen år’) Testing (3-5 ganger pr uke) Volum ( GB komprimert) SIF8076 Planl/drift av IT-syst

354 SIF8076 Planl/drift av IT-syst
Backup-parametre II Kjøretid for et fullt sett av backup Kjøretid for full restore Kjøretid for restore av enkeltfil Tilgang til alternative tapestasjoner Levetid i lagring på tapene Maks antall operasjoner pr tape SIF8076 Planl/drift av IT-syst

355 Tre dårlige strategier ... I
Security through obscurity. Gjør det så sært at ingen finner frem La være å dokumentere Kjør ustandard løsninger Hindrer ikke de som er virkelig oppsatt på å komme inn, selv om det er en terskel som skiller ut noen små angrep SIF8076 Planl/drift av IT-syst

356 Tre dårlige strategier II
Honningkrukker Sett frem noe fristende Ta dem etterhvert som de dukker opp Egentlig bare en variant av ’security through obscurity’. Tar de små tidlig og hindrer kanskje gjentakelse. Avskrekking? Kan også tiltrekke. SIF8076 Planl/drift av IT-syst

357 Tre dårlige strategier III
Offerlam De ytterste maskinene er ukritiske Når de angreper kan de studeres Kan kombineres med honningkrukka Også bare en ’security through obscurity’, selv om prinsippet om flere forsvarslinjer er bra. SIF8076 Planl/drift av IT-syst

358 Mangler med disse strategiene
Styrker ikke sikkerheten direkte Svekker bare sikkerhet på enkelte kontrollerbare punkter Obscuritetssikkerhet virker ikke mot interne innbrudd Hever terskelen, men stopper ikke SIF8076 Planl/drift av IT-syst

359 SIF8076 Planl/drift av IT-syst
Noen gode strategier I CERT (Computer Emergency Reposonse Team) Plassere ansvar og ressurser Proaktivt (ER?) Kjapp oppdatering av sikkerhetspatcher Full oppklaring av sære ting SIF8076 Planl/drift av IT-syst

360 Noen gode strategier II
Forenkling Filtrer alt gjennom en sental firewall Homogeniser datamaskinene Fjern unødvendig funksjonalitet SIF8076 Planl/drift av IT-syst

361 Noen gode strategier III
Monitorering Sett opp mange detektorer Følg systematisk opp symptomer Ta tilfeldige stikkprøver Følg med i loggene SIF8076 Planl/drift av IT-syst

362 Utfordringer innen sikkerhet
’Social engineering’ Bærbare maskiner med lokale data Skal jobbe fra hjemmemaskiner Egne ansatte Tempoet på utviklingen Overgang til black-box-funksjonalitet Skaleringsproblemene generelt SIF8076 Planl/drift av IT-syst

363 Konkrete sikkerhetsangrep
Lange ping-pakker Denial of Service (DoS) IP-spoofing SYN flooding TCP sequence guessing Teardrop ICMP-flooding DNS-Cache Poisoning SIF8076 Planl/drift av IT-syst

364 SIF8076 Planl og drift av IT-syst
Analystisk Systemadministrasjon SIF8076 Planl/drift av IT-syst

365 SIF8076 Planl/drift av IT-syst
Vitenskap og teknikk Abstraksjon Teoretisk/empirisk Hypoteser Falsifisering Peer review Publisering Grunnforskning Praktiske gjøremål Empirisk/heuristisk Kjørende kode “Det som virker” Akutte problemer Reaktivt SIF8076 Planl/drift av IT-syst

366 SIF8076 Planl/drift av IT-syst
Komplekse systemer Statistisk analyse av pålitelighet Statistisk analyse av ytelse Evaluering av metoder Observasjoner av uforutsigbare hendelser Strategi og planlegging Systemets mål og mening (policy) SIF8076 Planl/drift av IT-syst

367 SIF8076 Planl/drift av IT-syst
Gjeldende metodikk Verktøy Antakelser Omtrentlige, semi-felles erfaringer Anvendelse Observasjon SIF8076 Planl/drift av IT-syst

368 Mer vitenskapelig metodikk
Hypotese- testing Anvendelse og policy Verktøy Vitenskapelig kunnskap Observasjon Hypotese- bygging Modellering SIF8076 Planl/drift av IT-syst

369 Viktigheten av en “policy”
En “policy” definererer mål og mening for dataanlegget Bruker som rettesnor for å vurdere tiltaks hensiktsmessighet Påstand: gitt en policy, er egentlig hele systemets tilstand implisitt gitt SIF8076 Planl/drift av IT-syst

370 Policy-basert målstyring
Situasjon Problem? Policy Alternativ2 Løsnings- forslag Alternativ1 Måletall Måletall Konklusjon Konklusjon SIF8076 Planl/drift av IT-syst

371 SIF8076 Planl/drift av IT-syst
Eksempel med mp3 Situasjon: Tomt for disk pga mp3-filer Policy: ikke-faglig aktivitet må vike Problem? Ja, man får ikke arbeidet Alt1: Gjøre ingenting (nulltalternativet) Alt2: Sette opp en /etc/motd Alt3: Slette det hele Alt4: Sende oppfordringer til brukerne SIF8076 Planl/drift av IT-syst

372 SIF8076 Planl/drift av IT-syst
Alternativ 1 (eks mp3) Forslag: ikke gjøre noe Måletall: Driftskostnader Stabilitet Får folk arbeidet? Volum av mp3-filer? Konklusjon: Oppfyller ikke policy SIF8076 Planl/drift av IT-syst

373 SIF8076 Planl/drift av IT-syst
Alternativ 2 (eks mp3) Forslag: legge inn /etc/motd Måletall: Driftskostnader Hvor mange leser det? Hvor mange sletter Får folk arbeidet seriøst? Konklusjon: Litt bedre, men ikke nok SIF8076 Planl/drift av IT-syst

374 SIF8076 Planl/drift av IT-syst
Alternativ 3 (eks mp3) Forslag: Slette mp3 “on sight” Måletall: Driftskostnader Hvor mye blir frigjort Hvor mye gjemmes unna Får folk arbeidet seriøst? Konklusjon: ??? SIF8076 Planl/drift av IT-syst

375 SIF8076 Planl/drift av IT-syst
Eksempler på policies Hva skal systemet brukes til? Hvem er systemet til for? Prosentvis/lengde oppetid Utskriftskostnader/volum Nett: volum, accesstid, opptid Diskbruk: pr bruker, totalt Backup: hyppighet, testing, tid SIF8076 Planl/drift av IT-syst

376 Negativ/positiv policy
Negativ dersom den definerer det som ikke skal gjøres, som skal unngås og som ikke er ønskelig (lover) Positiv dersom den definerer det som er skal gjøres, oppnås og som er ønskelig (visjon) SIF8076 Planl/drift av IT-syst

377 Positiv måldefinisjon
Beskriver hvordan systemet er ment å fungere. SIF8076 Planl/drift av IT-syst

378 Negativ måldefinisjon
Probl Probl Probl Probl Probl Probl Probl Beskriver systemet Ved å spesifisere hvordan det ikke skal virke Probl SIF8076 Planl/drift av IT-syst

379 Målendring – utfordringer
Målene endres hele tiden Systemet må endres hele tiden Innsats blir generelt mindre Utfasing av foreldede neg tiltak Neg tiltak forutsetter at du oppdager problemet de skal løse, minst en gang SIF8076 Planl/drift av IT-syst

380 SIF8076 Planl/drift av IT-syst
Systemoppdatering I Nytt system Gammelt system Ny innsats Gjenbruk SIF8076 Planl/drift av IT-syst

381 SIF8076 Planl/drift av IT-syst
Systemoppdatering II Probl Probl Probl Probl Probl Probl SIF8076 Planl/drift av IT-syst

382 SIF8076 Planl/drift av IT-syst
Analytisk systemadministrasjon II (Pålitelighet og metrikker) SIF8076 Planl/drift av IT-syst

383 Metrikker for et system
MTBF (Mean time between failures) Gjennomsnittlig oppetid Gjennomsnittlig nedetid TTR (Time to repair) SIF8076 Planl/drift av IT-syst

384 SIF8076 Planl/drift av IT-syst
Pålitelighet – R SIF8076 Planl/drift av IT-syst

385 SIF8076 Planl/drift av IT-syst
Analogi til Ohms lov I = V/R V – Spenningsforskjell/info.endring I – Strøm/Tjenesterate eller infoflyt R – Resistans/Feilrate SIF8076 Planl/drift av IT-syst

386 SIF8076 Planl/drift av IT-syst
Flere feilkilder Dersom i serie (avhengigheter) Dersom i parallell (uavhengig) SIF8076 Planl/drift av IT-syst

387 SIF8076 Planl/drift av IT-syst
MTBF Feilrate som en enkeltstående feil opptrer med. F.eks eksponensialfordelt SIF8076 Planl/drift av IT-syst

388 SIF8076 Planl/drift av IT-syst
Intervall for måling 0-10 sek: systemytelse 10-30 sek: responstider Hver time: programvare Daglig: brukeraktivitet Ukentlig: brukeraktivitet SIF8076 Planl/drift av IT-syst

389 SIF8076 Planl/drift av IT-syst
Momenter ifm måling Målefrekvens/-intervall (Nyquist) Ekstra belastning ifm måling Måleperiode (dag, uke, semester) Periodisitet Entropi SIF8076 Planl/drift av IT-syst

390 SIF8076 Planl/drift av IT-syst
Måling av nettverk Ukentlig periode Daglig Gj.snitts type Forvent. entropi Antall pakker Svak/ Fraktal Kontinuerlig Høy IP frag-menter. Ingen Diskret Lav Tetthet Broadc. Svak Kontinuering SIF8076 Planl/drift av IT-syst

391 SIF8076 Planl/drift av IT-syst
Måling av nettverk II Ukentlig periode Daglig Gj.snitts type Forvent. entropi Antall Koll. Ubest. Ubest Kontinuerlig Lav Antall sockets Sterk (ut) Ugyldige pakker Ingen Diskret Minimal SIF8076 Planl/drift av IT-syst

392 SIF8076 Planl/drift av IT-syst
Måling av lagerplass Ukentlig periode Daglig Gj.snitts type Forvent. entropi Disk Plass Ja/ubest Kontinuerlig Ubest Disk op. Pr sek Page out Ubetydelig Lav SIF8076 Planl/drift av IT-syst

393 SIF8076 Planl/drift av IT-syst
Måling av prosesser Ukentlig periode Daglig Gj.snitts type Forvent. entropi Priv prosess Svak Diskret Lav Ikkepriv prosess Sterk Kontinuerlig Ubest Max CPU% Lite/ intet Bare max Høy SIF8076 Planl/drift av IT-syst

394 SIF8076 Planl/drift av IT-syst
Måling av brukere Ukentlig periode Daglig Gj.snitts type Forvent. entropi Antall pålogget Sterk Kontinuerlig Ubest Totalt antall Irrele-vant Absverdi Minimal Gj.sn tid pålogget SIF8076 Planl/drift av IT-syst

395 SIF8076 Planl/drift av IT-syst
Måling av brukere II Ukentlig periode Daglig Gj.snitts type Forvent. entropi Gj.snitt Last Sterk Kontinuerlig Høy Δdisk/sn/hr/usr Ubest Lav Ventetid på tjen. Sterk o. terskel Sterk o. Terskel SIF8076 Planl/drift av IT-syst

396 SIF8076 Planl/drift av IT-syst
Årsaker til mønstrene Sosiale mønstre (f.eks lunsj) Programsystemer (f.eks backup) Uoptimaliserte programmer Reelle feilkilder SIF8076 Planl/drift av IT-syst

397 Mål som ikke kan ’måles’
Brukeres tilfredsstillelse Informasjonssikkerhet Systemadmins frustasjon Nøyaktighet Omstillings- og tilpassingsdyktighet SIF8076 Planl/drift av IT-syst


Laste ned ppt "SIF8076 Planl/drift av IT-syst"

Liknende presentasjoner


Annonser fra Google