Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

18.01.2001SIF8076 Planl/drift av IT-syst1 Del 1 - Introduksjon Systemsadmins rolle, oppgaver, målsetting og filosofi.

Liknende presentasjoner


Presentasjon om: "18.01.2001SIF8076 Planl/drift av IT-syst1 Del 1 - Introduksjon Systemsadmins rolle, oppgaver, målsetting og filosofi."— Utskrift av presentasjonen:

1 SIF8076 Planl/drift av IT-syst1 Del 1 - Introduksjon Systemsadmins rolle, oppgaver, målsetting og filosofi

2 SIF8076 Planl/drift av IT-syst2 Definisjon (forslag) Systemadministrasjon er ingeniørfeltet som omfatter design, igangsetting, drift, overvåking og vedlikehold av komplekse datasystemer som primært skal brukes av andre, basert hovedsakelig på preeksisterende komponenter.

3 SIF8076 Planl/drift av IT-syst3 Ordbruk Systemansvarlig Systemadministrator (sysadm) Systemintegrator Operatør/systemoperatør Drifter

4 SIF8076 Planl/drift av IT-syst4 Historikk Maskiner var dyrere enn personer Mange ”tilfeldige” utøvere Behovsdrevet og selvlært Inkrementell oppskalering Drift er reaktivt Ikke ansett som fagfelt Paradigmeskifte: Da Kalle oppgraderte fra VMS til SGI

5 SIF8076 Planl/drift av IT-syst5 Mulige målsetninger ”Keep the users happy” ”Keep the system running” Oppnå det perfekte system Overflødiggjøre seg selv Hjelpe brukerne til å oppnå sine mål Komme igjennom jobbkøen Diskusjon: hva mener tilhørerne?

6 SIF8076 Planl/drift av IT-syst6 Målsetting (forslag) Holde et system av datamaskiner i gang for brukerne slik at de kan få utført sine oppgaver - til alles felles beste og organisasjonens uttrykte mål - ved å balansere tilgjengelige ressurser og søke å minimalisere den administrative overhead.

7 SIF8076 Planl/drift av IT-syst7 Sysadm som fagfelt Et typisk ingeniørfag Et datafag Grensesnitt til elektrofagene Grensesnitt til organisasjonsfag og prosjektstyring Statistikk, psykologi og kommunikasjon mellom mennesker er viktig Trekk sammenligningen med ”engineers” litt lengre

8 SIF8076 Planl/drift av IT-syst8 Sysadm som ingeniørfag Fokus på konvensjoner og standarder Fundert på vitenskap Basert på tommelfingerregler Basert på prøving og feiling Mye tilgjengelig litteratur Ingen helt perfekte metoder Mange temmelig gale metoder Tidl fulgte lokføreren med lokomotivet

9 SIF8076 Planl/drift av IT-syst9 Sysadm som karrierevei Livslang karrierevei Varierte jobbmuligheter Grenseflater mot andre fagfelt Vitenskapelige muligheter Interaksjon med andre – utadvendt

10 SIF8076 Planl/drift av IT-syst10 Egenskaper I Fokus på både detalj og helhet Balansere små ressurser Balansere mange oppgaver samtidig Håndtere de lange rytmene Kunne angrepe problemer systematisk Kunne samarbeide med andre

11 SIF8076 Planl/drift av IT-syst11 Egenskaper II Kunne feilsøke Kunne få jobben gjort Takle at det skjer ”uforklarlige” ting Stadig lære seg nye verktøy Må ”grokke” teknologien Må kunne ”best practice” Forstå og respektere tradisjon Å følge oppskrift når den ikke virker

12 SIF8076 Planl/drift av IT-syst12 Egenskaper III Kunne lytte og informere Kunne takle fullt kaos Tåle å få dårlig tilbakemelding Kunne håndtere tidspress Respektere brukerne Kunne leve i en ikke-perfekt verden

13 SIF8076 Planl/drift av IT-syst13 Egenskaper IV Kunne lære og kunne utføre Kunne lære av andre Kunne improvisere Alltid tenke litt på sikkerhet ”God nok” fremfor perfekt Kunne finne ad-hoc-løsninger Kunne eliminere ad-hoc-løsninger

14 SIF8076 Planl/drift av IT-syst14 Planlegging og drift av IT- tjenester Del II Logging

15 SIF8076 Planl/drift av IT-syst15 Hvorfor logger vi? Ønsker å fakturere Planlegge utfasing av utstyr Monitorere ytelsen Detektere feil og abnormaliteter Post Mortem-analyse Dokumentere hva som har skjedd Ikke for å snoke!

16 SIF8076 Planl/drift av IT-syst16 Fakturering av forbruk Alt er dyrere når det faktureres Påstand: (udokumentert) 90% av telefonkostnadene er fakturering

17 SIF8076 Planl/drift av IT-syst17 Regel nr 1 Logging for fakturering Kvaliteten på logging må være høyere dersom loggen skal bruke eksternt til fakturering enn dersom loggen kun skal brukes internt til monitorering. Dette koster igjen mer enn ”vanlig” logging.

18 SIF8076 Planl/drift av IT-syst18 Logger og Datatilsynet Logger kan ha personopplysninger Beskytt sensitive logger Trenger konsesjon for personoppl. Taushetsplikt Hvor lenge lagrer du loggene? NB: logger kan ligge på backup!

19 SIF8076 Planl/drift av IT-syst19 Regel nr 2 Logger og oppsporing Dersom du bruker logger til å spore opp hvem som har gjort et eller annet ved for eksempel innbrudd, så vær oppmerksom på at logger kan være endret på eller de kan være gale i utgangspunktet. Skaff deg krysspeilinger for å bli sikker.

20 SIF8076 Planl/drift av IT-syst20 Logger og tilstandsdata Logger inneholder historisk informasjon Tilstandsdata forteller om nåsituasjonen Eks: lastcomm kontra ps Tilstandsdata er mindre problematisk Logger kan anonymiseres Persondata: data som kan knyttes til personer (dvs f.eks. til brukernavn)

21 SIF8076 Planl/drift av IT-syst21 Regel nr 3 Korrekt tid Sørg for å ha rett klokke på alle maskinene dine, og pass på at tidssoner og vinter/sommertid er korrekt

22 SIF8076 Planl/drift av IT-syst22 Sentralisering av logger Syslog kan sentralisere loggene Gir mer logistikk Enklere å søke i loggene Enklere å preprosessere loggene Lettere å oppdage feil

23 SIF8076 Planl/drift av IT-syst23 Regel nr 4 Read-only-logging Dersom du er paranoid nok, bør du logge til et write-once-read-many-media (CD- ROM eller utskrift), eller til en maskin som ikke svarer omverden og som er fysisk godt sikret.

24 SIF8076 Planl/drift av IT-syst24 Regel nr 5 Big Brother ser deg Bruk av logger for å gi tilbakemelding til de som gjør tvilsomme eller uønskede ting sender et veldig effektivt budskap, og reduserer slik aktivitet kraftig.

25 SIF8076 Planl/drift av IT-syst25 SIF8076 Planlegging og drift av IT-systemer Del III Systemprivilegier

26 SIF8076 Planl/drift av IT-syst26 Systemprivilegier Tilgang til spesielle ressurser Unix: ingenting stopper root Win: Administrator kan gi seg selv tilgang til alle ressurser VMS: har setprv-privilegium

27 SIF8076 Planl/drift av IT-syst27 Privilegier: Unix vs Windows Enkelt og oversiktlig Enkelte får for mange privilegier ACL virker ikke ordentlig over nett Konfigurerbart Programvaren er problemet

28 SIF8076 Planl/drift av IT-syst28 Principle 1 Privilege Restriction of unnecessary privilege protects a system from accidental and malicious damage, and infection by viruses, and prevents users from concealing their actions with false identities. It is desirable to restrict users’ privileges for the greater good of everyone on the network.

29 SIF8076 Planl/drift av IT-syst29 Ikke bruk systembrukere Dårlig sporbarhet når flere har tilgang Farligere å glemme å logge ut Kult men ikke særlig klokt Generelt for felleskontoer Ikke lovlig iht NTNUs IT-reglement! Unix: dårlig granularitet Veldig synlig innbruddsmål

30 SIF8076 Planl/drift av IT-syst30 Corollary 2 Privilege No one should use a privileged root/Administrator account as a user account. To do so is to place the system in jeopardy.

31 SIF8076 Planl/drift av IT-syst31 Unix: Bruk sudo Lar deg konfigurere privilegier for hver enkelt bruker Gir sporbarhet Synlig hvem som bruker privilegier ”Ingen” har root Det er fiklete Må ikke kunne starte et skall

32 SIF8076 Planl/drift av IT-syst32 Regel nr 6 Systempassord Skift passord med jevne mellomrom, du vil komme til å bli forbauset over hvor mange som etterpå kommer og spør om å få det nye passordet også.

33 SIF8076 Planl/drift av IT-syst33 Hardware siste 12 år Floppy: 4 ganger større Nettverk: 10 ganger raskere Magnettape: 50 ganger større Minne: 100 ganger mer CPU: 200 ganger raskere Harddisk: 500 ganger mer Gir endrede forutsetning!

34 SIF8076 Planl/drift av IT-syst34 Regel nr 7 Vær jordnær Når du arbeider med elektronikk, så skal du alltid sørge for å være tilstrekkelig jordet. Om du ikke har jordingsarmbånd, så hold i alle fall i chassis eller noe annet som reduserer risikoen.

35 SIF8076 Planl/drift av IT-syst35 SIF8076 Planl/drift av IT-syst Del IV Uniformitet

36 SIF8076 Planl/drift av IT-syst36 Principle 3 Uniformity A uniform configuration minimizes the number of differences and exceptions one has to take into account later. This applies to hardware and software alike.

37 SIF8076 Planl/drift av IT-syst37 Uniformitet i praksis HW-revisjoner skifter stadig En ønsker å kjøpe det aller siste Billigere å kjøpe nytt Vanskelig å få tak i gammelt Bærbare er svært ”personlige”

38 SIF8076 Planl/drift av IT-syst38 IDI og uniformitet Ca 800 PC-er (intel-plattform) Ca 400 kombinasjoner av hw Ca varianter av hver enkelt HW- komponent (SW-konfigurering kommer i tillegg)

39 SIF8076 Planl/drift av IT-syst39 Uniformitet for enhver pris? Uniformitet er ikke noe primært mål! Viktigere med funksjonalitet Viktigere med stabilitet

40 SIF8076 Planl/drift av IT-syst40 Hvordan oppnå uniformitet Variantbegrensning Bruk pisk på brukere Bruk gulrot på brukere Kapsle inn forskjeller La forskjeller være uavhengige (dvs la dem eksistere i ulike dimensjoner)

41 SIF8076 Planl/drift av IT-syst41 Regel 8 Uniformitet er sekundært Uniformitet er bare et sekundært mål, fordi det hjelper oss å nå mer primære mål, så som stabilitet på systemet, rasjonell drift, at brukerne kan kjenne seg igjen fra maskin til maskin. Dersom uniformiteten blir et mål i seg selv, kan det lett gå ut over de egentlige målene.

42 SIF8076 Planl/drift av IT-syst42 Nyttig med variasjoner Fase over mellom to versjoner Varierende brukerbehov Gir en slags fail-over-løsning Lisens- og HW-messig billigere Gir mer ”interessant” hverdag Fordrer et mer robust oppsett

43 SIF8076 Planl/drift av IT-syst43 Regel nr 9 Kjøp noen ekstra Dersom du skal kjøpe mange maskiner, og det er viktig at de er like, så bør du kjøpe et par ekstra som du kan kanibalisere på etterhvert. Dette gjelder selv om du har garantiavtale. La brukerne av de ekstra maskinene være oppmerksom på det.

44 SIF8076 Planl/drift av IT-syst44 Standardisering av SW Letter dokumentasjon, installasjon, brukerstøtte og kommunikasjon Nytteverdien begrenset til en organisasjon Kan være vanskelig å kombinere med ”dynamiske” organisasjoner

45 SIF8076 Planl/drift av IT-syst45 Produktstandarder Fungerer best i tette, lukkede miljøer Best dersom du har én driftsorganisasjon Helst lite sofistikerte brukere Bør holde på et valg over en temmelig lang periode Krever lojalitet fra brukerne

46 SIF8076 Planl/drift av IT-syst46 Formatstandarder Øker kompleksiteten Nødvendig i løst knyttede organisasjoner Dersom flere driftsorganisasjoner Dersom flere økonomiske enheter Dersom varierte brukere

47 SIF8076 Planl/drift av IT-syst47 Lisenser og uniformitet Sitelisens er uniformitet Flytende lisenser er uproblematisk Nodelocked lisenser reduserer uniformiteten fordi de fordrer at spesialtilpassing for hver maskin.

48 SIF8076 Planl/drift av IT-syst48 SIF8075 Planl/drift av IT-syst Del 5 Dokumentasjon av driftssystemer

49 SIF8076 Planl/drift av IT-syst49 Tre driftsroller 1. Systemoperatør. Håndterer daglige rutineoppgaver og utfører forhåndsdefinerte oppgaver. 2. Systemadministrator. Håndterer feilsøking og -retting, og annet forefallende og løpende vedlikehold. 3. Systemintegrator. Planlegger, utvikler og igangsetter nye driftssystemer og -rutiner.

50 SIF8076 Planl/drift av IT-syst50 Merknader til ”roller” Det er mulig for én person og fylle flere roller.

51 SIF8076 Planl/drift av IT-syst51 Kart og terreng KartTerreng DokumentasjonSystem

52 SIF8076 Planl/drift av IT-syst52 Regel nr 10 Når terrenget er galt Når dokumentasjon og system (kart og terreng) ikke stemmer overens, så er det systemet som er feil, ikke dokumentasjonen.

53 SIF8076 Planl/drift av IT-syst53 Driftsstabens oppgaver 1. Systemoperatør. Skal holde seg innenfor det som allerede er forutsett og beskrevet i dokumentasjonen. 2. Systemadministrator. Skal korrigere systemet når det avviker fra dokumentasjonen. 3. Systemintegrator. Skal videreutvikle system og dokumentasjon i parallell.

54 SIF8076 Planl/drift av IT-syst54 De tre vanligste feilene 1. At man ikke har dokumentasjon 2. At man har gammel dokumentasjon 3. At man for mye dokumentasjon

55 SIF8076 Planl/drift av IT-syst55 Kjettersk utsagn: Systemdokumentasjonen og systemet er tilsammen alt du trenger; fordi den første forklarer alle sammenhenger og den siste definerer alle tilstander entydig.

56 SIF8076 Planl/drift av IT-syst56 Problem med dette Systemdok’en er for omfattende Systemet er ikke intuitivt å finne frem i. Systemdok’en er for generell Systemet er for spesifikt Gir ingen historikk Gir ikke rom for planlegging

57 SIF8076 Planl/drift av IT-syst57 Løsningen: lokaldok Skal være kortfattet men relevant Peke på viktige deler i systemet Peke på relevante deler i dok’en Skal fortelle om intensjonene Skal formidle strategiene Skal angi historikken

58 SIF8076 Planl/drift av IT-syst58 Regler for lokaldok Ikke gjenta det som står i systemdok’en Referer indirekte der det er mulig Lime sammen system og sys.dok Fortell endel om hvorfor Formidle rammene rundt systemet

59 SIF8076 Planl/drift av IT-syst59 Varianter av lokaldok 1. Konfigurasjonsbeskrivelse 2. Strategier og planer 3. Oversikt over konfigurasjon og organisering 4. Rutiner og prosedyrer 5. Problem- og erfaringsdatabase 6. Logger 7. Endringsbeskrivelser

60 SIF8076 Planl/drift av IT-syst60 Konfigurasjonsbeskrivelse Knutepunkt for dok om et subsystem Startpunkt for pekere og løse tråder Skal ikke være selvstendig Være tilstrekkelig til at en ny sysadm kan overta driften om nødvendig Oppdateres etter formell prosedyre Oppdateringsfrekvens 2-6 mnd.

61 SIF8076 Planl/drift av IT-syst61 Konf.besk. – eksempel Oversikt Dokumentasjon Strategi Konfigurasjon Ansvarsforhold Systemoversikt Installasjons- prosedyre Sikkerhetskopiering Katastrofeplan Alternativ driftsplan Testprosedyrer Operasjonsrutiner Merknader Identifikasjon

62 SIF8076 Planl/drift av IT-syst62 Strategier og planer Oppgave/problemstilling Situasjonsvurdering Økonomiske vurderinger Tiltak med tidsplaner Retningslinjer Ansvarsforhold

63 SIF8076 Planl/drift av IT-syst63 Systemoversikt Gi detaljer om systemkonfigurasjon Kan være delvis autogenerert Kortfattet men spesifikk ”Kart” i krisesituasjoner Oppdateres ved behov uten formell prosesdyre

64 SIF8076 Planl/drift av IT-syst64 Rutiner Forutsigbare operasjoner Skal utføres likt hver gang Tilrettelegges for systemoperatører av systemintegratorer Andre må kunne vikariere Skal være komplette Må inneholde testing

65 SIF8076 Planl/drift av IT-syst65 Rutiner (SOP) – eksempel Oversikt Hensikt og ansvar Kompleksitet Antatt nedetid Tilbakerullingsplan Merknader Dokumenasjon Trinnvis prosedyre Testplan Identifikasjon

66 SIF8076 Planl/drift av IT-syst66 Problemdatabase Angir utestående problemer Løsninger på tidligere problemer Grunnlag for evaluering av org Kontaktpunkt mellom drift og brukere ”Anonymisering” av oppgaver

67 SIF8076 Planl/drift av IT-syst67 Probl.db – eksempel Bruker som feilmeldte Symtomer Kategorisering Eierskap i drift Jobbtilstand Løpende status Viktighet Skissering av løsning Alle transaksjoner og vurderinger Intern prioritering Søkemulighet ETA (hvis relevant) Kontaktinformasjon Tidsstempler

68 SIF8076 Planl/drift av IT-syst68 Logger Hva er blitt gjort Hvorfor er det gjort Hvem har gjort det Når har det skjedd Hvordan rulle endringene tilbake Krever arbeidsdisiplin

69 SIF8076 Planl/drift av IT-syst69 Logger – eksempler RCS eller CVS-logger ”readme”-filer (dvs Changelog) E-post-liste Konferansesystem Endringsbeskrivelser

70 SIF8076 Planl/drift av IT-syst70 Endringsbeskrivelser Beskrive et behov Beskrive en løsning Planlegger selve endringen Varsle om endringer Grunnlag for ”peer review” Blir et historisk dokument

71 SIF8076 Planl/drift av IT-syst71 Endringsbesk – eksempel Oversikt/ident. Problembeskrivelse Løsningsbeskrivelse Endringens omfang Ansvarsforhold Kompleksitet Nullalternativet Estimert nedetid Prioritet Mulige bieffekter Tilbakefallsplan Merknader Dokumentasjon Prosedyre Testplan (Intern arbeidsplan)

72 SIF8076 Planl/drift av IT-syst72 Endringsbekrivelse Hensikten med en endringsbeskrivelse er tredelt: de som skal gjøre tilstrekkelig forarbeid ved å utarbeide en plan; omgivelsene skal kunne vurdere og respondere i forkant av endringen; og i ettertid skal man ha oversikt over hva som har skjedd.

73 SIF8076 Planl/drift av IT-syst73 Prosedyre for endringbeskr. 1. Utarbeide forslag til plan 2. Teste på et alfa-system 3. Bearbeide planen 4. Peer-review av plan og eventuell formell behandling 5. Opplæring og andre forberedelser 6. Igangsetting av planen

74 SIF8076 Planl/drift av IT-syst74 Intern arbeidsplan Oversikt Beskrivelse Ansvarlig Tidsrammer Skrittvis plan Testpunkter underveis Merknader

75 SIF8076 Planl/drift av IT-syst75 Hvor mye dok er nok? Avhenger av systemets størrelse (personer, maskiner, applikasjoner) Avhenger av kompetansen til de driftsansvarlige Avhenger av tilgjengelige ressurser Avhenger av ambisjoner om oppetid og driftssikkerhet

76 SIF8076 Planl/drift av IT-syst76 SIF8076 Planl/drift av IT-syst Del VI Arbeidsdeling

77 SIF8076 Planl/drift av IT-syst77 Tre forsvarslinjer linje. Brukerstøtte, FAQ, enkel feilsøking, rutiner, enkel adm linje. Feilsøking og feilretting, tyngre administrasjon linje. Konfigurering, design av systemer, feilsøking på dypt nivå.

78 SIF8076 Planl/drift av IT-syst78 Tredeling - hvorfor Konsentrere og reservere høy kompetanse til vanskelige jobber. Fungerer som lokal ’karrierevei’. Gir organisatorisk sporbarhet (hvem gjør hva). Gir ’single point of entry’ for feilmeldinger.

79 SIF8076 Planl/drift av IT-syst79 Eksempler Skifte passord (1) Restore sletta filer (1) Manglende toner (1) Ingen utskrift (1+2) Nettet er tregt (1+2+3) Installere ISDN på bærbar (2) Nytt backupsystem (3)

80 SIF8076 Planl/drift av IT-syst80 Dokumentasjon 1.linje (systemoperatører) utfører dokumenterte rutiner 2.linje (systemadministratorer) feilsøker og feilretter basert på dokumentasjonen 3.linje (systemintegratorer) produserer dokumentasjonen

81 SIF8076 Planl/drift av IT-syst81 Single point of entry Alle henvendelser og feilmeldinger bør gå gjennom et felles inngangspunkt, slik t brukerne genererer oppgaver til 1.linje. Deretter skal 1.linje (om nødvendig) sende dem videre til 2.linje som igjen (om nødvendig) sender dem videre til 3.linje.

82 SIF8076 Planl/drift av IT-syst82 Single entry – hvorfor Beholde kontroll over tempoet Gjøre det enklere for brukerne Prioritering mellom oppgaver Oversikt over hva som er utestående La avbrytelser bare ’ødelegge’ i en enkelt del av organisasjonen

83 SIF8076 Planl/drift av IT-syst83 Roller De tre linjene er roller Personer vil typisk ha litt av alle roller Nødvendig for alle i staben å se saken fra ’den andre siden’

84 SIF8076 Planl/drift av IT-syst84 Probl.db - statistikk 1. Svartid ved henvendelse 2. Tid til ferdig analysert 3. Tid til ferdig løst 4. Totalt antall jobber over tid 5. Treffsikkerhet på ETA 6. Identifisere ’virring’ før løsning

85 SIF8076 Planl/drift av IT-syst85 Statistikk - hvorfor Måltall for balansering av belastning Argumenter ifm budsjettering Identifisere hot-spots som kan automatiseres Erfaringsdata for ressursplanlegging

86 SIF8076 Planl/drift av IT-syst86 Antallet linjer Det er ingenting magisk med tre nivåer, og det kunne godt være flere, men helst ikke færre. Det må tilpasses den enkelte organisasjon.

87 SIF8076 Planl/drift av IT-syst87 SIF8076 Planl/drift av IT-syst Del VII Nettverk

88 SIF8076 Planl/drift av IT-syst88 Historikk 1. Gamle stormaskiner, brukerne oppsøkte maskinene 2. Minimaskiner, terminalbruk 3. PC-er, plassert hos brukeren 4. Nettverkssystemer, maskinen ’oppsøker’ brukerne

89 SIF8076 Planl/drift av IT-syst89 Principle 4 Communities What one member of a cooperative community does affects every other member, and vice versa. Each member of the community therefore has a responsibility to consider the well-being of the other members of the community.

90 SIF8076 Planl/drift av IT-syst90 Principle 5 Multi-user communities A multi-user computer system does not belong to any one user. All users must share the resources of the system. What one user does affects all other users, and vice versa. Each user has a responsibility to consider the effect of his/her actions on all the other users.

91 SIF8076 Planl/drift av IT-syst91 Principle 6 Network communities A computer which is plugged into the network is no longer just ours. It is part of a society of machines which shares resources and communicates with the whole. What that machine does affects other machines. What other machines do affects that machine.

92 SIF8076 Planl/drift av IT-syst92 Principle 7 Delegation I Leave experts to do their jobs. Assigning responsibility for a task to a body which specializes in that task is an efficient use of resources.

93 SIF8076 Planl/drift av IT-syst93 Tjener eller peer-to-peer Peer-to-peer: Maskinene er autonome enheter som deler hverandres ressurser. Eks: Win workgroups, Mac Tjener: Sentrale deler av systemet er samlet på dedikerte maskiner. Eks NT og Novell

94 SIF8076 Planl/drift av IT-syst94 Fordeler med peer-to-peer Enkelt å komme igang med Skalerer bra initielt Autonomt, trenger ikke felles organisering Basert på naturlige ’power users’ Adm kostnader er innbakt

95 SIF8076 Planl/drift av IT-syst95 Fordeler med sentrale tjenere Styrbart (gjennom f.eks strategier) Klare ansvarsforhold Adm overhead blir synlig Gjenbruk og deling av ressurser Variantbegrensning Tillater arbeidsdeling/spisskompetanse Utnyttbart økonomisk

96 SIF8076 Planl/drift av IT-syst96 Principle 8 Adaptability Optimal structure and performance are usually found only with experience of changing local needs. The need for system recision will always come. Make network solutions which are adaptable.

97 SIF8076 Planl/drift av IT-syst97 Principle 9 One name for one object I Each unique resource should have a unique name which labels it and describes its function.

98 SIF8076 Planl/drift av IT-syst98 Corollary 10 Aliases Sometimes it is adavantageous to use aliases or pointers to unique objects so that a generic name can point to a spesific resource.

99 SIF8076 Planl/drift av IT-syst99 Fordeler med aliases Indireksjon Lettere å flytte tjenester Kortere og enklere navn Kan ivareta historiske ordninger Kan gi beskrivende og funksjonelle navn Som ad hoc-løsninger

100 SIF8076 Planl/drift av IT-syst100 OSI-modellen 1. Physical layer 2. Data link layer 3. Network layer 4. Transport layer 5. Session layer 6. Presentation layer 7. Application layer

101 SIF8076 Planl/drift av IT-syst101 Etterforskning av gamle nett Kabelsniffer Pakkesniffer Følg kablene i veggen Bruk SNMP Bruk ping Snakk med veteraner Tegne opp et diagram!

102 SIF8076 Planl/drift av IT-syst102 Planlegging av systemer 1. Hva er planlagt bruk 2. Hvilke avveininger må vi ta hensyn til 3. Hva har vi av eksisterende systemer 4. Hva trenger vi av nye systemer 5. Hva har vi av ’penger’ 6. Hvordan kommer vi i mål

103 SIF8076 Planl/drift av IT-syst103 Momenter mht bruk Applikasjoner Levetid Ytelse Lokalisering Brukere Oppetid Utvidelser Sikkerhet Stabilitet Tjenester Driftskostnader

104 SIF8076 Planl/drift av IT-syst104 Avveining 1: En eller mange tjenere Skal du samle alle de tjenestene du skal tilby på en felles, stor, dyr maskin; eller skal du spre dem ut mellom flere, mindre, billigere maskiner?

105 SIF8076 Planl/drift av IT-syst105 Avveining 2: Tykke eller tynne klienter Skal du la klientmaskinene være ’skikkelige’ maskiner som fungerer selvstendig og mer eller mindre isolert; eller skal du gjøre dem tynnest mulige og konsentere innsatsen mot noen få tjenermaskiner?

106 SIF8076 Planl/drift av IT-syst106 Avveining 3: Hvor skal pengene brukes Skal du bruke pengene på å oppgradere klientmaskinene lokalt med f.eks cacheminne; eller skal du samle mest mulig at slike ressurser på tjenerne, der de kan deles og komme alle til gode?

107 SIF8076 Planl/drift av IT-syst107 Avveining 4: Oppetid eller ytelse? Skal du satse på dyr, men maksimal opptid og stabilitet på systemet ditt; eller skal du heller bruke pengene på flere og bredere tjenester og så reparere problemene ad hoc?

108 SIF8076 Planl/drift av IT-syst108 Avveining 5: Speiling eller sentralisering Skal du speile ut kopier av systemdata som ikke endrer seg, og dermed få et ekstra vedlikeholdsansvar; eller skal du heller investere i mer og kraftigere nettverk?

109 SIF8076 Planl/drift av IT-syst109 Avveining 6: Enkle eller utvidbare navn Når du skal navngi ressursene dine, skal du satse på et kort, enkelt og pragmatisk navnesystem; eller skal du satse på en navngiving som tillater deg å skalere betraktlig opp i fremtiden?

110 SIF8076 Planl/drift av IT-syst110 Principle 11 Inter-dependency Avoid making one service reliant on another. The more independent a service is, the more efficient it will be, and the fewer possibilities there will be for its failure.

111 SIF8076 Planl/drift av IT-syst111 Avhengigheter Bør fjernes permanent (ikke bare fikses) Test om det er avhengigheter Planlegg evt avhengigheter Lag en avhengighetsgraf Avhengighet kan være til personer!

112 SIF8076 Planl/drift av IT-syst112 Fire selvstendige dimensjoner Konti, brukerdata, hjemmekataloger Operativsystem og konfigurering Hardware Applikasjoner

113 SIF8076 Planl/drift av IT-syst113 Suggestion 1 File servers with common data Place all file servers which serve the same data on a common host, e.g. WWW, FTP and NFS serving user files. Place them on the host which physically has the disks attached. This will save an unnecessary doubling of netwirk traffic and will speed up services. A fast host with a lot of memory and perhaps several CPUs should be used for this.

114 SIF8076 Planl/drift av IT-syst114 SIF8076 Planl/drift av IT-syst Del VII Casestudie: Backup

115 SIF8076 Planl/drift av IT-syst115 Situasjonsbeskrivelse Brevjournalen var korrupt Kjører på SQL-server Backup fra de to siste dagene korrupt Lignende har skjedd to ganger tidligere Måtte rekonstruere for to dager Journalen skulle vært faset ut 0,01% av systemet har 50% av feilene

116 SIF8076 Planl/drift av IT-syst116 Eksisterende system DatabaseBrukerBackup1 Backup2 Alarm!

117 SIF8076 Planl/drift av IT-syst117 Problemfaktor 1 Backupen er drevet rent reaktivt – det vil si at man korrigerer og justerter etter feil; men man er uten kvalitetskontroll før situasjonen har nådd en kritisk grense. Ingen brannøvelser.

118 SIF8076 Planl/drift av IT-syst118 Problemfaktor 2 Implementering og igangsetting av databasen skjedde uten hensyn til innspill fra drift, innen områder som teknologivalg og driftskostnader. Databasen var ’gratis’.

119 SIF8076 Planl/drift av IT-syst119 Problemfaktor 3 Databasen måtte kjøre på et mer eller mindre selvstendig system – dels for å isolere dens egen ustabilitet, og dels fordi den forutsatte andre enn standard teknologivalg.

120 SIF8076 Planl/drift av IT-syst120 Problemfaktor 4 Kvaliteten på backup av databasen fikk lov til å bli redusert uten at det ble oppdaget og korrigert (hvis bare databasen selv fungerte).

121 SIF8076 Planl/drift av IT-syst121 Problemstilling 5 Ingen merket feilmeldingene fra den nattlige backupkjøringen i vrimmelen av andre daglige meldinger.

122 SIF8076 Planl/drift av IT-syst122 Mulig løsning 1 Introduser avhengighet! La databasen være avhengig av backup, slik at defekter i backup umiddelbart blir synlige.

123 SIF8076 Planl/drift av IT-syst123 Løsning 1a – diagram DatabaseBrukerBackup Trinn 1 kopiering Trinn 2 bytte

124 SIF8076 Planl/drift av IT-syst124 Løsning 1a - momenter 1. Tvinger evt backup til å være konsistent (ellers vil brukerne klage) 2. Men: detekterer ikke hvorvidt backup faktisk er tatt

125 SIF8076 Planl/drift av IT-syst125 Løsning 1b – diagram DatabaseBrukerBackup Trinn 1 kopiering Trinn 2 bytte Alarm1 Alarm2

126 SIF8076 Planl/drift av IT-syst126 Løsning 1b – momenter 1. Som løsning 1a, samt En alarm detekterer om backup ikke tas – og varsler brukerne 3. For å sikre seg mot at alarmen slutter å virke, kan man legge til enda en alarm som sjekker den første. 4. Men: kan ikke sikre seg at ikke alle alarmene slutter å virke på en gang

127 SIF8076 Planl/drift av IT-syst127 Løsning 1c – di agram DatabaseBrukerBackup Trinn 1 kopiering Trinn 2 bytte Alarm1Alarm2

128 SIF8076 Planl/drift av IT-syst128 Løsning 1c – momenter 1. Som løsning 1b, samt Alarmene er uavhengige av hverandre (helst på to ulike OS) 3. Alarmene er symmetriske (dvs at de vokter på hverandre) 4. Alarmene går til noen som vil reagere, dvs brukerne

129 SIF8076 Planl/drift av IT-syst129 Fire strategier for feilretting 1. Korrigere før feilen oppstår 2. Automatisk korrigere idet feilen oppstår 3. Manuell korrigering når de første symptomene melder seg 4. Opprydding når problemet er blitt merkbart

130 SIF8076 Planl/drift av IT-syst130 Kostnader Nede tid Utgifter

131 SIF8076 Planl/drift av IT-syst131 Akkumulative feil En kritisk feilsituasjon har sjelden bare ett enkelt problem som årsak. Dersom problemer korrigeres ASAP, kan man hindre at de blir delårsaker i komplekse feilsituasjoner.

132 SIF8076 Planl/drift av IT-syst132 SIF8076 Planl/drift av IT-syst Del IX Konfigurering av maskiner

133 SIF8076 Planl/drift av IT-syst133 Det går fort i databransjen ”Today, disk is so cheap that it is not uncommon for even personal workstations to have several GB of local storage”

134 SIF8076 Planl/drift av IT-syst134 Maskinprofil Anslått bruk Avhenger av hardware Avhenger av tilknytning til datanett Organisatorisk avhengig Økonomiske følger Historikk i driftsorganisasjonen

135 SIF8076 Planl/drift av IT-syst135 Fire hovedprofiler 1. Selvstendig maskin 2. PC sammenknyttet med nettjenester 3. PC avhengig av nettjenester 4. Tynn klient 5. Supertynn klient

136 SIF8076 Planl/drift av IT-syst Selvstendig PC Alle nødvendige data er lokale, men kan bruke nettjenester i den grad de er oppe. Kan klare seg uten nett. Bruksområde: tjenere, hjemme-PC, spesialsystemer, testsystemer, bærbare.

137 SIF8076 Planl/drift av IT-syst PC med nettjenester Alle systemfiler og de fleste applikasjonene er lagret lokalt, men er typisk konfigurert til å hente brukerdata, tjenester etc fra nett Bruksområder: kontor-PC, hjemme-PC med nett, regneressurser og ’robuste’ sal-PC’er.

138 SIF8076 Planl/drift av IT-syst Nettbasert PC Lokalt ligger det kun data for å boot’e maskinen, samt temporære filer, de fleste maskinspesifikke filer og svært ofte brukte filer. Bruksområde: sal-PC, kontor-PC, regneressurser, PC som tynn klient.

139 SIF8076 Planl/drift av IT-syst (Super)tynne klienter Maskinen har lite persistent minne, og det brukes hovedsaklig som BIOS for bootstrapping, evt som basalt operativsystem. Bruksområde: sal-PC og kontor-PC der man har klart definerte behov.

140 SIF8076 Planl/drift av IT-syst140 Valg av hardware – momenter Egnethet for bruk Variantbegrensning Standardkomponenter HMS-krav Merkantile krav Organisatorisk strategi

141 SIF8076 Planl/drift av IT-syst141 Variantbegrensning Begrenser fokus (og kostnader) for drift Helst 1-3 modeller til enhver tid Aktualitet for modell min 3-4 mnd Helst max 20 modeller over levetid Må dekke både høy- og lav-ende Styrt overfasing til nye modeller

142 SIF8076 Planl/drift av IT-syst142 Standardkomponenter Må ha std grensesnitt (kontakter) Ombytting, gjenbruk, oppdatering Drivere og spesifikasjon tilgjengelig Gir pris- og kvalitetskontroll

143 SIF8076 Planl/drift av IT-syst143 HMS-krav Støy (vifter og harddisk). Variabel? Stråling, spesielt skjerm Ergonomi Okkupert bordplass Brannfare Kabling

144 SIF8076 Planl/drift av IT-syst144 Merkantile krav Pris/ytelse Garanti, service og reservedeler Levering, dagbøter, logistikk, emballasje Kontakt med salgsledd Tilgang til duplikate system Avtaler

145 SIF8076 Planl/drift av IT-syst145 Former for lokale data Persistente data Semiperm. data Temporære data Maskin- spesifikke Privat kryptonøkkel LoggerSwapspace System- spesifikke OS- programvare Kjerne Organisa- toriske data KA-malermotd Personlige data E-post Mellomlagra filer /tmp-filer Globale data Distribuert lager FTP-område Parallell- prossesering

146 SIF8076 Planl/drift av IT-syst146 Lagring lokalt/sentralt Lokal lagring. Dataene ligger kun på lokal disk, hver maskin sin original. Lokal speiling. Originalen ligger ett felles sted, men blir kopiert ned systematisk (f.eks hver natt). Fjernbruk. Dataene brukes etter behov fra et sentralt lager.

147 SIF8076 Planl/drift av IT-syst147 Fordeling av diskplass Operativsystem Swapping-område Semitemporære systemdata (logger) Applikasjoner Brukerdata (permanent/tmp) Informasjonsdatabaser Eksporterte data

148 SIF8076 Planl/drift av IT-syst148 Operativsystem Generert fra originalversjon Kan oppdateres automatisk Bør sette av plass til neste versjon Trenger ikke å ta backup Bør ligge lokalt

149 SIF8076 Planl/drift av IT-syst149 Swapping-område Bedre med for mye enn for lite Tommelfingerregel 2-3 ganger RAM Rent temporært Aldri backup Alltid lokalt dersom mulig

150 SIF8076 Planl/drift av IT-syst150 Semitemporære systemdata Logger og andre genererte data Bør tas backup av hvis logger Sett av godt med plass! Separeres fra andre data

151 SIF8076 Planl/drift av IT-syst151 Lokale brukerdata Bør være kun for temporære data Bruker bør være oppmerksom på hvorvidt det tas backup Bør ikke blandes med systemdata

152 SIF8076 Planl/drift av IT-syst152 Netteksporterte data fra klient Distribuert lagersystem Bør kunne kutte ut backup Kan aldri stole på at det er oppe Salderingspost for diskplass

153 SIF8076 Planl/drift av IT-syst153 Informasjonsbaser Databaser og konfigurasjonsfiler Bør autogenereres fra master, eller ha backup hvis systemgenerert Bør ligge separat fra operativsystem

154 SIF8076 Planl/drift av IT-syst154 Principle 12 Separation I Data which are separate from the operating system should be kept in a separate directory tree, preferably on a separte disk partition. If they are mixed with the operating system file-tree it makes re-installation or upgrade of the operating system unnescessarily difficult.

155 SIF8076 Planl/drift av IT-syst155 Principle 13 Separation II Data which are logically separate belong in separate directory trees, perhaps on separate diskpartitions.

156 SIF8076 Planl/drift av IT-syst156 Forskjell tjener/klient RCS av konfigfiler Generell backup Spesielle tjenester Redundans Fallback-mekanisme Feilsøking Overvåking Regenerering Reinstallering Slå dem helst av Kjøp nytt, reinstaller Reinstaller 1.trinn: reinstaller Overvåking

157 SIF8076 Planl/drift av IT-syst157 Principle 14 Separation III Independent systems should not interfere with one another, or be confused with one another. Keep them in separate storage areas.

158 SIF8076 Planl/drift av IT-syst158 Suggestion 3 Vigilance Be on the lookout for software which is configured, by default, to install itself on top of the operating system. Always check the destination using make –n install before actually committing to an installation. Programs which are replacements for standard operating system components often break the principle of separtion.

159 SIF8076 Planl/drift av IT-syst159 Principle 15 Limited privilege No process of file should be igiven more privileges than it needs to do its job. To do so is a security hazard.

160 SIF8076 Planl/drift av IT-syst160 Principle 16 Temporary files Temporary files or sockets which are opened by any program should not be placed in any publicly writable directory like /tmp. This opens for the possibility of race conditions and symbolic link attacks. If possible, configure them to write to a private directory.

161 SIF8076 Planl/drift av IT-syst161 Principle 17 Flagging customization Customizations and deviations from standards should be made conspicuous to users and administrators. This makes the system easier to understand for ourselves and our successors.

162 SIF8076 Planl/drift av IT-syst162 Spesial-maskiner Utfører en tjeneste enkelt og effektivt Ofte lette å drive Fungerer ofte som en ’black box’ Avhengig av prod. for oppgradering Avhengig av prod. for sikkerhetspatcher Øker variasjonen

163 SIF8076 Planl/drift av IT-syst163 SIF8076 Planl/drift av IT-syst Del X Konfigurering av maskiner II

164 SIF8076 Planl/drift av IT-syst164 Forskjell tjener/klient RCS av konfigfiler Generell backup Spesielle tjenester Redundans Fallback-mekanisme Feilsøking Overvåking Regenerering Reinstallering Slå dem helst av Kjøp nytt, reinstaller Reinstaller 1.trinn: reinstaller Overvåking

165 SIF8076 Planl/drift av IT-syst165 Fordeler med RCS (el.l) Inneholder historiske data Angir hvem som endret hva Angir eksakt hva som var endret Angir tidspunkt for endring Låsemekanisme for filene

166 SIF8076 Planl/drift av IT-syst166 Principle 14 Separation III Independent systems should not interfere with one another, or be confused with one another. Keep them in separate storage areas.

167 SIF8076 Planl/drift av IT-syst167 To vinklinger Slik driftsansvarlig ønsker å se tingene: systematisk og adskilt Slik brukerne (og programmene) ønsker å se tingene: Blandet sammen til ett felles system

168 SIF8076 Planl/drift av IT-syst168 Suggestion 3 Vigilance Be on the lookout for software which is configured, by default, to install itself on top of the operating system. Always check the destination using make –n install before actually committing to an installation. Programs which are replacements for standard operating system components often break the principle of separtion.

169 SIF8076 Planl/drift av IT-syst169 Inst.skripts: problemer Åpner på tilgang til filer Legger inn brokker i konfig.filer og i databaser Slår på demoner og innstillinger Gir privilegier til egne programmer (som ikke er sikkerhetsklarert)

170 SIF8076 Planl/drift av IT-syst170 Principle 15 Limited privilege No process of file should be given more privileges than it needs to do its job. To do so is a security hazard.

171 SIF8076 Planl/drift av IT-syst171 Kostnader og sikkerhet Tidsmessig avveining Krever høy kompetanse Sikkerhet er ren ”utgift” Trenger brukeren sikkerheten?

172 SIF8076 Planl/drift av IT-syst172 Principle 16 Temporary files Temporary files or sockets which are opened by any program should not be placed in any publicly writable directory like /tmp. This opens for the possibility of race conditions and symbolic link attacks. If possible, configure them to write to a private directory.

173 SIF8076 Planl/drift av IT-syst173 Principle 17 Flagging customization Customizations and deviations from standards should be made conspicuous to users and administrators. This makes the system easier to understand for ourselves and our successors.

174 SIF8076 Planl/drift av IT-syst174 Spesial-maskiner Utfører en tjeneste enkelt og effektivt Ofte lette å drive Fungerer ofte som en ’black box’ Avhengig av prod. for oppgradering Avhengig av prod. for sikkerhetspatcher Øker variasjonen

175 SIF8076 Planl/drift av IT-syst175 SIF8076 Planl/drift av IT-syst Del X Brukeradministrasjon

176 SIF8076 Planl/drift av IT-syst176 Brukeradm en egen dimensjon Applikasjoner OS og hardware Brukere

177 SIF8076 Planl/drift av IT-syst177 Brukerdimensjonen Uavhengig av tilgjengelige applikasjoner Uanhengig av hvilke maskiner som kjører hvilke OS og har hvilken HW Uavhengig av suborganisasjon Uavhengig av geografi

178 SIF8076 Planl/drift av IT-syst178 Principle 18 Distributed accounts Users move around from host to host, share data and collaborate. They need easy access to data and workstatios all over an organization.

179 SIF8076 Planl/drift av IT-syst179 Lokale adminbrukere Gir bruker privs på én maskin En viss sikkerhetsrisiko Tidvis eneste utvei ’Privilegier under ansvar’ Gjør dem oppmerksom på sitt ansvar... (og få det skriftlig)

180 SIF8076 Planl/drift av IT-syst180 Brukerdatabase Felles brukerkonto ’overalt’ Felles passord ’overalt’ Kobles til autorativ database Unngå upersonlige brukere Bør ikke inneholde klartekst-passord

181 SIF8076 Planl/drift av IT-syst181 Suggestion 4 Passwords Give users a common username on all hosts, of no more than eight characters. Give them a common password on all hosts, [...]

182 SIF8076 Planl/drift av IT-syst182 Valg av passord Ha en minimum lengde Krev noen spesialtegn Forby bruk av ordliste-ord La brukeren selv velge passord Bruk vanskelige førstepassord Let etter gjettbare passord Tving frem regelmessige passordskift

183 SIF8076 Planl/drift av IT-syst183 Bør brukeren velge passord? Ja: Lettere huske, unødvendig å skrive ned, kan gjenbrukes på flere systemer. Nei: Gjenbrukes på usikre systemer, Kan velge dårlige passord, kan beholde samme passord lenge.

184 SIF8076 Planl/drift av IT-syst184 Principle 19 Environment It should always be clear to users which host they are using and what operating system they are working with. [...]

185 SIF8076 Planl/drift av IT-syst185 Oppstartsmiljø Enkelt, er bare et startpunkt Utbyggbart for brukeren Må dekke de flestes behov Koble tilbake ifm feilsøking/retting Bør ligge lokalt (må for sysadm) Være adskilt fra OS Adskill programoppsett fra brukere

186 SIF8076 Planl/drift av IT-syst186 Suggestion 5 Clear prompts Try to give users a command prompt which includes the name of the host they are working on. [...]

187 SIF8076 Planl/drift av IT-syst187 Suggestion 6 Unix shell defaults Avoid the host-wide files for shell setup in /etc. [...] Use an over-ridable include strategy in the user’s own shell setup to read in global defaults. [...]

188 SIF8076 Planl/drift av IT-syst188 Typer av brukere Passive brukere. Godtar de de får. Aktive brukere. Bevisste om hva de vil ha. Eksperimenterer og konfigurerer. Finner feil og problemstillinger. Hjelpsomme brukere. Gir fornuftige feilmeldinger, og reparerer ting selv.

189 SIF8076 Planl/drift av IT-syst189 Suggestion 7 Problem users Keep a separate partition for problem users’ home directories, so thay they only cause trouble for one another, not for the more considerate users.

190 SIF8076 Planl/drift av IT-syst190 Hjemmekatalogpartisjoner Geografisk nær bruker Adskille etter brukerprofil Større adm overhead Mindre optimal diskutnyttelse

191 SIF8076 Planl/drift av IT-syst191 Fjerning av filer Slette de største filene Slette de eldste (uleste) filene Slette de avledede filene Komprimere filene Flytte filene (se om noen klager) Kjøpe mer diskplass (dvs jukse )

192 SIF8076 Planl/drift av IT-syst192 Diskkvoter Hard-limits. Kan ikke bruke over denne grensen – får ikke laget nye filer. Soft-limits. Får bare advarsel når grensen overskrides. Peer pressure. Offentliggjør hvem som bruker hvor mye diskplass. La parisjonene begrense plassbruken.

193 SIF8076 Planl/drift av IT-syst193 Sletting av brukere Ta backup Gi en ’grace period’ Sett metadata (f.eks uid) i karantene Ta vare på metadata Sett opp evt forward – tidsavgrenset

194 SIF8076 Planl/drift av IT-syst194 Principle 20 Freedom Quotas, limits and restrictions tend to antagonize users. Users place a high value on personal freedom. Restrictions should be minimized. Workaround solutions which avoid rigid limits are preferable, if possible.

195 SIF8076 Planl/drift av IT-syst195 Sysadm-ettikette Ikke se umotivert på personlige data Informer når du har ’snoket’ Anonymiser logger om mulig Ikke gi info videre uten god grunn Sky personkonflikter

196 SIF8076 Planl/drift av IT-syst196 Disiplinærsaker Undersøk før du handler Før en logg over saken Ta kopi av data – frys situasjonen Informer brukeren La brukeren forklare seg Hvis i tvil, dytt saken opp/bortover Ikke rot med småsaker...

197 SIF8076 Planl/drift av IT-syst197 Principle 21 Mind control Computers have a perceived authority. We need to be ont he look-out for abuses of that authority, whether by accident or by design.

198 SIF8076 Planl/drift av IT-syst198 Mistro datamaskinen Klokka kan være feil Meldingene kan være gamle Noen kan ha ’mekket’ på loggene Systemet kan ha selv-krasjet Noen kan ha misbrukt brukerid’en Noen kan ha blitt feilidentifisert

199 SIF8076 Planl/drift av IT-syst199 SIF8076 Planl/drift av IT-syst Del XI Modeller for nettverksadministrasjon

200 SIF8076 Planl/drift av IT-syst200 De fire veiene 1. Reboot (brute force) 2. Manuelt (hele folket i arbeid) 3. Kontroll (Stasi-metoden) 4. Immunologi (’selvreparasjon’)

201 SIF8076 Planl/drift av IT-syst201 Reboot-metoden Dersom noe ikke virker, hopp over all feilsøking (for denslags har vi ikke tid til) og reinstaller i stedet maskinen. Test at det virker og friskmeld.

202 SIF8076 Planl/drift av IT-syst202 Reboot-metoden – fordeler Enkelt, trenger lite kompetanse Rask å utføre, lav TTR

203 SIF8076 Planl/drift av IT-syst203 Reboot-metoden – ulemper Lav grad av proaktivitet Skalerer dårlig (lineært) Håndterer klasse-feil dårlig Gir liten systeminnsikt Fungerer dårlig for tjenere

204 SIF8076 Planl/drift av IT-syst204 Manuell drift Ansett ’tilstrekkelig’ med folk, la dem ta hver sin del av systemet (eller samarbeide om det). Gi dem nærmest full frihet, og la dem selv finne frem til sine egne arbeidsformer.

205 SIF8076 Planl/drift av IT-syst205 Manuell drift – fordeler Ypperlig i små systemer Kan virke godt for subsystemer Stor frihet for den enkelte Kan fungere som ’nærdrift’

206 SIF8076 Planl/drift av IT-syst206 Manuell drift – ulemper Vanskelig å fase inn nye folk Åpner for personlige (u)vaner Lett for å ’partisjonere’ systemene Vanskelig å styre ovenfra Vanskelig å linjedele driften

207 SIF8076 Planl/drift av IT-syst207 Kontrollmetoden Kjøp et verktøy for å drive maskinene. La verktøyet overvåke alt som skjer, og si ifra hva som må gjøres. Konfigurer systemet gjennom verktøyet, og la alle ansatte bruke det, og bare det.

208 SIF8076 Planl/drift av IT-syst208 Kontrollmetoden – fordeler Enkelt å anskaffe (kan kjøpes) Gir et felles rammeverk Skalerer sublineært Kan linjedeles (operatør/sysadm) Enkelt å skaffe nye folk

209 SIF8076 Planl/drift av IT-syst209 Kontrollmetoden – ulemper Ufleksibelt rammeverk Skjuler kompleksitet ’Information overflow’ Binder opp mot teknologivalg Begrenset/endelig funksjonalitet Fordrer at ’databasen’ ikke blir korrupt

210 SIF8076 Planl/drift av IT-syst210 Immunologi Systemet skal settes opp inkrementelt av sysadm til å fikse problemer som måtte oppstå. Når et nytt problem oppstår, så fikses det generelt, og løsningen gjøres gjeldende for alle maskiner til all tid. Sysadm jobber bare med de ’nye’ problemene.

211 SIF8076 Planl/drift av IT-syst211 Immunologi – fordeler Gjenbruk av løsninger Kort TTR Bare ’interessante’ jobber Sterk sublineær skalering Automatisert (uten manuell intervensjon) Rette feil ’en gang for alle’

212 SIF8076 Planl/drift av IT-syst212 Immunologi – ulemper Krever mye lokal konfigurering Skaper nye komplekse systemer Begrenser endringstakten Brute-force løsning på en del problemer (selv om den er automatisert) Vanskelig å fase inn nye folk Krever høy grad av kompetanse

213 SIF8076 Planl/drift av IT-syst213 Løsningsforslag Hent elementer fra alle fire metoder Vektlegg endringshåndtering Vektlegg kommunikasjon Vektlegg dokumentasjon

214 SIF8076 Planl/drift av IT-syst214 SIF8076 Planl/drift av IT-syst Del XII Installasjonssystemer

215 SIF8076 Planl/drift av IT-syst215 De fire driftsmetodene Manuelt fikset Automatisk fikset Manuell detektering Automatisk detektering Manuell drift Reboot- metoden Kontroll- metoden Immunologi

216 SIF8076 Planl/drift av IT-syst216 ”Immunologi” Nokså ny metode Analogi med kroppen Desentralisert/lokalt fokus Inkrementelle forbedringer Konvergens mot ønsket tilstand Oppnå balanse på systemet

217 SIF8076 Planl/drift av IT-syst217 Immunologi: konvergens Korrigering består av flere deloppgaver Hver deloppgave fikser litt Tilsammen konverger det

218 SIF8076 Planl/drift av IT-syst218 Tilstandsmodell Ønskelige tilstander Fungerende tilstander Bootbare tilstander Kjørbare tilstander Mulige tilstander Obs: bare en Tilnærming!

219 SIF8076 Planl/drift av IT-syst219 Tilstandsmodell II Datamaskiner er digitale Har et endelig antall ulike tilstander Også: N-dimensjonalt rom Persistent minne (overlever boot) Temporært minne (resettes ved boot) Relevant minne (det som betyr noe)

220 SIF8076 Planl/drift av IT-syst220 Immunologi, eksempel OK tilstander Feiltil- stand 1 Feiltil- stand 2 1.For alle relevante problemer, definer en korrigerende aksjon på forhånd. 2.Prosesser alle korrigerende aksjon som trengs å kjøres. 3.Gjenta dette inntil en OK tilstand er nådd; dvs konvergering. Kombina- sjonsfeil

221 SIF8076 Planl/drift av IT-syst221 Immunologi Dyrt å forberede/sette opp Umulig å bli ”ferdig” (alltid enda et problem som må håndteres) Bør operere på et stabilt/låst system (dvs unngå bevegelige mål) Kan løpe løpsk

222 SIF8076 Planl/drift av IT-syst222 Tilnærmelser til problemet Automatisk fikse enkeltproblemer med lokal fokus Sentralstyrt uniformering Drift à la reguleringsteknikk Drift à la genetisk programmering

223 SIF8076 Planl/drift av IT-syst223 Inst- og driftssystemer Aksjons- basert Tilstands- basert Monolittisk Sammen- satt Økende nytteverdi i vedlikehold Økende nytteverdi av gjenbruk Automagisitet Keyboard recording Scripts Ghost Store cfengine Win install

224 SIF8076 Planl/drift av IT-syst224 Push og pull... Push er initiert fra sentral maskin. Gir oversikt, enkle nettverk og muliggjør en hierarkisk arbeidsform. Pull er initiert fra desentrale klienter. Gir lokal autonomitet, asynkronitet og muliggjør anarkistisk arbeidsform.

225 SIF8076 Planl/drift av IT-syst225 Hovedelementer push/pull TjenerKlient Database over filer som skal distribueres Konfigura- sjonsfiler Initiativ til oppstart

226 SIF8076 Planl/drift av IT-syst226 Push/pull – diagram Lokale konfigfiler Sentrale konfigfiler Sentalt initiativ Lokalt initiativ Pull Push rdist track cfengine store (Kontroll- problem) (Kaotisk vedl.ansvar)

227 SIF8076 Planl/drift av IT-syst227 Principle 22 Homogeneity/Uniformity I System homogeneity or uniformity means that all hosts appear to be essentially the same. This makes hosts predictable [...].

228 SIF8076 Planl/drift av IT-syst228 Uniformitet – avvik Inkrementelle innkjøp Paritsjonering av ressurser Ulike bruksprofiler Duplisering/fall-back Distribuering/cache’ing Ekstra ytelse

229 SIF8076 Planl/drift av IT-syst229 Maskinressurser En maskin - en jobb En maskin til alt og alle Generelle maskiner Spesielle maskiner Billigere (?) Optimalisert Kompleksitet i variasjon For helt spesielle oppgaver Kompleksitet i mengde Strømlinje- forming Regnesenter- modellen

230 SIF8076 Planl/drift av IT-syst230 Suggestion 8 Delegation II For large number of hosts, distributed over several locations, consider a policy of delegation responsibility to a local administrator with closer knowledge of the hosts’ patterns of usage. [...]

231 SIF8076 Planl/drift av IT-syst231 Delegering Kan forholde seg til maks 150 personer Kan forholde seg til ca 7 ’ting’ samtidig Anta: 4000 maskiner med 200 konfigurasjoner og 3000 ’varierte’ brukere

232 SIF8076 Planl/drift av IT-syst232 Delegering – løsningsrom Deleger ansvar nedover Del opp organisasjonen Standardisér brutalt Kvitt deg med noen av oppgavene Out-sourcing av oppgavene

233 SIF8076 Planl/drift av IT-syst233 SIF8076 Planl/drift av IT-syst Del XIII Eksempler på installasjons- og driftssystemer

234 SIF8076 Planl/drift av IT-syst234 Eksempler Track Rdist Store Cfengine

235 SIF8076 Planl/drift av IT-syst235 Track Mekanisme: pull Domene: alle typer filer Autonome lokale systemer Lokal konfigurasjonsfil

236 SIF8076 Planl/drift av IT-syst236 Rdist Mekanisme: push Domene: alle typer filer Sentralisert konfigurasjon Sentralisert fil-database Klienter må stole på tjener

237 SIF8076 Planl/drift av IT-syst237 Store Mekanisme: pull Domene: kun tredjepartsapplikasjoner Støtter multiple versjoner/arkitekturer Autonome maskingrupper Distribuert fil-database

238 SIF8076 Planl/drift av IT-syst238 Cfengine Mekanisme: pull Domene: alle typer filer Sentralisert fil-database Sentralisering av konfig-filer Innebygging av mekanismer

239 SIF8076 Planl/drift av IT-syst239 SIF8076 Planl/drift av IT-syst Del XIV Stabil infrastruktur og høy tilgjengelighet

240 SIF8076 Planl/drift av IT-syst240 Høy tilgjengelighet – spørsmål 1. Hvilke oppgaver er prioritert? 2. Hva er akseptabel nedetid-lengde? 3. Hva er kostnadene ved nedetid? 4. Hvor hyppig kan man tåle nedetid? 5. Hvor mye er man villig til å investere for å få opp nedetiden? 6. Hvilke oppgaver er irrelevante?

241 SIF8076 Planl/drift av IT-syst241 Kostnader ved høy oppetid Pris Økende oppetid Driftskostnad Nytteverdi

242 SIF8076 Planl/drift av IT-syst242 Corollary 25 Redundancy Reliability is safeguarded by redundancy, or backup services running in parallel, ready to take over at a moment’s notice.

243 SIF8076 Planl/drift av IT-syst243 Tre typer redundans 1. Failover – sømløs overgang fra en komponent til annen som er lik. 2. Backup – (ikke-automatisk) overgang til en reserveenhet som ikke er i bruk. 3. Duplisering – flere enheter som løser samme oppgave, og som kan dekke opp for hverandre.

244 SIF8076 Planl/drift av IT-syst244 Hva redundans ikke er! Kjøp dobbelt så mange... – og skift dem halvparten så ofte. Kjør to instanser av samme program Erstatning for ikke å monitorere Garanti for at noe går galt Vedlikeholdsfritt... (dvs, må testes!)

245 SIF8076 Planl/drift av IT-syst245 Stabil infrastruktur Forenkling og lavere kompleksitet Forutsigbarhet Historikk Gode valg og planlegging Monitorering Abstraksjon og generalisering Dok og rutiner Ver-kontroll og problemdatabase Kompetanse Logger, SNMP etc

246 SIF8076 Planl/drift av IT-syst246 Principle 28 Abstraction generalizes Expression tasks in an operating-system independent language reduces time spent debugging, promotes homogeneity and avoids unnecessary repetition.

247 SIF8076 Planl/drift av IT-syst247 Monitorering ved feilover Single point of failure Bruker- problem Feil- retting Automatisk failover Brukerne merker ingenting Loggføring Monitorering Feil

248 SIF8076 Planl/drift av IT-syst248 Drift i 24x7 Failover på alt utstyr Monitorering av ’alle’ feil Tidligst mulig varsling Vaktordning Høy kompetanse Rutiner for alle situasjoner Godt dokumentert system

249 SIF8076 Planl/drift av IT-syst249 Principle 24 Reliability Any model of system infrastructure must have reliability as one of its chief goals. Down-time can often be measured in real money.

250 SIF8076 Planl/drift av IT-syst250 Det man ikke tenkte på.... Strømaggregat Flere disker går samtidig Redundant kabling i samme kabelgate Når det klikker for noen Skattemyndighetene & Co Diverse ’katastrofer’

251 SIF8076 Planl/drift av IT-syst251 Corollary 27 Reproducibility Avoid improvising system modifications, on the fly, which are not reproducible. It it easy to forget what was done [...]

252 SIF8076 Planl/drift av IT-syst252 Kombinering av systemer Høy Lav Samme OS Felles opsys- base Felles Appl.- base home dirs Felles bruker DB NetBSD cfengine store samba BDB Tetthet av integrasjon

253 SIF8076 Planl/drift av IT-syst253 Sjekkliste for høy oppetid Fungererer alt etter neste boot? Kan du minste en hvilke som helst maskin uten tap av tjenester? Hvor lang tid bruker en fremmed på å lære seg systemet ditt? Er alt dokumentert? Har du single-points-of-failure?

254 SIF8076 Planl/drift av IT-syst254 Sjekkliste II Har du tilstrekkelig backup Har du fjernlagret backup Hvor flytter du når alt brenner ned? Når sjekket du backup’en sist? Finnes det ansatte du ikke kan klare deg uten (og driver de med ekstremsport)?

255 SIF8076 Planl/drift av IT-syst255 Sjekkliste III Er du sikret mot innbrudd? Hvilke eksterne tjenester er du helt avhengig av? Hvor raskt kan du få byttet komponenter i systemet ditt? Har du ’disasters waiting to happen’? Har du en katastrofeplan?

256 SIF8076 Planl/drift av IT-syst256 Noen nyttige verktøy SNMP – monitorering over nett RCS/CVS – revisjonskontroll av filer Logganalysator for å detektere unormaliteter tcpdump – monitorere nettrafikk

257 SIF8076 Planl/drift av IT-syst257 SIF8076 Planl/drift av IT-Syst Del XIV Konfigurguering, installasjon og vedlikehold

258 SIF8076 Planl/drift av IT-syst258 Tre aktiviteter Konfigurering – tilpassing av en installasjonsbase for et sett maskiner Installering – opplasting av installasjonsbase til en ny maskin Vedlikehold – daglig kamp for å holde seg i målområdet og rette opp problemer som måtte ha oppstått

259 SIF8076 Planl/drift av IT-syst259 Principle 30 Disorder All systems will eventually tend to a state of disorder unless a rigid and automated policy is maintained.

260 SIF8076 Planl/drift av IT-syst260 Kaos og uorden KaosOrden Feil- akkumu- lering Divergens Variasjon Mange personer Rutiner Automatisering Variant- begrensning Feil- reduksjon Bitråte Automatisk oppdating Dokumentering

261 SIF8076 Planl/drift av IT-syst261 Feilakkumulering Feil som far lov til ‘overleve’, fordi de ikke er kritiske Feil der symptomene er undertrykket, uten at feilen er rettet Kombinasjonsfeil, der bare noen av delkomponentene er rettet Feil i sovende systemer

262 SIF8076 Planl/drift av IT-syst262 Virkningen av feil Systemets oppetid (under enkelte forutsetninger): 1. Senke M og øke N 2. Redusere hyppighet og levetid. 3. Fjerne unødvendig funksjonalitet

263 SIF8076 Planl/drift av IT-syst263 Redusere en feils levetid Feil Feil- retting Tilbake- melding 1.Automatisere deteksjon av kjente feil 2.Automatisere retting av kjente feil 3.Ikke vente på feilmelding fra bruker Feilsøk Feil- melding Forvarsel Bruker symptom Logg- melding Autofiksing

264 SIF8076 Planl/drift av IT-syst264 Redusere en feils hyppighet 1. Unngå symptombehandling, finn heller den virkelige årsaken til feilen. 2. Rett mer enn en forutsetning for at feilen skal opptre igjen. 3. Introduser redundans i systemet og monitorer denne jevnlig.

265 SIF8076 Planl/drift av IT-syst265 Dele opp i subsystemer Introduser heller flere ‘uavhengige’ subsystemer Reduser antallet kritiske komponenter i hvert subsystem Dvs: fjern avhengighetene mellom komponentene

266 SIF8076 Planl/drift av IT-syst266 Forflytt funksjonalitet Feil har ‘følger’ bare i operativ fase Flytt funksjonalitet ut av denne Revurder helautomatisk konfigurering, uten manuell overvaking KonfigureringInstallasjonDriftsfase PlanleggingOperativt

267 SIF8076 Planl/drift av IT-syst267 Fjern funksjonalitet Dersom ressursene er knappe og oppgavene mange, så se på hvilke oppgaver du ikke trenger å gjøre, og refokuser frigjorte ressurser.

268 SIF8076 Planl/drift av IT-syst268 SIF8076 Planl/drift av IT-syst Preventivt vedlikehold

269 SIF8076 Planl/drift av IT-syst269 To typer preventivt vedlikeh. Forbruksbasert. Vedlikehold på komponenter som har en levetid eller som brukes opp (f.eks ifm skrivere). Likevektsbasert. Vedlikehold på systemer med en endelig mengde ressurser som skal deles (f.eks ifm kjøring på datamaskin). Kommunikasjonsmessig.

270 SIF8076 Planl/drift av IT-syst270 Forbruksbasert 1. Monitorer levetiden vs forbruket 2. Monitorer bruken vs feilmeldinger 3. Estimer ’optimalt’ tidspunkt for skifte av forbruksdeler 4. Unngå lagerhold av rekvisita 5. Fyll på i store kvanta

271 SIF8076 Planl/drift av IT-syst271 Skrivere på IDI Ca 30 skrivere Ca modeller Spredd på 11 blokker i 5 bygg Bruker 2 mill ark i året Toner for pr år Feil fra 1/100 til 1/ sider

272 SIF8076 Planl/drift av IT-syst272 Spørsmål ifm skriverbruk 1. Hvem skriver ut hvor mye? 2. Hva koster hver side? 3. Hva er MTBF? 4. Hva er TTR? 5. Har skriverne kvalitetssenkning? 6. Hvor mye er feilutskrifter? 7. Hvor mye er ’unødvendig’ utskrift?

273 SIF8076 Planl/drift av IT-syst273 Vedlikeholdsbasert Preventivt vedlikehold AUP Ressurs- forbruk Stikk- prøver Garbage- collection Fokus på funksjonalitet

274 SIF8076 Planl/drift av IT-syst274 Acceptable Use Policy Hvem har ansvar Hvem er delegert ansvaret Hvem gjelder denne AUP for Hva kan man bli utsatt for Hvilke plikter har man Hvilke retter har man Hva skal man rapportere Hvilke sanksjoner kan man bli utsatt for Klagemuligheter Verdiområde Brukers underskrift Hvem er utsteder Når er AUP gitt

275 SIF8076 Planl/drift av IT-syst275 AUP – momenter Bør være generell og prinsippiell Følges av en veiledning Må være kjent for alle Må følges opp (ellers kan den miste sin kraft siden den er sovende)

276 SIF8076 Planl/drift av IT-syst276 Grunnleggende forutsetninger Felles forståelse av driftsmålene Må være forberedt på det verste Brukerne må læres opp

277 SIF8076 Planl/drift av IT-syst277 Kriseplaner – minimum Kriseinnkjøp. Hvem kan bestille, og for hvor mye, og i hvilke tilfeller? Overtid. Hvem kan autorisere, hvor lenge og i hvilke tilfeller? Kritiske brukere. Hva slags prioritering finnes for brukere, programmer og ressurser?

278 SIF8076 Planl/drift av IT-syst278 Kommunikasjon Bruker DriftSjef/drift Sjef for bruker Ledd1Ledd2Ledd3 Hva får du høre av hvem?

279 SIF8076 Planl/drift av IT-syst279 For å bedre kommunikasjonen Etabler sosial kontakt Fortell en vits, slå av en prat Vær eksplisitt og still kontrollspørsmål Lytt og deretter gjenfortell Gå til kildene fremfor rykter Gi tilbakemelding (også god)

280 SIF8076 Planl/drift av IT-syst280 Noen tips... Besøk brukerne, spesielt de som er langt borte, lytt til problemene deres. Empati – forsøk å se det fra synspunktene til brukerne. Aksepter at brukerne en gang i blant kan være frustrerte og ha en dårlig dag.

281 SIF8076 Planl/drift av IT-syst281 Stikkprøver Hvem bruker hvor mye ressurser? Hvilke pakker ’går på nettet’? Hva står i loggene og i cron-mail? Hvilke maskiner er brukt hvor mye? Hvilke maskiner har sær utrustning?

282 SIF8076 Planl/drift av IT-syst282 Garbage collection To typer: Triggerbasert. Dvs at detekterer en uønsket situasjon. Tilstandsbasert. Dvs at man detekterer fravær av en ønsket tilstand. Uønsket situasjon Trigger Korrigering ’Noe’ er ikke rett Regen- erering Korri- gering

283 SIF8076 Planl/drift av IT-syst283 Mark om Garbage Collection Computer systems have no natural waste system. If computers were biological life, they would have perished long ago, poisoned by their own waste.

284 SIF8076 Planl/drift av IT-syst284 Fokus på funksjonalitet Er dette en prioritert oppgave? Kan vi fjerne/omgå hele oppgaven? Kan vi betale oss ut av problemet? Kan vi ’standardisere’ på noen enkeltløsninger?

285 SIF8076 Planl/drift av IT-syst285 Produktivitet og arbeid 1. Hvis traffikkork: 1. Flere ressurser 2. Mer restriksjoner 2. Hvis høy terskel 1. Færre restriksjoner 2. Fjerne(!) ressurser, men det er ingen god løsning. Restriksjoner Ress- urser LiteMange For lite Nok For høy dørterskel Trafik- kork Balanse

286 SIF8076 Planl/drift av IT-syst286 SIF8076 Planl/drift av IT-syst Feilsøking og -retting

287 SIF8076 Planl/drift av IT-syst287 Feilsøking – faser Feil- melding Reprod- usere Feil- isolering Verifi- sere RettingTesting Dobbelt- testing Dok

288 SIF8076 Planl/drift av IT-syst288 Feilmeldingsfasen Få tak i mest mulig info om problemet Skaff eksakte feilmeldinger Skaff skjermbilder/transaksjonslogg Forsøk å tolke hva feilmeldingen egentlig sier Hva mener brukeren burde ha skjedd? Hvilke kontekst skjedde det i?

289 SIF8076 Planl/drift av IT-syst289 To typer problemer Reproduserbare. De som du på kommando kan reprodusere. Ikke-reproduserbare. De som opptrer mer eller mindre sporadisk, og som du ikke kan fremkalle på kommando.

290 SIF8076 Planl/drift av IT-syst290 Ikke-reproduserbare feil Monitorer dem over tid. Iverksett en stresstest. Analyser deg frem til feilen

291 SIF8076 Planl/drift av IT-syst291 Reproduserbare feil Det er essensielt at du tidligst mulig i feilsøkingen kan reprodusere feilen ’på kommando’, det er det eneste som setter deg i stand til å verifisere at du har rettet problemet i ettertid.

292 SIF8076 Planl/drift av IT-syst292 Feilisolering Kikk på mellomformat Introduser ’print-setninger’ Sjekk opp loggene Analyser symptomene Single-step gjennom programmet Endre parametre og observer

293 SIF8076 Planl/drift av IT-syst293 Ulike årsaker Direkte årsak. Det som umiddelbart gjør at det ikke virker. Indirekte årsak. Det som forårsaker den direkte årsaken. Årsak Direkte årsak Indir. årsak

294 SIF8076 Planl/drift av IT-syst294 Verifisering 1. Rett feilen midlertidig 2. Verifiser at den forsvant 3. Fjern fiksen 4. Verifiser at feilen er kommet tilbake 5. Repeter etter behov Midl.- retting Testing Fjern fiksen Testing

295 SIF8076 Planl/drift av IT-syst295 Retting og testing Retting. Gjør rettingen permanent, og distribuer den til alle maskiner. Testing. Test på mer enn en måte, fokuser fra mer enn en vinkel. Dobbelttest og trippeltest. Dokumentasjon. Dokumenter hva du har gjort, og gi tilbakemelding til bruker

296 SIF8076 Planl/drift av IT-syst296 Vikting om testing! Noe du har gjort fungerer ikke fordi du har gjort det, men fordi du har test det, dobbelttestet det, og trippeltestet det.

297 SIF8076 Planl/drift av IT-syst297 Noe man ikke skal gjøre Undertrykke symptomene Rette en feil uten å forstå hvorfor den oppstår Rette bare midlertidig

298 SIF8076 Planl/drift av IT-syst298 SIF8076 Planl/drift av IT-syst Performance tuning

299 SIF8076 Planl/drift av IT-syst299 Ytelsesvurdering og feilsøking Feilsøking skal finne en feil som forårsaker bestemte symptomer. Ytelsesvurdering skal søke å forbedre respons og throughput i et mer eller mindre fungerende system.

300 SIF8076 Planl/drift av IT-syst300 Hva er ytelse... ? Total throughput Responstid for bruker Jevn (eller maksimal) tidsforbruk

301 SIF8076 Planl/drift av IT-syst301 Probl: snikende ytelsestap Nesten umerkelig degradering Brukerne ’lærer’ seg å leve med det Når terskelverdi for frustrasjon Ytelse Tid

302 SIF8076 Planl/drift av IT-syst302 Probl: automatiske mottiltak Ressursdeling (f.eks CPU) Degradert ytelse (f.eks virtuelt minne) Garantert ytelse (f.eks TCP)

303 SIF8076 Planl/drift av IT-syst303 Probl: Avhengigheter Høyt forbruk av en ressurs Bieffekter Dårlig ytelse på andre ressurser Fikse feil problem

304 SIF8076 Planl/drift av IT-syst304 Angrepsvinkler Modeller. Bruk metodene fra ytelsesvurdering. Ofte altfor komplekst. Monitorer. Ha målepunkter som er representative for ytelse, og følg med dem over tid. Teste. Bytt ut komponenter og se sjekk oppførsel under belastning.

305 SIF8076 Planl/drift av IT-syst305 Case: Introsalene 130 maskiner av 150MHz; 48MB; 1,3GB -> Kompilering av javaprogram: 65 sek -> Lokalt lagret programvare: 20 sek -> Med 128MB minne: 6 sek -> På terminaltjener: 2 sek

306 SIF8076 Planl/drift av IT-syst306 Case: prosesser på vier Prosesser som har løpt løpsk -> bruker CPU og systemkall Detekteres med systemkall-monitor Noen få prosesser ødelegger

307 SIF8076 Planl/drift av IT-syst307 Principle 37 Symptoms and cause Always try to fix problems at the source, rather than patching symptoms.

308 SIF8076 Planl/drift av IT-syst308 Det svakeste ledd En prosess trenger flere ressurser Ressursene er tilgjengelig i ulike monn Den minst tilgjengelige ressursen setter tempoet. Motorvei Kjerrevei Motorvei

309 SIF8076 Planl/drift av IT-syst309 Flaskehalshåndtering 1. Finn den for svakt dimensjonerte ressursen. 2. Begrens belastningen, og/eller øk ressursen. 4. Iterer til punkt 1 dersom nødvendig

310 SIF8076 Planl/drift av IT-syst310 Fordeler Praktisk metode som er enkel å anvende. Kan brukes på eksisterende systemer. Balanserer systemet slik at man får optimal utnyttelse av hardware.

311 SIF8076 Planl/drift av IT-syst311 Ulemper Inkrementell forbedring uten ’kvantesprang’ Vanskelig å kombinere med proaktiv planlegging Vanskelig å bruke på systemer med sterk variasjon i belastning Ofte bare symptombehandling

312 SIF8076 Planl/drift av IT-syst312 SIF8076 Planl/drift av IT-syst Materialadministrasjon

313 SIF8076 Planl/drift av IT-syst313 Oversikt over utstyr Hvor er utstyret på en gitt faktura? Hvilket utstyr har vært reparert? Hvilket utstyr har hvor lang levetid? Hvor står alt utstyret? Hva er på reparasjon?

314 SIF8076 Planl/drift av IT-syst314 Gitt en faktura Revisjon – hvordan er pengene brukt. 2. Dokumentasjon – vise at utstyret er en eget. Faktura Utstyr Revisor Økonomer Internktrl Tyveri Gjenbruk Garanti

315 SIF8076 Planl/drift av IT-syst315 Hvor er alt utstyret? (forts) Avgrensing av ansvarsområde Planlegging ved oppgrad etc Sikkerhet krevet oversikt Variantbegrensing for å forenkle Overvåkning for å finne feil

316 SIF8076 Planl/drift av IT-syst316 Midler for oversikt Nettverkskort – fra switch’er Strekkodemerking – på bokser Serienummer – på alle komponenter Brennmerking – mot tyveri Inventory – automatisk innsamlet Databaser – manuelt oppdatert

317 SIF8076 Planl/drift av IT-syst317 Viktig å kunne svare på 1. Hva er typisk kostnad for ulike varianter av utstyr? 2. Hva er feilrate for utstyrstyper? 3. Hvilket utstyr kan gjenbrukes? 4. Hvor mye av utstyret er overkill?

318 SIF8076 Planl/drift av IT-syst318 Levetidskostnader Innkjøpskost/levetid Personellkostnader Reservedeler Overkapasitet Brukt rekvisita HW-oppgraderinger SW-oppgraderinger Nettverkskostnader Tjenerkostnader Strøm/kjøling Opplæring Egenadministrasjon Ergonomiske kostn. Arealkostnader

319 SIF8076 Planl/drift av IT-syst319 Økonomiske spørsmål 1. Hva er kostnad pr maskin siste år? 2. Bruker vi mer eller mindre enn før? 3. Nedbryting av kostnadene i underposter. 4. Alternative driftsmåter som kan ta kostnadene ned. 5. Hva må vi budsjettere med neste år?

320 SIF8076 Planl/drift av IT-syst320 Reservedeler Kort TTR Lavere transportkostnader Restelagre Lagerkosnader Fall i pris/ytelse Høyere forbruk Vanskelig å plassere øknomisk ansvar JIT- innkjøp Minimale lagre

321 SIF8076 Planl/drift av IT-syst321 Lagerhold Registrering av uttak Kvitt deg med defekte deler Minimaliser størrelsen på lageret Evt legg genbrukbare deler på lager, men test dem først Utnevn en eneveldig lagersjef

322 SIF8076 Planl/drift av IT-syst322 Avhending av utstyr Det kan være dyrt å selge! Garantiansvar Fakturering Annonsering Datautstyr er spesialavfall Husk at utstyret er merket! Pris: 80 kr/kg (?)

323 SIF8076 Planl/drift av IT-syst323 Eksempel – enkle parametre 1. Kostnad ved innkjøp: 2. Andel av driftspersonell: 3. Hardwareoppgrad: 4. Softwarevedlikehold: 5. Softwareoppgrad: 6. Rekvisitautgifter:

324 SIF8076 Planl/drift av IT-syst324 Innkjøp – ta vare på 1. Tilbud (helst flere) 2. Bestilling – skriftlig 3. Ordrebekreftelse – med lev.dato 4. Fraktbrev ved levering 5. Pakkseddel med vareliste – sjekk! 6. Alle serienumre etc 7. Faktura 8. Listenskoder og betingelser 9. All korrespondanse ved innkjøpet

325 SIF8076 Planl/drift av IT-syst og ikke glem... Merkantile momenter 1. Fraktutgifter 2. Gebyrer 3. Tollutgifter 4. Merverdiavgift (!) 5. Ditt referansenr Tekniske momenter 1. Kabler 2. Batterier 3. Rekvisita 4. Distr.media 5. Dokumentasjon 6. Tomme media

326 SIF8076 Planl/drift av IT-syst326 Selgere og andre rare dyr... Utnytter din iboende høflighet Tåkelegger egne kostnader Eksperter i å avslutte salg Advarsel: leverandørkjeder Er alltid villige til å selge Faresignal: hyppig bytte av arb.giver

327 SIF8076 Planl/drift av IT-syst327 Tåkelegging av kostnader Bundling av ekstra varer, så som kurs, support, opplæring, installasjon Ekstragebyrer for f.eks transport Med eller uten MVA? Utdragning i tid? ’Fiktive’ goder du aldri får benyttet Sære betalingsordninger

328 SIF8076 Planl/drift av IT-syst328 Variantbegrensning Tvungen Bruk pisken! Planlegges i forkant Funderes hos ledelsen Må være klart for alle i org Må håndheves! Frivillig Bruk gulrota La dem selv betale Annonser/lokk med de OK løsningene Aksepter at ikke alle er med. Hold statistikk

329 SIF8076 Planl/drift av IT-syst329 Reklamasjon Avklar garanti på forhånd Ha papirene i orden Forlang skikkelig support Ved innsending: ta vare på fraktbrev! Ta tiden på dem Ha oversikt over hva som er til rep

330 SIF8076 Planl/drift av IT-syst330 Reklamering en masse Dersom det er systematiske mangler på en klasse av produkter, så forlang full reparasjon eller bytte av alt. Få det med i kontrakten Dokumenter problemene Ikke aksepter at ’vi tar det underveis’

331 SIF8076 Planl/drift av IT-syst331 SIF8076 Planl/drift av IT-syst Protokoller og verktøy

332 SIF8076 Planl/drift av IT-syst332 SMTP Gammel protokoll Simplistisk Opprinnelig uten adgangskontroll Transportmekanisme for andre protokoller

333 SIF8076 Planl/drift av IT-syst333 Bruk av SMTP telnet maskin 25 helo vier mail from: rcpt to: data dette er data.

334 SIF8076 Planl/drift av IT-syst334 NFS – Network file system Basert på RPC-kall For tett kopling av filsystem mellom maskiner innenfor samme ‘enhet’ Klientside-autentisering Sikkerhetsproblemer: nosuid nodev Bruker mountd for å få magisk nummer Tildels minimalistisk autentisering

335 SIF8076 Planl/drift av IT-syst335 Logging – syslog Tekstlig format Kollapsering av meldinger Bruker UDP-protokollen Trenger ekstern loggrotering Har facilities og severity Logger typisk over nett til loghost

336 SIF8076 Planl/drift av IT-syst336 Logging – Eventlog Binært format – bundet Logging normalt til lokal maskin Automatisk loggrotering Severity og facility

337 SIF8076 Planl/drift av IT-syst337 Printing – lpr Brukerprogrammet må generere utskriftsfila. Printingsystemet ordner (nesten) bare logistikken med utskriften Ikke altfor enkelt for sysadm Utskrift kan settes konsistent opp

338 SIF8076 Planl/drift av IT-syst338 Printing – Windows Utskriftstjener har driver Klientmaskin genererer utskriftsfila Typisk problem: må definere egenskapene til skriveren! Støtter vilkårlig (og kaotisk) topologi

339 SIF8076 Planl/drift av IT-syst339 Term.tjener – RDP Enkel protokoll for remote vising av desktop Problemer med tilgang til lokale enheter som diskettstasjon, skriver, lyd Innebygd i Windows Veldig simplistisk lastbalansering

340 SIF8076 Planl/drift av IT-syst340 Term.tjener – Citrix Protokoll for vising av hel desktop eller enkeltapplikasjon Støtte for en del lokale enheter En del støtte for administrasjon Har mer avansert lastbalansering

341 SIF8076 Planl/drift av IT-syst341 Term.tjener – X11 Protokoll for vising av vinduer til enkeltapplikasjon Ting som lastbalansering, lokale enheter etc er eksternt forprotokollen

342 SIF8076 Planl/drift av IT-syst342 SIF8076 Planl/drift av IT-syst Sikkerhet

343 SIF8076 Planl/drift av IT-syst343 Sikkerhetsproblemer Problem CrashDatatap Angrep Bruker Ulykker ’Ondsinnet’ Sikkerhet Security Trygghet Safety

344 SIF8076 Planl/drift av IT-syst344 Fysisk sikring av utstyret Skallsikring Sonesikring Romsikring Tjener Data Klient

345 SIF8076 Planl/drift av IT-syst345 Principle 43 Security The fundamental requirement for security is the ability to restrict access and privilege to data.

346 SIF8076 Planl/drift av IT-syst346 Fire fasetter av sikkerhet Vern mot innsyn (lås) Autentisering (nøkkel) Autorisering (lås-nøkkel-kopling) Integritet (datas bestandighet)

347 SIF8076 Planl/drift av IT-syst347 Vern mot innsyn (lås) (Data er beskyttet av en lås) Fysisk avlåsing (f.eks hengelås) Logisk avlåsing (f.eks kryptering) Nettmessig avlåsing (f.eks ACL)

348 SIF8076 Planl/drift av IT-syst348 Autentisering (nøkkel) (Person må besitte en nøkkel) Passord som må huskes Engangspassord på fysisk gjenstand Privat nøkkel for krypteringsalgoritme Annet (irisskanning, fingeravtrykk, stemmegjenkjenning)

349 SIF8076 Planl/drift av IT-syst349 Autorisering (nøkkel-lås-kopling) (Sikre at bare rett nøkkel passer) Fjerne bakdører Addere uavhengige låser Senke dirkbarhet Forsterke kopling person-nøkkel

350 SIF8076 Planl/drift av IT-syst350 Integritet (Ondsinnet eller tilfeldig) Duplisering av data Sjekksumming av data Geografisk spredning av data Ansvarsspredning for data Kontrollert lagring

351 SIF8076 Planl/drift av IT-syst351 Hva bestytter vi oss mot Operasjonsavbrudd (DoS) Dårlig omtale (defacing) Tap av data (diskkrasj) Fikling på data (integritet) Innsyn i data (info-tyveri)

352 SIF8076 Planl/drift av IT-syst352 Principle 46 Data invulnerability The purpose of a backup copy is to provide an image of data which is unlikely to be destoyed by the same act that destroys the original.

353 SIF8076 Planl/drift av IT-syst353 Parametre for backup Hyppighet (daglig) Full/inkr-fordeling (dynamisk) Syklustid (10-12 dager) Lagertid (60 dager til ’noen år’) Testing (3-5 ganger pr uke) Volum ( GB komprimert)

354 SIF8076 Planl/drift av IT-syst354 Backup-parametre II Kjøretid for et fullt sett av backup Kjøretid for full restore Kjøretid for restore av enkeltfil Tilgang til alternative tapestasjoner Levetid i lagring på tapene Maks antall operasjoner pr tape

355 SIF8076 Planl/drift av IT-syst355 Tre dårlige strategier... I Security through obscurity. Gjør det så sært at ingen finner frem La være å dokumentere Kjør ustandard løsninger Hindrer ikke de som er virkelig oppsatt på å komme inn, selv om det er en terskel som skiller ut noen små angrep

356 SIF8076 Planl/drift av IT-syst356 Tre dårlige strategier II Honningkrukker Sett frem noe fristende Ta dem etterhvert som de dukker opp Egentlig bare en variant av ’security through obscurity’. Tar de små tidlig og hindrer kanskje gjentakelse. Avskrekking? Kan også tiltrekke.

357 SIF8076 Planl/drift av IT-syst357 Tre dårlige strategier III Offerlam De ytterste maskinene er ukritiske Når de angreper kan de studeres Kan kombineres med honningkrukka Også bare en ’security through obscurity’, selv om prinsippet om flere forsvarslinjer er bra.

358 SIF8076 Planl/drift av IT-syst358 Mangler med disse strategiene Styrker ikke sikkerheten direkte Svekker bare sikkerhet på enkelte kontrollerbare punkter Obscuritetssikkerhet virker ikke mot interne innbrudd Hever terskelen, men stopper ikke

359 SIF8076 Planl/drift av IT-syst359 Noen gode strategier I CERT (Computer Emergency Reposonse Team) Plassere ansvar og ressurser Proaktivt (ER?) Kjapp oppdatering av sikkerhetspatcher Full oppklaring av sære ting

360 SIF8076 Planl/drift av IT-syst360 Noen gode strategier II Forenkling Filtrer alt gjennom en sental firewall Homogeniser datamaskinene Fjern unødvendig funksjonalitet

361 SIF8076 Planl/drift av IT-syst361 Noen gode strategier III Monitorering Sett opp mange detektorer Følg systematisk opp symptomer Ta tilfeldige stikkprøver Følg med i loggene

362 SIF8076 Planl/drift av IT-syst362 Utfordringer innen sikkerhet ’Social engineering’ Bærbare maskiner med lokale data Skal jobbe fra hjemmemaskiner Egne ansatte Tempoet på utviklingen Overgang til black-box-funksjonalitet Skaleringsproblemene generelt

363 SIF8076 Planl/drift av IT-syst363 Konkrete sikkerhetsangrep Lange ping-pakker Denial of Service (DoS) IP-spoofing SYN flooding TCP sequence guessing Teardrop ICMP-flooding DNS-Cache Poisoning

364 SIF8076 Planl/drift av IT-syst364 SIF8076 Planl og drift av IT- syst Analystisk Systemadministrasjon

365 SIF8076 Planl/drift av IT-syst365 Vitenskap og teknikk Abstraksjon Teoretisk/empirisk Hypoteser Falsifisering Peer review Publisering Grunnforskning Praktiske gjøremål Empirisk/heuristisk Kjørende kode “Det som virker” Akutte problemer Reaktivt

366 SIF8076 Planl/drift av IT-syst366 Komplekse systemer Statistisk analyse av pålitelighet Statistisk analyse av ytelse Evaluering av metoder Observasjoner av uforutsigbare hendelser Strategi og planlegging Systemets mål og mening (policy)

367 SIF8076 Planl/drift av IT-syst367 Gjeldende metodikk Anvendelse Observasjon Antakelser Verktøy Omtrentlige, semi-felles erfaringer

368 SIF8076 Planl/drift av IT-syst368 Mer vitenskapelig metodikk Anvendelse og policy Observasjon Modellering Hypotese- bygging Verktøy Hypotese- testing Vitenskapelig kunnskap

369 SIF8076 Planl/drift av IT-syst369 Viktigheten av en “policy” En “policy” definererer mål og mening for dataanlegget Bruker som rettesnor for å vurdere tiltaks hensiktsmessighet Påstand: gitt en policy, er egentlig hele systemets tilstand implisitt gitt

370 SIF8076 Planl/drift av IT-syst370 Policy-basert målstyring Situasjon Problem? Policy Løsnings- forslag Alternativ1 Måletall Konklusjon Alternativ2 Måletall Konklusjon

371 SIF8076 Planl/drift av IT-syst371 Eksempel med mp3 Situasjon: Tomt for disk pga mp3-filer Policy: ikke-faglig aktivitet må vike Problem? Ja, man får ikke arbeidet Alt1: Gjøre ingenting (nulltalternativet) Alt2: Sette opp en /etc/motd Alt3: Slette det hele Alt4: Sende oppfordringer til brukerne

372 SIF8076 Planl/drift av IT-syst372 Alternativ 1 (eks mp3) Forslag: ikke gjøre noe Måletall: Driftskostnader Stabilitet Får folk arbeidet? Volum av mp3-filer? Konklusjon: Oppfyller ikke policy

373 SIF8076 Planl/drift av IT-syst373 Alternativ 2 (eks mp3) Forslag: legge inn /etc/motd Måletall: Driftskostnader Hvor mange leser det? Hvor mange sletter Får folk arbeidet seriøst? Konklusjon: Litt bedre, men ikke nok

374 SIF8076 Planl/drift av IT-syst374 Alternativ 3 (eks mp3) Forslag: Slette mp3 “on sight” Måletall: Driftskostnader Hvor mye blir frigjort Hvor mye gjemmes unna Får folk arbeidet seriøst? Konklusjon: ???

375 SIF8076 Planl/drift av IT-syst375 Eksempler på policies Hva skal systemet brukes til? Hvem er systemet til for? Prosentvis/lengde oppetid Utskriftskostnader/volum Nett: volum, accesstid, opptid Diskbruk: pr bruker, totalt Backup: hyppighet, testing, tid

376 SIF8076 Planl/drift av IT-syst376 Negativ/positiv policy Negativ dersom den definerer det som ikke skal gjøres, som skal unngås og som ikke er ønskelig (lover) Positiv dersom den definerer det som er skal gjøres, oppnås og som er ønskelig (visjon)

377 SIF8076 Planl/drift av IT-syst377 Positiv måldefinisjon Mål Beskriver hvordan systemet er ment å fungere.

378 SIF8076 Planl/drift av IT-syst378 Negativ måldefinisjon Probl Beskriver systemet Ved å spesifisere hvordan det ikke skal virke

379 SIF8076 Planl/drift av IT-syst379 Målendring – utfordringer Målene endres hele tiden Systemet må endres hele tiden Innsats blir generelt mindre Utfasing av foreldede neg tiltak Neg tiltak forutsetter at du oppdager problemet de skal løse, minst en gang

380 SIF8076 Planl/drift av IT-syst380 Systemoppdatering I Gjenbruk Ny innsats Gammelt system Nytt system

381 SIF8076 Planl/drift av IT-syst381 Systemoppdatering II Probl

382 SIF8076 Planl/drift av IT-syst382 SIF8076 Planl/drift av IT-syst Analytisk systemadministrasjon II (Pålitelighet og metrikker)

383 SIF8076 Planl/drift av IT-syst383 Metrikker for et system MTBF (Mean time between failures) Gjennomsnittlig oppetid Gjennomsnittlig nedetid TTR (Time to repair)

384 SIF8076 Planl/drift av IT-syst384 Pålitelighet – R

385 SIF8076 Planl/drift av IT-syst385 Analogi til Ohms lov I = V/R V – Spenningsforskjell/info.endring I – Strøm/Tjenesterate eller infoflyt R – Resistans/Feilrate

386 SIF8076 Planl/drift av IT-syst386 Flere feilkilder Dersom i serie (avhengigheter) Dersom i parallell (uavhengig)

387 SIF8076 Planl/drift av IT-syst387 MTBF Feilrate som en enkeltstående feil opptrer med. F.eks eksponensialfordelt

388 SIF8076 Planl/drift av IT-syst388 Intervall for måling 0-10 sek: systemytelse sek: responstider Hver time: programvare Daglig: brukeraktivitet Ukentlig: brukeraktivitet

389 SIF8076 Planl/drift av IT-syst389 Momenter ifm måling Målefrekvens/-intervall (Nyquist) Ekstra belastning ifm måling Måleperiode (dag, uke, semester) Periodisitet Entropi

390 SIF8076 Planl/drift av IT-syst390 Måling av nettverk Ukentlig periode Daglig periode Gj.snitts type Forvent. entropi Antall pakker Svak/ Fraktal Svak/ Fraktal Kontinu erlig Høy IP frag- menter. Ingen DiskretLav Tetthet Broadc. Svak Kontinu ering Lav

391 SIF8076 Planl/drift av IT-syst391 Måling av nettverk II Ukentlig periode Daglig periode Gj.snitts type Forvent. entropi Antall Koll. Ubest.UbestKontinu erlig Lav Antall sockets Sterk (ut) Kontinu erlig Ubest Ugyldige pakker Ingen DiskretMinimal

392 SIF8076 Planl/drift av IT-syst392 Måling av lagerplass Ukentlig periode Daglig periode Gj.snitts type Forvent. entropi Disk Plass Ja/ubest Kontinu erlig Ubest Disk op. Pr sek Ja/ubest Kontinu erlig Ubest Page out Ubetyde lig Kontinu erlig Lav

393 SIF8076 Planl/drift av IT-syst393 Måling av prosesser Ukentlig periode Daglig periode Gj.snitts type Forvent. entropi Priv prosess Svak DiskretLav Ikkepriv prosess Sterk Kontinu erlig Ubest Max CPU% Lite/ intet Bare max Høy

394 SIF8076 Planl/drift av IT-syst394 Måling av brukere Ukentlig periode Daglig periode Gj.snitts type Forvent. entropi Antall pålogget Sterk Kontinu erlig Ubest Totalt antall Irrele- vant AbsverdiMinimal Gj.sn tid pålogget Ubest Kontinu erlig Ubest

395 SIF8076 Planl/drift av IT-syst395 Måling av brukere II Ukentlig periode Daglig periode Gj.snitts type Forvent. entropi Gj.snitt Last Sterk Kontinu erlig Høy Δdisk/sn /hr/usr Ubest Kontinu erlig Lav Ventetid på tjen. Sterk o. terskel Sterk o. Terskel Kontinu erlig Ubest

396 SIF8076 Planl/drift av IT-syst396 Årsaker til mønstrene Sosiale mønstre (f.eks lunsj) Programsystemer (f.eks backup) Uoptimaliserte programmer Reelle feilkilder

397 SIF8076 Planl/drift av IT-syst397 Mål som ikke kan ’måles’ Brukeres tilfredsstillelse Informasjonssikkerhet Systemadmins frustasjon Nøyaktighet Omstillings- og tilpassingsdyktighet


Laste ned ppt "18.01.2001SIF8076 Planl/drift av IT-syst1 Del 1 - Introduksjon Systemsadmins rolle, oppgaver, målsetting og filosofi."

Liknende presentasjoner


Annonser fra Google