Håndtering av informasjonsressurser (kap. 7) Data som en virksomhetsressurs: Rollen til dataadministratoren. Viktigheten av datakataloger ol. Håndtering av data. Tidligere – kun interne data. Nå – mange kilder (Internett) Tidligere – tekst og tall Nå – multimedia Tidligere – sentrale databaser Nå – distribuerte databaser Tidligere – kun record-baserte data Nå – også mer ustrukturerte data (dokumenter) 09.04.2017 MS kap 7
Data som records og dokumenter 09.04.2017 MS kap 7
4 typer informasjon 09.04.2017 MS kap 7
Håndtere records Problem: Inkonsistente datadefinisjoner Vi ønsker å ha data lagret kun et sted, med en beskrivelse og et format som gjør dataene tilgjengelig for alle Ikke alltid så lett i praksis Eksempel: Dersom vi skal endre navnet på et fag ved HSM, hvor mange steder må vi rette opp dette? Vi er applikasjonsorientert, vil ha systemene i gang fortest mulig, tenker ikke langsiktig Langsiktig tenkning er ofte vanskelig Eksempel: Utvikling av byer, fra ”fritt-fram” til reguleringsplaner Hva med de gamle bydelene, skal de renoveres? 09.04.2017 MS kap 7
Ideell verden Vi ønsker: Ansvaret ligger på databaseadministratoren Å lagre data ett sted (”store once use many times”) Alle applikasjoner skal ha tilgang til alle data Data skal være lagret på en hensiktsmessig form At ansatte, kunder, leverandører m.m. har tilgang til de data de måtte ha behov for Ansvaret ligger på databaseadministratoren Administrere datadefinisjoner Kontrollere felles data Styre distribusjon av data Opprettholde datakvalitet Ingen enkel jobb (teknisk og sosial prosess) 09.04.2017 MS kap 7
Databaseadministrasjon Jobben er noe forenklet ved: Godt tilbud av databasesystemer (som håndterer de tekniske sider av datalagring) Robuste, høykapasitets lagringsmedia (disk, DVD, …) Standarder (som SQL, ODBC…) 09.04.2017 MS kap 7
Web og dokumentdata Hvem gjør jobben til databaseadministratoren ? Er XML løsningen? Semantisk Web: Er dette mulig å oppnå? Er det konkurransemessige begrensninger? Er det hensiktsmessig? 09.04.2017 MS kap 7
Data ”Warehousing” Data fra mange kilder En overordnet beskrivelse Idé, bruke data for nye formål: Markedsoversikt Kundekontakt Strategiske beslutninger Ikke alltid like enkelt å implementere: Formaliseringsgrad til data? Kvaliteten til data? Gjenbruksverdi? Hva med endringer over tid? 09.04.2017 MS kap 7
Eksempel Statistikk for høgskolen I utgangspunktet kan vi tenke oss å analysere de data vi har til å si noe om trender Data: studiepoeng, grader, karakterer, fag… Men: fag endrer seg over tid, blir gitt av forskjellige forelesere, forskjellig krav til eksamen, kan gå fra valg til obligatorisk, … studieprogrammer endrer seg er karakterer absolutte Det betyr ikke at statistikken blir verdiløs, men at den må tolkes ut fra de endringene som har skjedd
Dokumenthåndtering En stor del av en bedrifts informasjon er lagret i form av dokumenter Lavere formaliseringsgrad enn records, f.eks. Lag liste med navn og adresse til alle kunder med negativ saldo (100 prosent nøyaktig svar fra databasesystemet) Finn alle dokumenter som sier noe om kommunenes IT strategi (precision & recall definerer effektivitet) Data kan lagres elektronisk (mange formater) eller på papir Data kan lagres som ”bilde” eller som tekst 09.04.2017 MS kap 7
Dokumenter En stor del av en organisasjons data er i form av dokumenter Dokumenter inneholder ofte informasjon av stor betydning Eksempler: Kontrakter, avtaler Tegninger, fotografier Rapporter Manualer, håndbøker eMail Korrespondanse (brev) Skjema Møteinnkalling, møtereferater Nyheter, artikler, bøker, reklamemateriell, … 09.04.2017 MS kap 7
Dokumentstruktur Vanligvis lav formaliseringsgrad (sett i relasjon til record-baserte data) Kan inneholde mange komplekse informasjonstyper Kan være avhengig av andre dokumenter Dynamisk (kan endres) Kompleks struktur, ofte lite formalisert Forskjellige datatyper og dataformater Kan bli aksessert og endret av mange personer, kanskje samtidig Kan være distribuert over et nettverk 09.04.2017 MS kap 7
Fra dokument til record Eksempel 1: Tidligere hadde vi artikler på papirform. For å få oversikt over samlingen av artikler tastet vi inn alle data i et arkivsystem Så laget vi et program som tok data direkte fra “image”, via OCR til en tekstanalyse 09.04.2017 MS kap 7
Dokument til record Bestilling av bøker via Mentor systemet Vi plukker enkelt ut data-elementene her (formalisert) Det skal vi også klare om bestillingene kommer på vanlig mail (skrevet av bokhandleren) Men da kreves det etterkontroll Til Turbokforlaget, jeg bestiller med dette 10 eks av Turbok for Ålesund. Med hilsen Brattvåg Bok og Papir 09.04.2017 MS kap 7
Record til dokument Enkel prosess Programmer, som MS Access, støtter opp om dette Denne prosessen er selvfølgelig 100% formalisert 09.04.2017 MS kap 7
Dokumentets roller Produkt, del av produkt Spesifikasjon, dokumentasjon, bruksanvisning,… Kommunikasjonsmekanisme mellom folk Brev, rundskriv, rapporter, … Datainnsamlingsprosess Skjema, søknader,… Som ledd i en forretningsprosess Tilbud, ordre, avtale, kontrakt, … En del av organisasjonens felles hukommelse Arkiv m.m. 09.04.2017 MS kap 7
Eksempler Dokumentere kontrakter og avtaler (med ansatte, kunder, leverandører, lån, kjøp, salg…) Beskrive vedtak, retningslinjer, standarder (manualer, spesifikasjoner, håndbøker, sirkulærer…) Presentere en tilstand (regnskap, statusrapporter, kontoutdrag…) Gi inntrykk (brosjyrer, reklameinnslag…) Som et produkt (avis, bok, artikkel, rapport, film, program, musikk, …) Øke verdien til et produkt (bruksanvisning, katalog, rabattkupong, vedlegg til CD plate, …) Kommunikasjon (brev, presentasjoner, eMail,…) Forretningsprosesser (ordrer, faktura, billett, skjema, …) For å fange opp og uttrykke ideer (vitenskapelige artikler, debattinnlegg…) 09.04.2017 MS kap 7
Elektroniske dokumenthåndteringssystemer Kategorier: Forbedre publiseringsprosessen Understøtte organisasjonsprosesser Understøtte kommunikasjon mellom mennesker Forbedre tilgang til informasjon Dokumentasjon Arkivering Opplæring 09.04.2017 MS kap 7
Eksempler: Arkivering: mikrofilm, image-lagring istedenfor lagring på papir Produksjon: CAD/CAM tegninger Prosesser: Scanne all inngående post Personaladministrasjon: Alle data om ansatte i en database, scanning av søknader, papirer, … Manualer: På Web eller CD istedenfor på papir, nye søkemuligheter… CRM: kundekontakt over ePost, personifiserte Web sider, … Opplæring: Mulitimedia, eBøker, Powerpoint presentasjoner, simuleringer, demo, elektroniske klasserom med storskjerm, ... Sentral lagring (Cloud Computing): Dokumenter kan aksesseres fra hvor som helst 09.04.2017 MS kap 7
Case: Tapiola forsikring Tidligere: 150 forskjellige forsikringer/polisetyper 300 forskjellige formularer (på Svensk og Finsk) Trykket i trykkeri Vanskelig å endre på skjema Mål for nytt system: Redusere kostnader Trykke skjema selv Nye måter å tilby produkter på Personifisering, følelsen av å få individuell tilpasning av tjenester 09.04.2017 MS kap 7
Løsning Først sentralisert 4 nye ”skjema”: Skjema til printformater Skrivesenter med laserskrivere Maskiner for å legge brev i konvolutt (styrt av strek-kode på hvert ark) 4 nye ”skjema”: A4 A4 med hull A4 med logo A4 med perforert del nederst Skjema til printformater Desentralisering: Alle data (kjøp av forsikring, krav om erstatning) legges inn lokalt Kunden får skrevet ut nødvendige dokumenter lokalt Elektronisk pengeoverføring 09.04.2017 MS kap 7
Norske skattemyndigheter Skjema og veiledninger på nett (pdf og Word format) Optisk lesing av enkle skjema (som mva-oversikter) Altinn, databasesystem med elektroniske skjema Stor fordel for myndighetene å få alt elektronisk Tungvindt system for brukerne (hvorfor er det spesielt viktig å ha et godt brukergrensesnitt her?) Forhåndsutfylt selvangivelse for vanlige lønnsmottakere (god idé!) Grunnidé: Det enkle skal gå mest mulig automatisk, personellressurser settes inn på mer kompliserte områder (kontroll) 09.04.2017 MS kap 7
”Document Mining” Analyse av dokumenter Redusere ”output overload” Finne verdifull informasjon i dokumentsamlinger Vanskelig, på grunn av lav formaliseringsgrad og på grunn av at verden og dermed betydningen av tallene endrer seg Steg i prosessen: 1. tagging, ”stemming”, konstruere indeks 2. summere, aggregere, visualisering 3. analyse 09.04.2017 MS kap 7
Eksempler: Jus, finne fram til relevante saker Patentadministrasjon Analysere interne forskningsrapporter (utnytte tidligere suksesser, unngå å gjøre dobbeltarbeid…) Organisere kunnskap, ”best practices” m.m. Etterretning, oversikt over produkter, markeder, teknologiendringer, lovgiving,… Organisere kompleks informasjon (finne fram til relevante dokumenter, gruppering, organisering, vise koplinger…) CRM (analysere tilbakemeldinger fra kunder, data om markeder, mediadekning…) 09.04.2017 MS kap 7
Funksjoner: Avansert søking, f.eks. på Web basert på språkstruktur eller linkstruktur (Google) Aggregering (automatisk sammendrag av dokumenter) Visualisering Kategorisering (finner hvilken kategori dokumentet tilhører) Gruppering (basert på innhold - Vibe) Genre identifikasjon (kategorisering basert på språkstil, format, innhold - som å skille pressemeldinger fra rapporter om det samme emne) Utdrag av metadata (finne sentrale deler av et dokument og lagre disse som annotasjoner, gjerne i et record-basert format) Identifisere språk Identifisere forfatter 09.04.2017 MS kap 7
Teknologier: Digtalisering Lagring og organisering Papir til ”image” (scanning) Image til tekst (OCR) Lagring og organisering Objekt-orienterte databaser (håndterer data av mange typer) Distribuert lagring Hypertekst Framhenting (”information retrieval”) Tekstsøking (forskjellige formater) Billedsøking ... 09.04.2017 MS kap 7
Fra dokument til record Mange av de dokumenter vi oppgir oss med er på dokumentformat av historiske grunner I dag kan mye av dette håndteres som ”record” data, i det minste i elektroniske dokumentformater. Skanning og OCR er derfor bare en mellom-teknologi. Eks.: billetter, penger….
Case: Dynamiske dokumenter Bedrifter presenterer sine produkter i brosjyre En brosjyre kan gi fine bilder og flott layout Men, den er statisk Kan vi lage dynamiske brosjyrer? http://home.himolde.no/~nordhaug/virtuell-lugar/
Håndtering av kunnskap? 09.04.2017 MS kap 7
Data - informasjon - kunnskap Data (bit, tegn, filer). Det vi lagrer og sender over nettverkene. Laveste nivå. Informasjon. Data må gjennom en prosess (f.eks. lesing) for å bli til informasjon. Læreboken, avisen og TV nyhetene gir informasjon. Kunnskap. Informasjon omgjøres til kunnskap i en prosess der også annen informasjon, kunnskap og intelligens inngår. 09.04.2017 MS kap 7
Informasjons vs. kunnskapshåndtering 09.04.2017 MS kap 7
“Content Management” Hvordan skal vi håndtere innhold av data på Web sider? Ledelsesoppgave – naturlig del av eBusiness Må gjenspeile bedriftens strategi Krav til informasjonen: Korrekt Oppdatert Komplett 09.04.2017 MS kap 7
Dynamiske sider Web sider genereres ut fra underliggende databaser Greit, dette blir record -> dokument (helt formalisert) Web sidene blir dynamiske Med XML kan vi definere data på høyere formaliseringsnivåer, legger grunnlaget for B2B 09.04.2017 MS kap 7
Case fra boka: Eastman Chemical Company Utvikler kjemikalier, fibre, plastikkmaterialer Web sider fra 1994, utviket seg til et komplisert konglomerat Redesign av web sider (1999) Utenifra-og-inn (isteden innenifra og ut) Et overordnet navigasjonssystem Nytt verktøy for å utvikle sider Doblet trafikken på sider i løpet av første halvår Oppdaget at spesifikasjoner (”data sheets”) hadde stor verdi for kundene, organiserte dette bedre (data direkte fra database) B2C løsning Valg av språk, for å kunne tilfredsstille kunder over hele verden 09.04.2017 MS kap 7
Ett case fra undervisningssektoren I mange sammenhenger kan det være greit å vite hvilken gjennomføringsgrad vi har på et studium Kan defineres ut fra antall avlagte studiepoeng eller antall avlagte grader
Gjennomføringsdata grader La oss anta at dette vi har et bachelor, altså et tre-årig studium. Jobben er å finne gjennomførings-prosent på normert tid Definerer dette som hvor stor del av de opptatte studentene på et studium som har en bachelor i faget tre år senere.
Standard metode Både Høgskolen og Departementet tar antall B.Sc. grader ett år og dividerer med antall opptatte studenter tre år tidligere. Er det rett? En annen, og riktigere tilnærming, se på hvor stor andel av de opptatte studentene som har en bachelorgrad tre år senere (individorientert) Dersom en student tas opp på et studium (f.eks. øk.adm) og tar grad på et annet (revisjon) vil hun ikke komme med i statistikken Hvordan løser vi det?
Studiepoeng Departementet definerer dette som avlagte poeng i forhold til plan Det er flere problemer med dette. For det første er en plan stort sett et byråkratisk dokument For det andre oppdateres denne hvert semester Eksempel: En student starter håpefullt på første semester. Planen er å ta en bachelor. Til jul stryker han i alle fag og slutter. Skal vi da la planen gå i 2.5 år til? Dette hadde sagt noe om gjennomføring. Men planen forsvinner med studenten. Det er altså lett å følge planer når disse kan oppdateres ved alle avvik.
Konklusjon Det kan være langt fra data til informasjon og fra informasjon til kunnskap Men tall er viktig, ut det blir det bare synsing (gjerne basert på vage inntrykk og det som skjedde tidligere i dag og i går) Tall alene sier ikke alt, vi må vite begrensningene og forutsetningene (jfr. sikkerhetsberegninger på lån før finanskrisen)