Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

Noark 4 Hva er uttrekk og viktigheten av verktøyene?

Liknende presentasjoner


Presentasjon om: "Noark 4 Hva er uttrekk og viktigheten av verktøyene?"— Utskrift av presentasjonen:

1 Noark 4 Hva er uttrekk og viktigheten av verktøyene?
Digital arkivdanning og -bevaring II 2013 Thomas Sødring P48-R407

2 Uttrekk Arkivdanningsfasen Avlevering Arkivdepot

3 Bevaringstrategier Utskrift på papir Teknologi bevaring
Emulering/Virtuell maskin programvare Migrering XML og lagring i standardformater

4 Teknologi bevaring En BIOS har ikke en ubegrenset levetid
Det kan også være problematisk å få en harddisk til å bygene å spinne igjen etter mange år

5 Teknologi bevaring Fra Kan enda finne eksempler som fungerer på finn.no

6 Virtuell maskiner Virtuelle maskiner er en variant av emuleringen der den opprinnelige operativsystem som programvaren som skapte arkivdokumentene kan lagres Utvikle en "Universal Virtual Computer" (UVC) som vi skape en speilbilde av miljøet programvaren lever i Du har fortsatt problemer med lisens oppdateringer (sikkerhet) nettverkstilkoblinger

7 Migrasjon En migrasjon er prosessen med å flytte data fra ett system eller lagringsmedium til et annet for å sikre fortsatt tilgang til informasjonen Dette kan være fordi systemet eller mediet er blitt foreldet eller er i ferd med å brytes ned pga tid En migrasjon er å flytte arkivdokumenter fra ett system til et annet, samtidig som arkivdokumentenes autentisitet, integritet, pålitelighet, og brukbarhet er opprettholdt (ISO ) XML og standardformater er brukt til migrasjon

8 <forfatter>Hans Hansen </forfatter>
Hva er XML? Et markeringsspråk utviklet på 90 tallet Nyttig i mange konteskter – arkiv også Lar deg tagge data Menneseke lesbart Innhold <forfatter>Hans Hansen </forfatter> Startmerke Sluttmerke

9 Skille mellom data og presentasjon
Applikasjon Database

10 Skille mellom data og presentasjon
Student StudentTelefonNr StudentNr Fornavn Etternavn Etternavn StudentNr TelefonNr 12345 Jan Karlson Karlson 12345 23456 Pål Solberg Solberg 12345 34567 Mette Johansen Johansen 12345 45678 Ingrid Aleksandersen Aleksandersen 45678

11 Database uttrekk i XML Student StudentNr Fornavn Etternavn Etternavn
12345 Jan Karlson Karlson 23456 Pål Solberg Solberg 34567 Mette Johansen Johansen 45678 Ingrid Aleksandersen Aleksandersen <?xml version=”1.0” encoding=”UTF-8”?> <studenter> <student> <studentNr>12345</studentNr> <fornavn>Jan</fornavn> <etternavn>Karlson</etternavn> </student> <studentNr>23456</studentNr> <fornavn>Pål</fornavn> <etternavn>Solberg</etternavn> </studenter>

12 Database uttrekk i XML StudentTelefonNr StudentNr TelefonNr 12345
12345 12345 45678 <?xml version=”1.0” encoding=”UTF-8”?> <studenter> <studentTelefonNr> <studentNr>12345</studentNr> <telefonNr> </telefonNr> </studentTelefonNr> <telefonNr> </telefonNr> <telefonNr> </telefonNr> </studenter>

13 Presentasjon eduDots (prototype)

14 NOARKSAK.XML <NOARKSAK> <SA.ID>200016</SA.ID>
<SA.SAAR>2002</SA.SAAR> <SA.SEKNR>16</SA.SEKNR> <SA.PAPIR>1</SA.PAPIR> <SA.DATO> </SA.DATO> <SA.TITTEL>Opprettelse av stilling som IKT konsulent</SA.TITTEL> <SA.U1>0</SA.U1> <SA.STATUS>B</SA.STATUS> <SA.ARKDEL>EA2000</SA.ARKDEL> <SA.TYPE>STD STD</SA.TYPE> <SA.ADMID>104</SA.ADMID> <SA.ANSVID>121</SA.ANSVID> <SA.TGGRUPPE>141</SA.TGGRUPPE> <SA.SISTEJP> </SA.SISTEJP> <SA.ANTJP>1</SA.ANTJP> </NOARKSAK>

15 JOURNPOST.XML <JOURNPOST> <JP.ID>2000021</JP.ID>
<JP.JAAR>2002</JP.JAAR> <JP.SEKNR>21</JP.SEKNR> <JP.SAID>200016</JP.SAID> <JP.JPOSTNR>1</JP.JPOSTNR> <JP.JDATO> </JP.JDATO> <JP.NDOKTYPE>U</JP.NDOKTYPE> <JP.DOKDATO> </JP.DOKDATO> <JP.UDATERT>0</JP.UDATERT> <JP.STATUS>?</JP.STATUS> <JP.INNHOLD>Opprettelse av stilling IKT </JP.INNHOLD> <JP.U1>0</JP.U1> <JP.OVDATO> </JP.OVDATO> <JP.TGGRUPPE>141</JP.TGGRUPPE> <JP.U2>0</JP.U2> <JP.ARKDEL>EA2000</JP.ARKDEL> <JP.PAPIR>1</JP.PAPIR> </JOURNPOST>

16 Noark 4 uttrekk (70 av 88 filer)
ADMINDEL.XML AVGRKODE.XML DOKSTAT.XML FSTATUS.XML KLASS.XML PERKLAR.XML ROLLE.XML TGHJEM.XML UTVBEHDO.XML UTVSAK.XML ADRESSEK.XML AVSKRM.XML DOKTILKN.XML INFOTYPE.XML LAGRENH.XML NOARKSAK.DTD PERNAVN.XML SAKPART.XML TGKODE.XML UTVBEHST.XML VARFORM.XML ADRTYPE.XML AVSMOT.XML DOKTYPE.XML JENARKD.XML LAGRFORM.XML NOARKSAK.XML PERROLLE.XML SAKSTAT.XML TGMEDLEM.XML UTVBEH.XML ARKIVDEL.XML BSKODE.XML DOKVERS.XML JOURNENH.XML MEDADRGR.XML NUMSERIE.XML PERSON.XML SAKTYPE.XML TILLEGG.XML UTVMEDLF.XML ARKIVPER.XML DOKBESK.XML EARKKODE.XML JOURNPST.XML MERKNAD.XML OPRITYP.XML POLSAKG.XML STATMDOK.XML UTDOKTYP.XML UTVMEDL.XML ARKIV.XML DOKKAT.XML FORSMATE.XML JOURNSTA.XML POSTNR.XML ORDNPRI.XML STDVERDI.XML UTENDTD.XML UTVMOTE.XML ARSTATUS.XML DOKLINK.XML FRAMMOTE.XML KASSKODE.XML ORDNVERD.XML PRES.XML TGGRP.XML UTVALG.XML UTVSAKTY.XML

17 Uttrekk Arkivdanningsfasen Avlevering Arkivdepot

18 Validering av uttrekk Hvordan ser et riktig uttrekk ut?
arkn4 fra Riksarkivet / Frode Kirkholts URD Når er godt nok, godt nok? Hvem har ansvaret til å lage uttrekk? godkjenne uttrekk? Sett uttrekk som tar 8+ dager til å validere!

19 Hvorfor er uttrekk så vanskelig?
Leverandører oppdaterer systemer Leverandører mister kompetanse Det har aldri vært krav til å følge standarden Det har vært for mye fokus på danning! Arkivar bør lage uttrekk og validere fortløpende Den tekniske implementasjon behøver med andre ord ikke å følge disse spesifikasjonene når man kan oppfylle kravene på annen måte

20 N4OK : Datakvalitet 12 år kommunal N4 data, 850 000 dokumenter
Har ikke sett på data Kommentere koden som lager uttrekket Hvis leverandør ikke følger standarden så kan vi være nødt til å bevare flere versjoner Gyldig men inkorrekt Ikke gyldig men korrekt Original database dumpen Database dump i nøytral format

21 Er N4 standarden bra nok? ... til å lage et uttrekk fra en godkjent N4 system Stort sett Ja! Noen mangler av og til Noen få feil

22 Andre feil Er alt som skal være avsluttet, avsluttet?
Hvis ikke, hvordan skal vi håndtere? Bruken av ikke standard verdier Hvordan skal disse mappes til standard verdier Duplikate verdier der det ikke er lov Spore opp og fikse Store og små bokstaver som betyr det samme

23 Andre feil Manglende data Manglende informasjon om filer
Obligatorisk data, men det mangler Feks må jeg lage lage fiktive personer for å fikse Status verdier som jeg ikke finner i databasen, antaglivis i brukergrensesnittet Manglende informasjon om filer Mangler filtype (doc, docx) DB sier at det er i arkivformat (PDF/A) men det er ikke

24 Minumum eller maksimum
Skal vi få med all data eller bare et minimum av data Der all data finnnes Der data ikke finnes men kan lages

25 Tid og Volum Tid og Volum er det største problemet med uttrekk
Arkivdeler som er periodisert, noen ganger pga system oppdateringer Koblinger og verdier Filformater som ikke er i bruk lenger Er det et problem under danning?

26 Fil variasjon

27 Andre ting Mange små feil blir til et stort problem
Manglende systemdokumentasjon er egentlig et problem Det bør være en del av innkjøpet Trenger mer friprog verktøy Ikke fordi det er bedre eller fordi det kan være gratis Slik at depot kan forstå systemene Vi må slutte å tenke arkivdanning som et eget prosess

28 Verktøy Hvilken verktøy har dere for å måle kvalitet?
Hvilken verktøy har dere for å lage uttrekk? Hvilken verktøy har dere for å teste uttrekk? Hvordan kan du da ta stilling til kvalitet/ bevaring?


Laste ned ppt "Noark 4 Hva er uttrekk og viktigheten av verktøyene?"

Liknende presentasjoner


Annonser fra Google