Fagdag Kulturrådet, 18.06.2014 Håvard Lundberg, Student UiO/Vrije Universiteit Amsterdam KONVERTERING OG BRUK AV 1910 FOLKETELLINGEN.

Slides:



Advertisements
Liknende presentasjoner
Fremtidens IKT-løsninger i plan og byggeprosessen en demonstrasjon.
Advertisements

2003 Ontopia AS1 Om emnekartprosjekter Lars Marius Garshol, utviklingsleder Ontopia, Fra emnekratt til emnekart.
Mer html. Krav til innlevering • Utvikles i HTML5 • Være velformet og validert • Benytte css • Drop down menyer • Basere seg på HTML5 tagger for sideoppsett:
INTRODUKSJON TIL SLEKTSFORSKNING I NORGE
Rammer/Frames HTML II IT og læring IT20 4. november 2004.
Java database persistence framework.  SELECT by FROM postnr AS p WHERE ( SELECT DISTINCT postnr FROM addr AS a WHERE user.adrId = a.Id ) = p.postnr;
XML EXtensible Markup Language
Intro til Semantiske Teknologier/ Semantisk Interoperabilitet
Lynkursdagene høsten 2011 Ansvar for egen PC ved UiO Hva bør jeg som bruker vite og gjøre..?
XMLSchema.  Innledende eksempler: Tove 4. Janni 5. Huskelapp 6. Ikke glem avtalen til helgen 7. Vi har sett DTD’en til dette xml dok. Her kommer.
Tips og triks MSP og Projectserver 1) Vise prosjektsammendrag
Semantisk web og ontologier – et forsøk på oppklaring
Linked Data og UBiT Rurik Thomas Greenall, NTNU Library.
XMLSchema.
INTERNETT FORMÅL: Å skape forståelse for og gi kunnskap om utvikling av klient-tjener apllikasjoner basert på web.
ASP.Net Fremover (Asp.Net 3.5 Extensions) Andreas Knudsen, Bekk Consulting AS 31/
XML.
1 Arrayer og form(ularer) (Kapittel 4). 2 Mål  Forstå assosiative og superglobale arrays  Kunne behandle webformularer (forms)  Kjenne forskjellen.
MetaLib og SFX Demonstrasjon 16 oktober Program Utfordringer for bibliotek og brukere Hva er MetaLib og SFX? Live-demo Systemene i bruk Produkter.
© 2010 KPMG AS, a Norwegian member firm of KPMG network of independent member firms affiliated with KPMG International, a Swiss cooperative. All rights.
Skjema/Forms HTML II IT og læring 2/20 november 2001.
Hyperlenker HTML IT20 oktobrt Egen serverFremmed server Intern kobling Lokal kobling Ekstern kobling.
Innledning om HTML IT20 oktober Bakgrunn Konseptet WWW ble født i 1983 i CERN, Geneve Opphavsmann: Tim Berners-Lee, MIT Spre informasjon uavhengig.
Kildekritikk A04 – V2006 Fagenhet for IKT. Nettressurser - kildekritikk På Internett kan hvem som helst publisere nær sagt hva som helst –Side om side.
Kort om XML Språket om språket. XML: Eksempel Hans Tømmerholt.
Kort om HTML ML meg her og ML meg der..
SQL+XQuery+XML+ PHP+XSLT+HTML = $$ ?. CGI Common Gateway Interface Parametere til websider (server-side scripts) I URL'en:
Oppgaveformatet. Oversikt XML-format, spesifisert gjennom et XML Schema. Består av et sett lovlige elementer og attributter og hvordan de kan ordnes i.
Eks. med mapping av AGROVOC til andre kunnskapsorganisasjonssystemer (KOS) Seminar om mapping til Dewey 11. juni 2012 Lisbeth Eriksen, Universitetet for.
Juridisk nettviser Dokumentasjon av konvertering.
© UNIVERSITETETS SENTER FOR INFORMASJONSTEKNOLOGI UNIVERSITETET I OSLO USIT Side 1 Installering av Windows XP med PXE (netboot) Del 1 – forhåndskonfigurering.
v/Bård Henry Moum Jakobsen
81% Mobil formidling på museum Det relevante museet, Trondheim 23. oktober 2014 Bjørn Olav Tveit, Kulturrådet Hvorfor?
Dias 1 Lene Offersgaard Center for Sprogteknologi, Københavns Universitet DK-CLARIN status WP 5.
NIJOS-foredrag1 Veiledningstjeneste: ”Lett tilgjengelig faginformasjon for webtjenester.” En rapport med vurderinger og et eksempel på løsning, NIJOS og.
Mer html display, form,. Krav til innlevering Utvikles i HTML5 Være velformet og validert Benytte css Drop down menyer Basere seg på HTML5 tagger for.
Johan From Professor Handelshøyskolen BI
Modellering og diagrammer Jesper Tørresø DAB1 E september 2007.
Erfaringssamling Forskningsbasert Kompetansemegling TEFT/IRC-Database Erfaringer fra TEFT v/Kjell Molven RF - Rogalandsforskning.
NFU OPPLAND FYLKESLAG Staale Stampeløkken. Agenda: *NFU * Om det å være foreldre til et utviklingshemmet barn *Samarbeid og opplæring.
USIT/UiO, Jasmina Hodzic Noen utfordringer knyttet til sertifikatbasert innholdssikring SSL-sertifikater Jasmina Hodzic, USIT
SAB-oppfølging utdanningskvalitet: Status fra arbeidsgruppen Berit Karseth 17/
Geografiske informasjonssystemer (GIS) SGO1910 & SGO4930 Vår 2004 Foreleser: Karen O’Brien Seminarleder: Gunnar Berglund
2003 Ontopia AS1 Tanker om standarder for e-læring Emnekart og published subjects Lars Marius Garshol, utviklingsleder Ontopia,
HUMIT1731 Hypermedier Introduksjon til XSL Transformation (XSLT)
© USIT/SAPP/GT, Bård Jakobsen UNIVERSITETET I OSLO USIT :34 Side 1 FEIDE – BAS – Cerebrum v/Bård H.M. Jakobsen GT/SAPP/USIT, UiO.
Datautveksling Datautveksling Workshop – Teknologisk rammeverk Morten Borrebæk Statens kartverk, NGIS enheten SOSI – GML SOSI – IFC/XML GML – IFC/XML.
Linked Data 2: Hvordan KoG31 Uke 8, 2013.
Metadata og Capabilities Overlapp og sammenhenger.
Artane Gates Online Reading artane tablet available in india buy trihexyphenidyl can used acne artane generic name adderall artane gates online reading.
Distributed modelling for a centralized data model - The Danish Basic Data Model Per de Place Bjørn Ph. D., Information Architect Basic Data Model Project.
LENKEDE ÅPNE DATA – EKSEMPLER OG VERKTØY HOS RIKSARKIVET (KULTUR- OG NATURREISE 13. NOVEMBER 2015) v/ Joachim Fugleberg og Lars Nygaard.
OpenRefine. Hvorfor vaske og rydde?  All metadata er uryddig Konverteringer Duplikater Inkonsistent bruk av navn Datoformateringer Flere verdier i samme.
Migrasjon International Organization for Migration.
9 september 2016Anders Olsson og Ronny Haugan R IKS A NTIKVAREN Enkelt, Digitalt og Brukervennlig.
Innleveringsoppgaver i forskningsmetode
Title: «How to use different tools and/or machines in the workshop»
v/Bård H.M. Jakobsen GT/SAPP/USIT, UiO
Dette er et eksempel på plassering av logoene.
Lisbeth Eriksen, Universitetet for miljø- og biovitenskap (UMB)
Global oppvarming Mål:
تطبيقات الحاسب الآلي في التعليم والادارة والاشراف التربوي
Bygdebase LOKHIS Loen.lokhis.no Loen Bygdebase
Discharge Data 2017 (data reported until )
A review of exploration activity and results on the NCS
Behind the scene Anders Hattestad ,
EPiServer Connect for CRM
Turtle Terse RDF Triple Language, a concrete syntax for RDF
URI-pattern Geographical data in Norway
Utskrift av presentasjonen:

Fagdag Kulturrådet, Håvard Lundberg, Student UiO/Vrije Universiteit Amsterdam KONVERTERING OG BRUK AV 1910 FOLKETELLINGEN

AGENDA Konvertering av 1910 folketellingen til RDF Demonstrasjon av enkel prototype

MODELL FOR FT1910 Building Apartment Person Address, Building type, Number of floors, Municipality, Geo Lat/Lng … Floor, Number of rooms, Number of kitchen, Rent … Name, Gender, Birth date, Birth place, Marital status, Occupation …

DATAOMFANG – 3 FYLKER FOLKETELLING 1910 Entity typeNumber of entities Triples Average triples Apartment11,403153,45313 Building46,416808,18717 Person289,0454,607,95016 Generated URIs of attributes-371,462- Census ontology-392- Total346,8645,941,05217

BRUK AV EKSISTERENDE VOKABULARER FOAF: BIO: ResumeRDF: Building and Room: GEO: SKOS: Nye som burde brukes (fremfor ny ontologi): Europeana / Norvegiana Dublin Core

FÅ VERDIER FOREKOMMER HYPPIG

URI GENERATION EntityTypeGeneration strategy Building owl:ClassUnique ID in dataset used Apartment owl:ClassUnique ID in dataset used Person foaf:PersonUnique ID in dataset used Municipality skos:ConceptMapping with external dataset Occupation skos:ConceptMapping with external dataset Building type skos:ConceptNormalization and URL encoding Family role skos:ConceptNormalization and URL encoding Marital status skos:ConceptNormalization and URL encoding Religion skos:ConceptNormalization and URL encoding Birth place skos:ConceptNormalization and URL encoding Gender foaf:GenderNormalization and URL encoding

KOBLING TIL ANDRE DATASETT * White bubbles indicate "offline" datasets, not available in the LOD-cloud.

LESSONS LEARNED Scarce data to link to Concept drift Simple normalization methods suffice Additional datasets can increase data quality Existing vocabularies not sufficient Conversion to LOD can increase data quality Case-specific conversion scripts is time consuming, generic tools needed Techniques needed to propose and validate links

FT 1910: KJENTE NAVN Å KOBLE TIL

MEN HVA MED OLA NORMANN? Vanskelig å finne eksterne kilder Men, noen aktuelle kilder: Panteregister Pantebok Kirkebok Matrikkel

ENKEL PROTOTYPE

KILDER BRUKT Folketellinger: Folketelling 1801 Folketelling 1865 Folketelling 1900 Folketelling 1910 Tinglysningsdokumenter: Pantebøker Panteregister Matrikkel 1886 Kirkebok (dåp, konfirmasjon, vielse) Digitalt Museum / Kulturminnesøk (JSON) GeoNames (JSON)

VIDERE ARBEID Konvertere hele FT1910 til RDF Utvikle ontologier for vanlige attributter: familiestilling, religion, yrke (HISCO/NAPP), bygningstype etc Utvikle ny modell som kan brukes til å koble ulike (historiske) datasett sammen (hvem, hva, hvor, når)? Crowdsourcing verktøy for å opprette koblinger mellom autoriteter?

TAKK FOR OPPMERKSOMHETEN! Håvard Lundberg twitter.com/havard