Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

Juridisk nettviser Dokumentasjon av konvertering.

Liknende presentasjoner


Presentasjon om: "Juridisk nettviser Dokumentasjon av konvertering."— Utskrift av presentasjonen:

1 Juridisk nettviser Dokumentasjon av konvertering

2 Agenda (for workshop) 09:15-09:30 - Introduksjon 09:30-10:00 - Grov konverteringsscript 10:00-10:30 - RDF/Turtle formatet 10:30-11:30 - Datamodellen i Sublima Lunch 12:15-12:30 - Verktøy 12:30-13:00 - SPARQL 13:00-14:00 - Steg for steg å lage script (spørringer) 14:00-16:00 - Verktøy

3 Dokumentasjon Turtle formatet Prosess steg

4 Turtle-formatet Terse RDF Triple Language http://www.w3.org/TeamSubmission/turtle/ RDF - Resource Description Lauguage Data-beskrivelses ekvivalenten til HTML Triple Subject predikat/property objekt/verdi I en datakilde @prefix foaf: foaf:name ”Rebecca” ; foaf:knows. I en helt annen datakilde @prefix dct: dct:author ; dct:title ”Mitt dokument”@no, ”My document”@en. ; = leses ”og”, = leses ”også”. = leses ”punktum” @ = leses ”på språket”

5 Konverteringsprosessen Steg 1: Konverter original-filer til RDF Steg 2: Konvertring til å matche Sublimas struktur og vokabular

6 Java -jar convert.jar -input ujur2010_11_10 -output resultat-steg1.ttl -namespaces juridisknettviser.ttl Prosess (1) - konverter til RDF Steg 1. Konverter original-filer til RDF –Spesialkode laget for dette formålet, se convert.jar –Kildekode ligger tilgjengelig i Subversion (https://submarine.computas.com/oracle-lod/trunk/data- sources/juridisknettviser/) –Konverterer CKV-filer (Comma separated Key Value pairs) (i katalogen ujur2011_11_10) til RDF fil der filens vokabular er identisk med kildekoden –Vokabularets namespaces er angitt i egen fil (steg1-ns.ttl) –Resultatet legges i en RDF/Turtle fil resultat-steg1.ttl –Følgende kjøres fra kommandolinje (merk alt på én linje)

7 Prosess (2) - hva skal beholdes fra postene? Vi trenger nå å beslutte hva som skal være med (nåværende RDF-navn på egenskap - : gitt i parantes under) –Tittel (voc:Title) –Beskrivelse (voc:Description) –Identifikator (voc:Handle) –URI (res: + identifikator) –URL (voc:URI-v1 og URI-v2)

8 -------------------------------------------------- | egenskap | ================================================== | sub:comment | | | sub:keywords | | | sub:url | | sub:status | | | sub:committer | -------------------------------------------------- Prosess (3) - hva kan sies om en ressurs i Sublima? Vi kjører spørring over vokabular-filene for å se hva som kan sies om en en ressurs (sub:Resource) prefix sub: prefix rdfs: SELECT ?egenskap WHERE { ?egenskap rdfs:domain sub:Resource. } java arq.sparql -query ontology-query1.sparql -data sublima-ontology.ttl

9 -------------------------------------------------- | egenskap | ================================================== | sub:comment | | dct:dateAccepted | | dct:dateSubmitted | | dct:description | | dct:subject | | dct:title | | sub:keywords | | dct:publisher | | dct:language | | dct:format | | dct:audience | | dct:identifier | | sub:url | | sub:status | | | sub:committer | -------------------------------------------------- Prosess (3) - hva kan sies om ressurser i Sublima? (2) Uthevinger er det vi ønsker å benytte Vi har omskrevet spørringen ved å benytte noen prefikser (dublin core) prefix sub: prefix rdfs: prefix dct: SELECT ?egenskap WHERE { ?egenskap rdfs:domain sub:Resource. }

10 voc:Description ----> dct:description voc:Title ----> dct:title voc:Handle ----> dct:identifier * Voc:URI-v1 ----> sub:url * Her benytter vi som objekt, istedet for nummeret, den konstruerte URIen for ressursene laget i steg 1 Proess (4) - bestem hvordan ønsker vi å mappe til Sublimas vokabular(er)? Spesielle ting å huske på –Språk på tekster (ok) - bør gjennomgåes manuelt i ettertid –URI som lenker (ok) –Æ, ø, å / UTF-8 problematikk (ok) –Legge til statements (ok) - dette gjør vi spesielt i konverteringen wdr:describedBy status:godkjent_av_administrator ; rdf:type sub:Resource ; ( sub:committer user:konvertert ; )

11 Prosess (5) - lag konverteringsspørring Steg 2: Konvertring til å matche Sublimas struktur og vokabular –Kjører en SPARQL spørring som resulterer i et nytt datasett –Merk at filen er oppdatert etter opprinnelig konvertering (identifikator i sublima er gitt av dets URL) prefix dct: prefix voc: prefix sub: prefix wdr: prefix status: CONSTRUCT { ?url dct:identifier ?s ; dct:title ?title ; dct:description ?description ; sub:url ?url ; wdr:describedBy status:godkjent_av_administrator ; a sub:Resource. } WHERE { ?s voc:Title ?title ; voc:Description ?description ; voc:Handle ?id ; voc:URI-v1 ?url. }

12 Prosess (6) - kjør konvertering Steg 2 (cont.) –For å kjøre denne spørringen/konverteringen, trengs Jena å være installert og i classpath. Se http://jena.sourceforge.net/ for instruksjoner om dette.http://jena.sourceforge.net/ –Når jena er installert kjøres følgende –Dette produserer en fil ”steg2.ttl” java arq.sparql -query convert-query1.sparql -data resultat-steg1.ttl > resultat-steg2.ttl

13 Prosess (7) - resultatet Steg 2: (cont) –Første post er gitt under –Merk at URLen for denne posten fantes to ganger i kildene. Dette har medført at den har fått to identifikatorer (dct:identifier) og to titler og beskrivelser. Der dette kun er oversettelser anbefales det å kun endre @no til @en der språket en engelsk. Da vil Sublima fungere. @prefix res:. @prefix sub:. @prefix status:. @prefix dct:. @prefix voc:. @prefix wdr:. sub:Resource ; dct:description "Oversikt over Malaysias rettssystem med lenker til rettskilder og institusjoner. Av Shaikh Mohamed Noordin og Lim Pui Keng for GlobaLex."@no ; dct:description "Oversikt over rettssystemet i Malaysia. Av Shaikh Mohamed Noordin and Lim Pui Keng for Globalex"@no ; dct:identifier res:1204725570-4769 ; dct:identifier res:1206525892-29585 ; dct:title "An Overview of Malaysian Legal System and Research"@no ; wdr:describedBy status:godkjent_av_administrator ; sub:url.

14 Referanser SPARQL Protocol and RDF Query Language –http://www.w3.org/TR/rdf-sparql-query/http://www.w3.org/TR/rdf-sparql-query/ TURTLE –http://www.w3.org/TeamSubmission/turtle/http://www.w3.org/TeamSubmission/turtle/


Laste ned ppt "Juridisk nettviser Dokumentasjon av konvertering."

Liknende presentasjoner


Annonser fra Google