Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

Forskningsprogram for humanistisk informasjonsteknologi Tone Merete Bruvik HIT-senteret, Universitetet i Bergen XML og XSL i MALVINE-prosjektet Bruk av.

Liknende presentasjoner


Presentasjon om: "Forskningsprogram for humanistisk informasjonsteknologi Tone Merete Bruvik HIT-senteret, Universitetet i Bergen XML og XSL i MALVINE-prosjektet Bruk av."— Utskrift av presentasjonen:

1 Forskningsprogram for humanistisk informasjonsteknologi Tone Merete Bruvik HIT-senteret, Universitetet i Bergen XML og XSL i MALVINE-prosjektet Bruk av SGML/XML innen arkivsektoren: konvertering av manuskript- og brev- kataloger til SGML/XML, og presentasjon av ulike versjoner vha. XSL stilark.

2 Forskningsprogram for humanistisk informasjonsteknologi 2 Satsningsområder for HIT-senteret Språkteknologi med hovedvekt på korpuslingvistikk, terminologi og leksikografi Avansert utgivelsesfilologi Opprettelse av omfattende digitale ressurser (avanserte Verdensvev-baserte databaser) Programvareutvikling http://www.hit.uib.no/

3 Forskningsprogram for humanistisk informasjonsteknologi 3 Noen prosjekter ved HIT-senteret Elektronisk utgave av Ibsens skrifter (SGML- kodet) Wittgensteinarkivet ICAMEICAME - International Computer Archive of Modern and Medieval English NORDLEXIN-N

4 Forskningsprogram for humanistisk informasjonsteknologi 4 TEI - Text Encoding Initiative HIT-senteret er vert for TEI consortium, sammen med: - University of Virginia - University of Oxford - Brown University Se: http://www.tei-c.org/

5 Forskningsprogram for humanistisk informasjonsteknologi 5 MALVINE Manuscripts And Letters Via Integrated Networks in Europe Oppstart: juli 1998; avsluttes: desember 2000 Delfinansiert av EU, IV rammeprogram. Se:http://www.malvine.org/

6 Forskningsprogram for humanistisk informasjonsteknologi 6 Brev- og manuskript-samlinger Består av unike objekter. De er spredt over mange steder og institusjoner. Katalogene over innholdet i arkivene er helt avgjørende med tanke på bruksverdi. Kildetekstene vil bare bli kodet i helt spesielle tilfeller.

7 Forskningsprogram for humanistisk informasjonsteknologi 7 Mål for MALVINE Å bedre tilgangen til katalogene ved en del sentrale manuskriptsamlinger i Europa ved å utvikle et felles brukergrensesnitt over internett mot de ulike katalogdatabasene. Vi vil bruke multi-site søkemaskiner, OPAC, Z39.50 og diverse konverteringsverktøy.

8 Forskningsprogram for humanistisk informasjonsteknologi 8 MALVINE konsortium: 18 partnere, fra 9 land i Europa. Staatsbibliothek zu Berlin, prosjektkoordinator. Crossnet Systems Ltd., prosjektstyring. Utviklere: Joanneum Research, Østerrike. HIT-senteret, UiB. Fraunhofer-Institut für Software- und Systemtechnik, Germany.

9 Forskningsprogram for humanistisk informasjonsteknologi 9 Dataleverandører: Biblioteca de Universidad Complutense Biblioteca Nacional de Portugal British Library Deutsches Literaturarchiv Forschungsstelle und Dokumentationszentrum für Österreichische Philosophie Goethe- und Schiller-Archiv

10 Forskningsprogram for humanistisk informasjonsteknologi 10 Institut für Wissenschaftstheorie und Wissenschaftsforschung der Universität Wien Institut Mémoires de l'Edition Contemporaine Nationalmuseet i Danmark Österreichische Nationalbibliothek Swiss National Library K.G. Saur Verlag

11 Forskningsprogram for humanistisk informasjonsteknologi 11 SGML brukbarhetsstudie Mål: Lage konverteringsverktøy mellom ulike katalogformater og SGML/XML. Opparbeide og formidle erfaring med bruk av SGML/XML innen arkiv- og biblioteks- sektoren.

12 Forskningsprogram for humanistisk informasjonsteknologi 12 Valg av DTD Vi har vurdert DTDer som CIMI, MARC, EAD og TEI. EAD (Encoded Archival Description) ble valgt fordi den er laget spesielt for arkivmateriale, den er relativt oversiktlig, godt dokumentert, er i bruk og har blitt godt mottatt. Mer om EAD: http://www.loc.gov/ead/

13 Forskningsprogram for humanistisk informasjonsteknologi 13 Relasjonen til resten av MALVINE- prosjektet Søkemotor Lokale kataloger m/Z39.50 Lokal katalog u/Z39.50 EAD katalog Prosesserer XSL Kopi av katalog m/Z39.50 Fil Perl skript

14 Forskningsprogram for humanistisk informasjonsteknologi 14 Konvertering til XML/SGML http://helmer.hit.uib.no/malvine/EADpage.html XML Perl skript Eksport Konv. tabell Konv. tabell Konv. tabell Konv. tabell Konv. tabell Lokal katalog

15 Forskningsprogram for humanistisk informasjonsteknologi 15 Lokale formater Ca. 12 ulike lokale formater (USMARC,UNIMARC, RNA/MAB-2, o.a.) Bare de delene av formatene som blir brukt i manuskript/brev kataloger kan konverteres.

16 Forskningsprogram for humanistisk informasjonsteknologi 16 Koding av diakritiske tegn Vi bruker denne Unicode kodingen: à = a + ` (à) Ikke à (à)

17 Forskningsprogram for humanistisk informasjonsteknologi 17 Kataloger på WWW Kataloger kodet i XML tilgjengelig fra http://helmer.hit.uib.no/malvine/EADpage.html Bruker XSL - Extensible Stylesheet Language. Vi har laget et CGI-skript slik at brukeren kan velge stilark. Kan leses med Internet Explorer 5.0

18 Forskningsprogram for humanistisk informasjonsteknologi 18 EAD-siden ved HIT-senteret

19 Forskningsprogram for humanistisk informasjonsteknologi 19 Konvertering fra EAD til lokale formater Katalogene holdes i XML, men stilarkene presenterer dem i lokalt format. På forsøksstadiet. XSL stilarkene er skrevet for IE5.0, som delvis følger XSL-versjonen fra desember 98. Fungerer ok til demoformål.

20 Forskningsprogram for humanistisk informasjonsteknologi 20 #008 980403I19381995sz eng d #035 -a1165-81660 #039 -b64 #040 -aSLB-cSLB #090 -aSLA Highsmith #100 1 -aHighsmith, Patricia #245 10-a[Nachlass Patricia Highsmith.-f1938-1995]-k[Ms.] #300 -aca. 50-fLaufmeter #506 -aDocuments are available for consultation only in the SLA Readiing #520 -aA: Literary works: typewritten manuscripts of various novels, including... Eksempel på originalpost (USMARC):

21 Forskningsprogram for humanistisk informasjonsteknologi 21 Eksempel kodet i EAD 1165-81660 SLB SLB SLA Highsmith Highsmith, Patricia Nachlass Patricia Highsmith. 1938-1995 Ms. ca. 50 A: Literary works: typewritten manuscripts of various novels, including unpublished fragments of The Click of the Shutter. A large number of typewritten manuscripts of partly unpublished short stories and essays. Some 38 'cahiers' or literary notebooks. A: A large collection of sketches and water colors by the author.

22 Forskningsprogram for humanistisk informasjonsteknologi 22 Konverteringen En linje fra originalposten: #300 -aca. 50-fLaufmeter Regulært uttrykk i Perl: \#300\s+-a(.+)-f(.+) Oversettes til EAD koding: ca. $1

23 Forskningsprogram for humanistisk informasjonsteknologi 23 XML-kodingen

24 Forskningsprogram for humanistisk informasjonsteknologi 24 Eksempel på bruk av XSL-stilark

25 Forskningsprogram for humanistisk informasjonsteknologi 25 Som USMARC

26 Forskningsprogram for humanistisk informasjonsteknologi 26 Som NMD format

27 Forskningsprogram for humanistisk informasjonsteknologi 27 Konklusjon Vårt arbeid har ført til økt interesse for SGML og XML blant partnerne i MALVINE- prosjektet. XSL-stilark er godt egnet for våre formål.

28 Forskningsprogram for humanistisk informasjonsteknologi 28 Referanser HIT-senteret: http://www.hit.uib.no/ MALVINE-prosjektet: http://www.malvine.org Om EAD: http://lcweb.loc.gov/ead/ XML i MALVINE-prosjektet: http://helmer.hit.uib.no/malvine/EADpage.html


Laste ned ppt "Forskningsprogram for humanistisk informasjonsteknologi Tone Merete Bruvik HIT-senteret, Universitetet i Bergen XML og XSL i MALVINE-prosjektet Bruk av."

Liknende presentasjoner


Annonser fra Google