Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

XML Extensible Markup Language Program •XML – hvordan ser et XML dokument ut? •Programmatisk behandling av XML •SAX – Simple API for XML •DOM – Document.

Liknende presentasjoner


Presentasjon om: "XML Extensible Markup Language Program •XML – hvordan ser et XML dokument ut? •Programmatisk behandling av XML •SAX – Simple API for XML •DOM – Document."— Utskrift av presentasjonen:

1

2 XML Extensible Markup Language

3 Program •XML – hvordan ser et XML dokument ut? •Programmatisk behandling av XML •SAX – Simple API for XML •DOM – Document Object Model •JDOM – Java DOM •Transformasjonsbasert XML behandling •XSLT

4 Hvorfor •Integrasjon •Interne systemer i bedrifter •Hele næringskjeder/nettverk •Konsolidering av informasjonkilder •Innhold vs presentasjon – dekobling •Datalagring

5 Hva •Tekst-basert •Bestanddeler •Elementer – start-tag og slutt-tag •Attributter – tilhører elementer •Tekst – inneholdt i et element •Kommentarer, direktiver, CDATA •XML-standarden (W3C) •Definere velformede dokumenter

6 Text-contents (no contain special characters) Some more text http://www.w3.org/1999/xlink http://www.systek.no/ Eksempel XML Definition (prolog) Opening tag Processor Instruction Root elementNested element Textual content Namespace usage Closing tag Attribute Empty element can be collapsed Namespace definition

7 Begrensninger i forhold til HTML List item text Second list item text Some normal text some bold text some bold-italic some italic Systek First not closed Incorrectly nested elements Empty element must be explicitly closed All attribute values must be ”quoted”

8 Document Type Definitions •Definerer lovlige dokumenter for en dokument- type (”XML-språk”) •Kan definere – for element-noder: •Tillatte underelementer, inkludert rekkefølge •Tekst tillatt? (ellers blir whitespace ignorert) •Tillatte og påkrevde attributter •For attributter •Tillatte verdier •Id-semantikk (unike per dokument)

9 DTD Eksempel (oppskrifthefte) …

10 Alfabetsuppe: XML standarder •DTD – Document Type Definition •XSLT – Extensible Style Language Tranformations •XLink/XPointer/XPath •DOM – Document Object Model •SAX – Simple API for XML •SOAP – Simple Object Access Protocol •Java-spesifikk: JAXP, JAXM, JAXB, TrAX, JDOM

11 Eksempler på XML-språk •XSLT er selv et XML språk •XHTML 1.0 •VoiceXML •SOAP •SVG •SMIL •MathML •WML

12 Organisasjoner •XML FokusIBM, Microsoft, Sun, og Oracle •Java XML parsere: Oracle, OASIS og ASF ++ •Xml.Apache.Org: Bygger på kildekode donert fra Sun (Project X/Crimson) og IBM (XML4J) •Xerces: XML Parser (DOM & SAX) •Xalan: XSL Processor (XSLT & XPath) •Cocoon: Servlet-based XSL processor (uses Xalan) •SOAP •Batik (SVG processor)

13 Hvordan •Event-basert (f. eks. for å bygge en struktur) •SAX •Tre-basert (f.eks. for å manipulere et dokument) •DOM og JDOM •Transformasjon-basert (f.eks. for å vise i HTML eller PDF) •XSLT

14 Demo: Konstruere et JTree fra et XML dokument

15 SAX - Fremgangsmåte 1.Definér en dokument hånterer (DocumentHandler) 2.Assosiert håntereren med en parser 3.Angi dokument 4.Parseren vil kalle DocumentHandler’s metoder

16 Rull opp ermene! public interface DocumentHandler { void startElement(String name, AttributeList atts) void endElement(String name) void characters(char ch[], int start, int length) void startDocument() void endDocument() void ignorableWhitespace(char ch[], int start, int length) void processingInstruction(String target, String data) void setDocumentLocator (Locator locator); }

17 Eksempel: Konstruerer en JTree public void startElement (String nsURI, String localName, String qName, Attributes attrs) { StringBuffer nodeText = new StringBuffer("<" + localName); for ( int i=0; i<attrs.getLength(); i++ ) nodeText.append(" " + attrs.getLocalName(i) + "='" + attrs.getValue(i) + "'"); nodeText.append(">"); DefaultMutableTreeNode newNode = new DefaultMutableTreeNode(nodeText.toString()); this.currentNode.add(newNode); this.currentNode = newNode; this.currentText = new StringBuffer(); } public void characters (char ch[], int start, int length) { this.currentText.append(ch, start, length); } public void endElement(String nsURI, String localName, String qName) { String contents = this.currentText.toString().trim(); if ( contents.length() != 0 ) this.currentNode.add(new DefaultMutableTreeNode(contents)); this.currentNode = (DefaultMutableTreeNode)currentNode.getParent(); }

18 Start parsingen SaxTreeViewer(String docName) { TreeInsertingDocHandler myDocHandler = new TreeInsertingDocHandler(); String parserClass = "org.apache.xerces.parsers.SAXParser"; try { XMLReader parser = XMLReaderFactory.createXMLReader(parserClass); parser.setContentHandler(myDocHandler); parser.parse(docName); } catch (SAXException se) { se.printStackTrace(); } catch (IOException ioe) { ioe.printStackTrace(); } getContentPane().add(new JTree(myDocHandler.currentNode.getFirstChild())); }

19 SAX – forklaring •Høy performance •Har ingen intern tre-struktur •Vi lager istedet vår egen (javax.swing.tree.DefaultTreeModel) •Går gjennom dokumentet én gang •Lineært: Fra begynnelse til slutt

20 DOM •W3C standard •DOM Level 2 på over 400 sider •Definerer et dokument som et tre •Sentrale klasser: •Node + subklasser (Attr, Character, Element...) •NamedNodeList (for Attributes) •NodeList (for subtrær)

21 Fra Xerces’ DOM javadoc interface org.w3c.dom.NamedNodeMap interface org.w3c.dom.Node interface org.w3c.dom.Attr interface org.w3c.dom.CharacterData interface org.w3c.dom.Comment interface org.w3c.dom.Text interface org.w3c.dom.CDATASection interface org.w3c.dom.Document interface org.w3c.dom.DocumentFragment interface org.w3c.dom.DocumentType interface org.w3c.dom.Element interface org.w3c.dom.Entity interface org.w3c.dom.EntityReference interface org.w3c.dom.Notation interface org.w3c.dom.ProcessingInstruction interface org.w3c.dom.NodeList

22 Org.w3c.dom.Node Aksessorer: •NodeName •NodeValue (rw) •ParentNode •ChildNodes •First, Last Child •Previous, Next Sibling •Attributes •OwnerDocument Operasjoner •insertBefore •replaceChild •removeChild •appendChild •cloneNode

23 DOMTreeModel v. 1 •Bruker Adaptor patternet •Gir innblikk i både DOM og JTree •Se vedlagt kode JTreeTreeModel DOMTreeModel org.w3c.dom.Document

24 DOMTreeModel v. 2 •Har XPath støtte •Apache Xalan •Skriv inn en XPath •Trykk return •Matchende noder velges

25 DOMTreeModel v. 3 •Demonstrerer endringer i et DOM tre •Koden er ikke spesielt pen, men ligger vedlagt alikevel •Operasjoner: •Legge til Element-node •Legge til Tekst-node •Endre eller sette attributt •Remove node •Lagre

26 JDOM •JDOM er utviklet av Brett McLaughlin, forfatter av ”Java and XML” •Gir en mer Java-vennlig DOM enn DOM •Bruker overloading •Bruker eksisterende Java-klasser, som List •Mangler mye av det mer avanserte relatert til DOM, f.eks. XPath •Kildekode for JDomTreeViewer ligger vedlagt

27 XPath •En del av familien med referanser i XML •Brukes til å velge ut deler av et dokument-tre f.eks. under Transformasjoner (XSLT) •Minner om filstruktur •. er ”denne node” •.. er •/ skiller noder på forskjellig nivåer •/ angir dokument-rot •// finner noder på ALLE undernivåer •* er alle element-noder •text() finner tekst-noder

28 XPath eksempler •person •./person (samme som forrige) •./person/* •./person/*/text() •./person//*/text() •//text()

29 XPath •Begrensninger/filter angis i [] •//person[./name/family/text() = "Worker"] •//person[name/family/text()='Worker']/email/text() •Default – nodenummer •//person[1]/name/* •Attributter angis med @ •//person[@id='two.worker']/name/*/text() •Dersom DTD angir id attributter, kan disse brukes: •id(//person/link/@manager)/name/*

30 XPath – the full story •Formene vi har sett er forenklinger •Full XPath bruker akser – syntaks: aksenavn::nodetest • == child:: •. == self::node() •.. == parent::node() •@ == attribute:: •// == descendant::

31 XPath akser eksempler •./person == self::*/child::person •//link[@manager = "Big.Boss"]/.. == descendant::link[attribute::manager = "Big.Boss"]/parent::

32 XSLT •Transformerer fra et XML språk til et annet •Bruker templates for å behandle segmenter •Bruker XPath for å velge ut segmenter •Vi skal lage tre XSL stylesheets som alle skal oversette et XML språk (recipeML) til XHTML 1.0

33 Eksempel <xsl:template match="XPath pattern" [name="name" priority="number" mode="mode"]> Tekst, XML tekst, <xsl:value-of select="XPath expression"/>

34 Workshop – Delicatessen from the Kitchen of Mrs. Brodwall •For oppgaven er det definert et oppskriftshefte •10 Gode Oppskrifter •Oppskriftene bruker et DTD •Vi skal lage tre stylesheets 1.List alle kategorier 2.List alle oppskrifter i en kategori 3.Vi én oppskift

35 Organisasjon •Hver gruppe har ett område på STEP serveren •Se http://jonatan:port/groupX/ for instruksjoner og tips •.../groupX/recipes/stylesheet?param=value... •Eksempel.../recipe/recipes/list?type=Chinese •Bruker list.xsl med parameter type satt til Chinese •Stylesheet’ene ligger rett under groupX-sharet på jonatan •types.xsl, list.xsl, og show.xsl er definert •Dere kan godt definere egne stylesheets


Laste ned ppt "XML Extensible Markup Language Program •XML – hvordan ser et XML dokument ut? •Programmatisk behandling av XML •SAX – Simple API for XML •DOM – Document."

Liknende presentasjoner


Annonser fra Google