Chapitre 1. Introduction à XML

Le langage XML (eXtended Markup Language) est un langage de format de document. Il dérive de SGML (Standard Generalized Markup Language) et HTML (HyperText Markup Language). Comme ces derniers, il s'agit d'un langage formé de balises qui permet de structurer les documents.

Le langage XML s'est imposé comme le format standard pour les communications entre applications. Il est utilisé dans la plupart des projets de publication sur le WEB ainsi que dans les bases de données.

1.1. Historique

L'historique suivant retrace les grandes étapes qui ont conduit à la naissance de XML.

1986

Introduction de SGML par Charles Goldfarb.

1991

Introduction de HTML par Tim Berners-Lee pour le WEB.

1998

Publication par le W3C de la version 1.0 d'XML.

1999

Redéfinition de HTML 4.0 en XHTML à travers XML.

2004

Publication par le W3C de la version 1.1 de XML pour une mise à jour des caractères spéciaux en lien avec Unicode.

1.2. Intérêts

  • Séparation stricte entre contenu et présentation

  • Structuration forte du document

  • Extensibilité

  • Modèles de documents (DTDs et XML-Schémas)

  • Modularité des modèles

  • Validation du document par rapport au modèle

  • Format texte avec gestion des caractères spéciaux

  • Format libre

  • Nombreuses technologies développées autour de XML

1.3. Dialectes et extensions

XLink et XPointer

Liens entre documents

XPath

Sous-ensemble d'un document

XQuery

Requêtes de base de données

XSL

Transformation de documents

Schémas XML

Modèles de documents

1.4. Applications

RSS (Really Simple Syndication)

Flux de données

XUL (XML-based User interface Language)

Langage de description d'interfaces graphiques

SVG (Scalable Vector Graphics)

Dessin vectoriel

SMIL (Synchronized Multimedia Integration Language)

Multimédia

MathML

Formules mathématiques

WSDL (Web Services Description Language)

Langage de description de services WEB

XML Signature

Format pour les signatures éléctroniques

SAML (Security assertion markup language)

Langage d'échange d'authentifications et d'autorisations

UBL (Universal Business Language)

Bibliothèque de documents standards pour les échanges commerciaux

OpenDocument

Format de document pour les applications bureautiques. Il a d'abord été introduit par OpenOffice et il an ensuite été adopté par d'autres applications comme KOffice.

DocBook

Format de documentation technique utilisé pour cet ouvrage

De nombreux projets informatiques utilisent XML pour le stockage de données et en particulier de fichiers de configurations.

1.5. DocBook

DocBook est un exemple typique d'utilisation de XML. Il s'agit d'un format pour des documents techniques. Cet ouvrage a été écrit en utilisant DocBook.

DocBook était au départ basé sur SGML mais il s'appuie maintenant sur XML. Il met l'accent sur la sémantique du document. Il contient de nombreuses balises permettant de décrire le contenu. Il existe ensuite des outils permettant de traduire un document DocBook en pages HTML ou en document PDF.

DocBook décrit très précisément la structure du document en utilisant de nombreuses balises. Par contre, il ne décrit pas du tout le rendu du document. Il n'est pas possible de spécifer par exemple la couleur ou la fonte du texte. L'idée principale de DocBook est de permettre la production de plusieurs documents finaux à partir d'un même document original : document PDF, pages WEB.