De SGML à XML

Un article de WikiTuto.

Jump to: navigation, search
  • XML Concepts de base
  1. Historique : de SGML à XML
  2. XML:Mise en oeuvre
  3. Structure d'un document XML
  4. Support par les navigateurs
  • Prise en main d'XML CookTop
  1. XML CookTop généralités
  2. Interface
  3. Exercices
  • Prise en main d'oXygen XML Editor
  1. Généralités
  2. Interface
  3. Fonctionnalités
  4. Exercices
  • Déclarations de Type de Document
  1. Introduction
  2. Types de DTD
  3. Déclarations d'éléments
  4. Déclarations d'attributs
  5. Déclarations d'entités
  • Initiation aux Schéma XML
  1. Introduction
  2. Les premiers pas
  3. Déclarations d'éléments et d'attributs
  4. Les types de données
  5. Espaces de nom
  6. Les dérivations
  7. Diverses autres fonctionnalités
  • Mise en forme à l'aide de feuilles de style XSL
  1. Présentation
  2. Exemples de mises en forme
  • Mise en forme à l'aide de feuilles de style XSL (XSLT)
  1. Les expressions de sélection
  2. XPath
  3. Éléments XSLT
  • Fonctions XPath
  1. Fonctions XPath applicables aux nœuds
  2. Fonctions XPath applicables aux chaînes de caractèress
  3. Fonctions XPath applicables aux nombres
  4. Fonctions booléennes
  5. Autres fonctions
  • Utilisation du DOM et XSLT dynamique
  1. Insertion de code JavaScript dans une page
  2. Utilisation du DOM
  • Synchroniser des contenus multimédia avec SMIL
  1. Généralités
  2. Construction progressive d'un fichier SMIL
  3. Conclusion
  • Un format de dessin vectoriel en XML: SVG
  1. Introduction
  2. SVG de base
  3. Éléments graphiques de base
  4. Structuration: éléments de groupage et références
  5. Transformations
  6. Autres fonctionnalités
  • L'animation dans le SVG
  1. Introduction
  2. Animation de base: l'élément animate
  3. Des animations plus complexes
  • Plus loin que les formulaires HTML: XForms
  1. Généralités
  2. Fonctionnalités des formulaires XForms
  3. Dans la pratique
  4. Pour aller plus loin...
  • Quelques mots sur les Services Web
  1. Généralités
  2. Trouver un service Web
  3. Accéder à un service Web
  4. Récapitulation et inconvénients
Source : Gilles Chagnon

Sommaire

Historique : de SGML à XML

XML dérive d'un langage développé dans les années 80, le SGML. Ce langage était complexe à apprendre et utiliser quotidiennement. Une version allégée, le HTML a donc été développée ; mais ce dernier, malgré de nombreuses adaptations, ne pouvait pas être étendu à l'infini, au fur et à mesure de l'augmentation des besoins des développeurs. C'est alors que fut créé le XML.

SGML et HTML

Le SGML

Le SGML (Standard Generalized Markup Language, langage de balisage standard généralisé), premier essai de normalisation concernant les documents électroniques, a été adopté comme standard en 1986.

Le SGML est constitué de plusieurs éléments. Ceux-ci changent pour chaque application SGML :

  • Définition du type de document (DTD) : cet élément sert à préciser la structure du document ;
  • Instance du document : il s'agit du texte réel du document comportant les éléments SGML qui ont été définis dans la DTD et qui identifient les diverses parties du texte. Même si une instance de document peut partager une DTD avec d'autres documents, elle ne peut se conformer qu'à une seule DTD ;
  • Synthèse du document : cet élément sert à préciser les principaux aspects de l'application SGML. C'est à ce niveau que sont déterminées les options et qu'est précisé le jeu de caractères qui sera utilisé ainsi que les autres fonctions similaires.

Ce langage servant à préciser la structure d'un document quelconque, il est compréhensible que sa généralité le rende difficile d'apprentissage, et complexe d'emploi. En particulier, il était inadapté à l'écriture de documents pour Internet. Il a donc été nécessaire d'en dériver le langage HTML.

Le HTML

Comme il a été dit précédemment, c'est aujourd'hui le standard du développement web. Il est cependant amené à disparaître progressivement, étant remplacé par le XHTML, un langage qui lui est extrêmement similaire, mais permettant la production de documents aux normes XML.

Ce langage est facile à apprendre et à utiliser ; il a d'ailleurs donné lieu au développement de nombreux outils de publication sur Internet :

  • logiciels WYSIWYG -"What You See Is What You Get"- tels que Nvu, FrontPage ou Dreamweaver ;
  • outils de publication de contenu comme le populaire SPIP, eZPublish, PHPNuke...

... sans oublier qu'il est possible d'utiliser de simples éditeurs de texte comme (X)Emacs sous Linux ou bien le Bloc-notes sous Windows.

Le HTML étant une application SGML, il est donc lié lui aussi à une DTD. Il en existe parfois plusieurs par version d'HTML. Celles de la version 4.01 se trouvent référencées sur le site web du W3C : DTD HTML 4.01 Strict, Transitional, Frameset...

Un inconvénient du HTML est son champ d'action limité : il n'est ainsi pas possible de définir autre chose qu'une page Web. On ne peut par exemple pas ajouter de nouveaux éléments (on pourrait imaginer insérer des équations mathématiques, mais ce n'est pas possible).

Au bout de quelques années, la demande se faisant de plus en plus forte pour la définition d'un nouveau format, et le langage HTML rencontrant ses limites, le W3C a commencé à organiser des groupes de travail sur un autre descendant du SGML, le XML.

XML

Le XML est un dérivé du SGML. Il tente de se servir des principes de simplicité du HTML et de la souplesse SGML.

Simplification de SGML, puisqu'il ne reste que 35 pages de spécification contre 155 pages en ce qui concerne le SGML, le format XML est rapidement apparu adapté à beaucoup plus d'usages que ses concepteurs le pensaient initialement. Il conserve certains aspects de SGML.

Le plus important point commun avec le SGML est le fait que tout document XML peut être basé sur une DTD ou un Schéma. Cette association n'est cependant pas obligatoire, et un fichier XML peut très bien se suffire à lui-même.

Une autre caractéristique importante est que dans un document XML, la mise en forme des données est totalement séparée des données elles-mêmes. Cela permet de séparer complètement l'information (le contenu) de son apparence (le contenant), et donc de fournir plusieurs types de sortie pour un même fichier de données, en fonction de l'utilisateur ou de l'application demandeuse (tableau, graphique, image, animation multimédia, fichier HTML, fichier PDF...).

De plus, la possibilité de créer les éléments que l'on désire permet de rendre le fichier lui-même lisible -et modifiable- par un être humain : on peut donner aux informations contenues dans un tel fichier le nom que l'on veut, et les ordonner selon son désir.

Un document XML peut ainsi prévoir plusieurs cibles, comme par exemple l'écran d'un téléphone portable, celui d'un ordinateur de bureau, une base de données, une application logicielle, etc.

Il est également possible d'effectuer des sélections par tri, des générations automatiques de tables des matières et bien d'autres fonctions encore, grâce au langage de feuilles de style XSL.

Sources

Gilles Chagnon

Voir aussi

Boîte à outils
Annuaire gratuitCe site est listé dans la catégorie Informatique : Aide et astuces en informatique Annuaire