1 Introduction et Concepts : De SGML à XML 1. Origines et Objectifs 2. SGML et HTML 3. Introduction...
-
Upload
adolphe-goujon -
Category
Documents
-
view
112 -
download
4
Transcript of 1 Introduction et Concepts : De SGML à XML 1. Origines et Objectifs 2. SGML et HTML 3. Introduction...
1
Introduction et Concepts : De SGML à XML
1. Origines et Objectifs
2. SGML et HTML
3. Introduction à XML
4. XML pour quoi faire ?
2
Au commencement…
SGML Standard Generalized Markup Language Langage à balises pour représenter des documents structurés Complexe, difficile à apprendre Réservé aux professionnels de la documentation Difficilement extensible au Web
HTML ! (dérive de SGML) Conçu dans l’optique d’afficher des « pages webs » C’est ce qui a fait son succès
Problème de ces langages– Un document peut se définir par le fond et par la forme.
Forme = structure + présentation Fond = structure + sémantique
3
SGML
1969 C. Goldfarb, E. Mosher, R. Lorie inventent GML chez IBM
GML a été créé pour éditer des documents, les mettre en page et les partager au sein de systèmes de gestion éditoriaux
1978 Goldfarb prend la tête d’un comité « Computer Language for the Processing of Text » au sein de l’American National Standards Institute (ANSI).
SGML
4
Qu'est-ce que SGML ?
Une norme internationale : – Standard Generalized Markup Language – ISO 8879 - 1989
Un métalangage de balisage de documents– lisible par l’être humain et traitable par une machine– permet de définir des langages de balisage
Les documents sont balisés conformément à une grammaire (la DTD Document Type Definition)
– permet un balisage sémantique du fond. Implique la notion de validité d'un document
SGML
5
SGML : objectifs
Séparation du fond et de la forme– possibilité de multiples présentations– un seul document en SGML– plusieurs formats : Postcript, HTML, etc.
Support de traitements sur le contenu des documents sans prise en compte de la forme
Proposition d’un cadre défini pour l’expression des modèles documentaires (validité, contrôle)
Intégration d'un format de stockage et d’échange normalisé
SGML
6
SGML : critiques
Très lourd et complexe pour la mise en œuvre de documents respectant ce format
Une grande rigueur est demandée à l'entrée des documents
Standard complexe et complet pour le traitement des documents
Liens hypertextes possibles mais complexes
SGML
7
HTML : présentation
Proposé par le W3C comme format de documents sur le Web.
Langage simple avec des balises standardisées permettant la mise en forme d’un texte.
Standard reconnu par tous les navigateurs.
Langage très populaire sur le Web
<HTML>
<HEAD>
<TITLE> Exemple </TITLE>
</HEAD>
<BODY>
<H1>Contenu du document</H1>
<A HREF = "http://www.server.fr/Info /dir/test.html"> une référence externe
</A>
</BODY>
</HTML>
HTML
8
HTML : inconvénients Normalisation des différentes balises difficile :
– les constructeurs ont eu tendance à définir leurs propres balises pour répondre à leurs besoins (incompatibilité)
– HTML 4.0 boutons, tables, applets, objects, graphiques, maths, ... styles, frames, protections, ...
Mises à jour difficiles :– Données utiles et mises en forme ;– restructuration ou remise en forme de l’ensemble des pages du site
fastidieux.– Pas de vérification syntaxique
Mélange le fond et la forme– méta-données avec la présentation– La sémantique du contenu est perdue– Pages conçues pour 1 type de terminal
HTML
9
Feuilles de style
Introduite pour diversifier les présentations CSS (Cascading Style Sheet)
– mécanisme d'héritage entre nœuds– une balise hérite de la parente– seulement ce qu'elle spécifie est redéfini
Recommandation W3C en décembre 1996 Mécanisme simple pour ajouter un style aux
documents Web– fonte, taille, couleur, etc.
Utilisables avec XML
HTML
10
XML : objectifs
XML= un nouveau langage d'échange basé sur le balisage
XML= plus simple que SGML XML= plus complexe et performant que
HTML XML = développé par XML Working Group
dirigé par le W3C (depuis 1996) XML 1.0 = recommandation officielle du W3C
depuis le 10 février 1998
Origines
11
les 10 objectifs d ’XML
XML doit pouvoir être utilisé sans difficulté sur Internet
XML doit soutenir une grande variété d'applications
XML doit être compatible avec SGML et HTML Il doit être facile d'écrire des programmes
traitant les documents XML Le nombre d'options dans XML doit être réduit
au minimum, idéalement à aucune
Origines
12
les 10 objectifs D ’XML
Les documents XML doivent être lisibles par l'homme et raisonnablement clairs
La spécification de XML doit être disponible rapidement
La conception de XML doit être formelle et concise
Il doit être facile de créer des documents XML La concision dans le balisage de XML est peu
importante
Origines
13
Introduction à XML
XML est un méta-langage universel pour les données sur le Web qui permet au développeur de délivrer du contenu depuis les applications à d'autres applications ou aux browsers
XML promet de standardiser la manière dont l'information est :
– Échangée (XML)– Personnalisée (XSL)– Retrouvée (XQuery)– Sécurisée (Encryption, Signature)– Liée (XLink)– ...
XML
14
Les utilisateurs peuvent définir leurs propres tags
Document bien formé:<Vin> <Cru>Volnay</Cru> <Region> <Nom>Bourgogne</Nom>
<Capitale>Dijon</Capitale> </Region> <Millesime>1995</Millesime> <Millesime>1996</Millesime> <Prix Unite = "Euro"> 10.5 </Prix></Vin>
Les tags indiquent la signification des sections marquées
Il est possible d'imposer une grammaire spécifique (DTD, Schéma)
XML : la base
SGML
XML
HTML
XHTML
XML
15
Concepts de base Balise (ou tag ou label)
– Marque de début et fin permettant de repérer un élément textuel– Forme: <balise> de début, </balise> de fin
Elément de données– Texte encadré par une balise de début et une de fin– Les éléments de données peuvent être imbriquées
<producteur> <adresse> <rue>A. Briand</rue> <ville>Dijon</ville> </adresse></producteur>
Attribut– Doublet nom="valeur" qualifiant une balise
<producteur no="160017" region="Bourgogne">
XML
16
Pourquoi utiliser XML? Définir vos propres langages d’échange
– Lisible : texte balisé avec marquage– Clair : séparation du fond et de la forme – Extensible : supporte les évolutions applicatives
Publier des informations– Commande, facture, bordereau de livraison, etc.– neutre du point de vue format– mise en forme avec des feuilles de style
Archiver des données (auto-description des archives) Développé par le W3C
– Pour le Web (Internet, Intranet)– S'étend à l'entreprise et ses partenaires
Supporté par les grands constructeurs– IBM, Microsoft .net, SUN, BEA, etc. – Des outils génériques et ouverts
Pourquoi XML ?
17
Publication multi-supports
XML
Base deDonnées
Application depublication
(XSL)
TV Numérique
Pourquoi XML ?
MiddlewareXMLizer
18
Échange de données
Extractor
JDBC JDBC
Mapper
BDrelationnelle
Datawarehouse
Datamining
Pourquoi XML ?
19
Gestion documents semistructurés
Feuillede style
XSL
Feuillede style
XSL
RequêtesHTTP GET
HTTP POST
Requêtes
MappingXML-SQL
ProcesseurXSL
Feuillede style
XSLHTML généré
Serveur d’Applications
Interface avec les applicationsbureautiques
Amendement
SGBDR
Pourquoi XML ?
20
XML EDI
Échange B2B XML EDI
XMLizer
Internet(SOAP)
Donneur d’ordre
Fournisseur
Pourquoi XML ?
21
Forces et faiblesses de XML
Une technologie structurante Clarifie tous les échanges Des standards internes et
externes Transversale à l'entreprise
– Échanges de données– Bureautique– GED– Sites Web– EDI– Bases de données– Intégration e-business– …
Une syntaxe bavarde Un méta-langage, mais de
nombreux langages Coûteux en CPU
– Parsing Coûteux en mémoire
– Instanciation
Pourquoi XML ?