XML videoclase Flashcards
INTRODUCCIÓN A XML
1. Que es y que no es un XML
− En 1991 Tim Barnes Lee crea las reglas de la primera versión de HTML.
− 1993 Marc Andressen y colaboradores crean Mosaic (primer navegador). Que luego fué Netscape que podíamos ver fotos y letras, formatos y tablas.
− 1995 Bill Clinton permite el acceso libre a internet.
− En 1998 ante la enorme explosión de páginas de internet y su necesario intercambio de la información, la w3c genera la especificación del XML. Ya que el html nunca fué pensado para manejar datos dada la gran cantidad de etiquetas (eran más etiquetas que información). Por eso se creó esa nueva especificación XML.
− XML por tanto nace como una extensión al HTML y significa Extensible Markup Language.
− Lo que no es el XML: no es algo que vaya a sustiuir al HTML. Si no más bien lo complementa.
- El XML se caracteriza por ser:
− Sencillo pero poderoso.
− Tecnologías alrededor de él lo hacen fundamental en el desarrollo Web, como son:
• Ajax
• RSS
• WebServices…
- El XML no es
− No es un sustituto de HTML, aunque el estandar XHTML trata de reunir ambos (este fué estandar hasta aparecer HTML5).
− Alrededor de este lenguaje tendremos otras especificaciones como DTD, XSLT o XPath.
− Incluso se pueden utilizar estilos en cascada (CSS) en documentos XML.
- Especificaciones del XML
− http://www.w3.org/XML
- Estructura de un documento XML
− Inicio:
etiqueta inicial
>? xml version=”1.0” encoding=”UTF-8” ?>
>/nodohijo> -------------------- *Ej: >libros> >libro> >autor>Valor>/autor> >/libro> >/libros> -------------------- − Valores de los atributos entre comillas.
- Reglas básicas de XML
− Documentos bien formados
− Contenidos de un archivo XML: el XML no hace nada, no formatea, simplemente contiene datos.
− Validación de un archivo XML.
− XML Namespace
- Documentos bien formados:
− Todos los archivos XML tienen sólo un nodo raiz.
− Las etiquetas sin contenido deben ser cerradas con una diagonal.
− No puede haber atributos sin valor.
− Los valores de los atributos siempre deben ir entre comillas.
− El anidamiento de las etiquetas debe ser siempre el correcto.
− La declaración de xml (opcional).
− A un documento XML que sigue todas las reglas se le conoce como “bien formado” (well-formed).
- Los elementos de un archivo:
− Elementos o nodos: a cada una de las etiquetas. Un nodo puede contener otros subnodos o subetiquetas.
− Atributos:
• su valor siempre entre comillas,
• no podemos usar caracteres especiales, palabra xml es palabra reservada para el analizador sintáctico
• y no puede haber atributos vacíos
- Comentarios:
• van a ser iguales a los comentarios html
• y no se pueden anidar.
− Characters Data Section (o CDATA)
• generalmente cuando necesitamos colocar etiquetas html dentro de los valores
− Instrucciones de proceso
− Entity references: caracteres que no tenemos dentro de nuestro teclado.
- La declaración XML
− Es opcional
− Importante el encoding para el idioma que se va a utilizar.
− La W3C recomienda ponerla.
− Debe ser la primera línea del archivo.
− Versión: hay dos 1.0 y 1.1
− El standalone también es opcional.
− >? xml version=”1.0” encoding=”UTF-8” standalone=”yes”?>
− Aunque esto último de standalone es lo menos puesto.
− >? significa que es una etiqueta de control.
− >? xml (puede ir en mayúsculas o minúsculas)
− >?xml version (en inglés sin acento)
− UTF-8 caracteres occidentales.
- Los nodos o elementos de XML
− Iniciar con guión bajo o letra. No podemos iniciar con número o caracteres especiales
− Se puede dentro letras, números, guiones o guiones bajos. También puntos.
− Lo que no podemos utilizar son espacios.
− No se puede utilizar la cadena “xml” al nombrar un elemento. Es una palabra reservada.
− No se permite usar caracteres raros, no funny-characters. Nada de acentos, nada de ñ, nada de diéresis, ni ningún otro caracter que no sea del inglés.
- Los atributos en un documento XML
− Un atributo sigue las mismas normas que un elemento para su nombre.
− No puede haber atributos con el mismo nombre en una etiqueta.
- Comentarios en un documento XML
− Son los que no toma en consideración el analizador sintáctico y se los salta.
− Son iguales a los de HTML.
− La única condición es que no se pueden anidar, ni dentro de las etiquetas, ni en el inicio, antes que la etiqueta de declaración xml.
− Dentro de una etiqueta no puede meter un comentario. Tiene que ir fuera de etiquetas
>!-- comentarios -->
- Character Data Section
− Permite escribir código libre, como etiquetas HTML, ya que su contenido no es analizado por el “parser” (o analizador sintáctico) de XML.
− Esto nos va a permitir añadir etiquetas HTML.
>nombre> Miguel >/nombre>
>nombre> > ! [ CDATA[ >b>Miguel ] ] > >/b>
Con esto le dedimos que todo lo que está entre corchetes no lo intereprete que lo deje tal como está.
− No se pueden anidar CDATA dentro de otro CDATA.
- Instrucciones de proceso o processing instruction
− Son instrucciones que sólo interesan a la aplicación que procesa el archivo XML, no al analizador sintáctico del XML. Pero si lo toma en cuenta la aplicación que está leyendo esta instrucción.
− Por ejemplo los xsl
>? target instruction ?>
>?xml-stylesheet type=”text-xsl” href=”estilos.css” ?>
− El nombre del target no puede ser XML y tiene las mismas reglas del nombre que los nodos y atributos.
− No son para XML sino para el navegador. Y así podemos poner instrucciones PHP…
- Los caracteres especiales o entities
− Son los caracteres especiales que posiblemente no existen en el teclado (caso por ejemplo de marca registrada, el euro etc).
− Estos caracteres especiales hay que definirlos en un archivo que se llama DTD.
− Sin embargo vamos a tener 5 entities que si podemos utilizar directamente: & ‘ ⁢ > o “
Que serían &, las comillas dobles “”, y las comillas sencillas ‘ ‘