El Lenguaje XML RSS


INICIO
USO
sintaxis
NOMBRES
ENLACES

SINTAXIS DEL XML

Como lenguaje de anotación, las sentencias en XML consisten en una serie de etiquetas (llamadas elementos) con una serie de modificadores (llamados atributos). Las etiquetas pueden estar anidadas unas dentro de otras, pero toda etiqueta que se abra se tiene que cerrar, y siempre en el mismo orden. En caso de que un elemento no tenga pareja (por no tener ningún contenido dentro), se le denomina elemento vacío y se indica con un / al final.

Todos los documentos XML deben estar bien formados, y este es el requisito mínimo que deben cumplir los documentos . Eso que significa que se debe cumplir lo siguiente:

  • Si no se utiliza DTD, el documento debe comenzar con un Declaración de Documento Standalone, tal como la que se pone en la primera línea.
  • Todas las etiquetas deben estar equilibradas: esto es, todos los elementos que contengan datos de tipo carácter deben tener etiquetas de principio y fin
  • Todos los valores de los atributos deben ir entrecomillados (el carácter comilla simple [el apóstrofe] puede utilizarse si el valor contiene caracteres comillas dobles, y viceversa): si necesitas ambos, utiliza ' y ".
  • Cualquier elemento vacío (p.e. aquellos que no tienen etiqueta final como <IMG>, <HR>, y <BR> y otros de HTML) deben terminar con '/>' o debes hacerlos no VACÍOS añadiéndoles una etiqueta de fin.
  • No debe haber etiquetas aisladas (< ó &) en el texto (p.e. debe darse como < y &), y la secuencia ]]> debe darse como ]]> si no ocurre esto como final de una sección marcada como CDATA.
  • Los elementos deben anidar dentro de sí sus propiedades (no se deben sobreponer etiquetas, como en el resto de SGML).
  • Los ficheros bien formados sin DTD pueden utilizar atributos en sus elementos, pero éstos deben ser todos del tipo CDATA, por defecto. El tipo CDATA (character DATA) son caracteres.
  • Los nombres de las etiquetas pueden ser alfanuméricos, comenzando con una letra, e incluyendo los caracteres - y :

En un documento XML, aparte de elementos y atributos, puede haber otras cosas: entidades, que representan símbolos "atómicos", que habitualmente deben ser entendidos por el navegador, y que se muestran en la tabla adjunta; como se ve, las entidades van encerradas entre los símbolos & y ;; comentarios, que se procesan de forma diferente al texto, y que, tal como en HTML, van precedidos por <!-- y acaban con -->; secciones CDATA, que sirven para extraer del documento XML una sección, que va a ser interpretada tal cual, sin hacer ninguna modificación.


Alexia Pérez Fernández