SINTAXIS DEL XML
Como lenguaje de anotación, las sentencias en XML consisten en una serie de etiquetas (llamadas elementos) con una
serie de modificadores (llamados atributos). Las etiquetas pueden estar anidadas unas dentro de otras, pero toda
etiqueta que se abra se tiene que cerrar, y siempre en el mismo orden. En caso de que un elemento no tenga pareja
(por no tener ningún contenido dentro), se le denomina elemento vacío y se indica con un / al final.
Todos los documentos XML deben estar bien formados, y este es el requisito mínimo que deben cumplir los documentos
. Eso que significa que se debe cumplir lo siguiente:
- Si no se utiliza DTD, el documento debe comenzar con un Declaración de Documento Standalone, tal como la que se
pone en la primera línea.
- Todas las etiquetas deben estar equilibradas: esto es, todos los elementos que contengan datos de tipo carácter
deben tener etiquetas de principio y fin
- Todos los valores de los atributos deben ir entrecomillados (el carácter comilla simple [el apóstrofe] puede
utilizarse si el valor contiene caracteres comillas dobles, y viceversa): si necesitas ambos,
utiliza ' y ".
- Cualquier elemento vacío (p.e. aquellos que no tienen etiqueta final como
<IMG>,
<HR>, y <BR> y otros de HTML) deben terminar con '/>' o debes hacerlos no VACÍOS
añadiéndoles una etiqueta de fin.
- No debe haber etiquetas aisladas (< ó &) en el texto (p.e. debe darse como < y &), y la secuencia ]]>
debe darse como ]]> si no ocurre esto como final de una sección marcada como CDATA.
- Los elementos deben anidar dentro de sí sus propiedades (no se deben sobreponer etiquetas, como en el resto de
SGML).
- Los ficheros bien formados sin DTD pueden utilizar atributos en sus elementos, pero éstos deben ser todos del
tipo CDATA, por defecto. El tipo CDATA (character DATA) son caracteres.
- Los nombres de las etiquetas pueden ser alfanuméricos, comenzando con una letra, e incluyendo los caracteres
- y :
En un documento XML, aparte de elementos y atributos, puede haber otras cosas: entidades, que representan
símbolos "atómicos", que habitualmente deben ser entendidos por el navegador, y que se muestran en la tabla
adjunta; como se ve, las entidades van encerradas entre los símbolos & y ;; comentarios, que se procesan de
forma diferente al texto, y que, tal como en HTML, van precedidos por <!-- y acaban con -->;
secciones CDATA, que sirven para extraer del documento XML una sección, que va a ser interpretada tal cual,
sin hacer ninguna modificación.
|