27
2. Texto. 2.1. 2.1. INTRODUCCIÓN. INTRODUCCIÓN. 2.2. 2.2. ESTÁNDARES DE TEXTO. ESTÁNDARES DE TEXTO. 2 2 1 ASCII ( American Standard 2 2 1 ASCII ( American Standard Code Code for for Information Information Interchange Interchange) 2.2.1 ASCII ( American Standard 2.2.1 ASCII ( American Standard Code Code for for Information Information Interchange Interchange). ). 2.2.2 Unicode. 2.2.2 Unicode. 2.2.3 RTF ( 2.2.3 RTF ( Rich Rich Text Text Format Format). ). 2.2.4 Adobe PostScript. 2.2.4 Adobe PostScript. 2.2.4 Adobe PostScript. 2.2.4 Adobe PostScript. 2.2.5 Adobe PDF. 2.2.5 Adobe PDF. 2.2.6 PostScript vs PDF 2.2.6 PostScript vs PDF 2.3. 2.3. ESTÁNDARES ORIENTADOS A CONTENIDOS WEB ESTÁNDARES ORIENTADOS A CONTENIDOS WEB 2.3.1. 2.3.1. SGML (Standard SGML (Standard Generalized Generalized Markup Markup Language Language). ). 2.3.2. 2.3.2. HTML ( HTML ( HyperText HyperText Markup Markup Language Language). ). 2321 2321 PDF vs HTML PDF vs HTML 2.3.2.1. 2.3.2.1. PDF vs HTML. PDF vs HTML. 2.3.3. 2.3.3. XML ( XML ( eXtensible eXtensible Markup Markup Language Language). ). 2.4. 2.4. OPEN DOCUMENT FORMAT OPEN DOCUMENT FORMAT 1 2.5. 2.5. ASPECTOS TECNOLÓGICOS RELATIVOS AL TEXTO. ASPECTOS TECNOLÓGICOS RELATIVOS AL TEXTO. 2.1.- Introducción ENTRE LAS DISTINTAS FUENTES DE INFORMACIÓN DE LOS ENTRE LAS DISTINTAS FUENTES DE INFORMACIÓN DE LOS SISTEMAS MULTIMEDIA EL TEXTO ES EL MEDIO BÁSICO SISTEMAS MULTIMEDIA EL TEXTO ES EL MEDIO BÁSICO SISTEMAS MULTIMEDIA, EL TEXTO ES EL MEDIO BÁSICO, SISTEMAS MULTIMEDIA, EL TEXTO ES EL MEDIO BÁSICO, TANTO POR SU VETERANÍA CÓMO POR SU USO TANTO POR SU VETERANÍA CÓMO POR SU USO GENERALIZADO. GENERALIZADO. EN ESTE TEMA VEREMOS LAS DISTINTAS FORMAS DE EN ESTE TEMA VEREMOS LAS DISTINTAS FORMAS DE REPRESENTAR ESTE MEDIO, EMPEZANDO POR LAS S REPRESENTAR ESTE MEDIO, EMPEZANDO POR LAS S SIMPLES E INTRODUCIENDO FORMAS, CADA VEZ MÁS SIMPLES E INTRODUCIENDO FORMAS, CADA VEZ MÁS COMPLEJAS, DE DESCRIPCIÓN DE DOCUMENTOS BASADOS EN COMPLEJAS, DE DESCRIPCIÓN DE DOCUMENTOS BASADOS EN TEXTO HASTA LLEGAR A LO QUE PODRÍAMOS CONSIDERAR TEXTO HASTA LLEGAR A LO QUE PODRÍAMOS CONSIDERAR TEXTO, HASTA LLEGAR A LO QUE PODRÍAMOS CONSIDERAR TEXTO, HASTA LLEGAR A LO QUE PODRÍAMOS CONSIDERAR LENGUAJES DE DESCRIPCIÓN DE DOCUMENTOS MULTIMEDIA. LENGUAJES DE DESCRIPCIÓN DE DOCUMENTOS MULTIMEDIA. 2

tema2.ppt [Modo de compatibilidad]dis.um.es/~jfernand/0708/smig/tema2.pdf2.2.- Estándares z(en(en nuestro nuestro contexto)contexto) ConjuntoConjunto dede normasnormas queque establecenestablecen

  • Upload
    others

  • View
    21

  • Download
    0

Embed Size (px)

Citation preview

2. Texto.

2.1.2.1. INTRODUCCIÓN.INTRODUCCIÓN.

2.2.2.2. ESTÁNDARES DE TEXTO.ESTÁNDARES DE TEXTO.

2 2 1 ASCII ( American Standard2 2 1 ASCII ( American Standard CodeCode forfor InformationInformation InterchangeInterchange))2.2.1 ASCII ( American Standard 2.2.1 ASCII ( American Standard CodeCode forfor InformationInformation InterchangeInterchange).).

2.2.2 Unicode.2.2.2 Unicode.

2.2.3 RTF ( 2.2.3 RTF ( RichRich TextText FormatFormat).).

2.2.4 Adobe PostScript.2.2.4 Adobe PostScript.2.2.4 Adobe PostScript.2.2.4 Adobe PostScript.

2.2.5 Adobe PDF.2.2.5 Adobe PDF.

2.2.6 PostScript vs PDF2.2.6 PostScript vs PDF

2.3.2.3. ESTÁNDARES ORIENTADOS A CONTENIDOS WEBESTÁNDARES ORIENTADOS A CONTENIDOS WEB

2.3.1.2.3.1. SGML (Standard SGML (Standard GeneralizedGeneralized MarkupMarkup LanguageLanguage).).

2.3.2.2.3.2. HTML ( HTML ( HyperTextHyperText MarkupMarkup LanguageLanguage).).

2 3 2 12 3 2 1 PDF vs HTMLPDF vs HTML2.3.2.1.2.3.2.1. PDF vs HTML.PDF vs HTML.

2.3.3.2.3.3. XML ( XML ( eXtensibleeXtensible MarkupMarkup LanguageLanguage).).

2.4.2.4. OPEN DOCUMENT FORMATOPEN DOCUMENT FORMAT

12.5.2.5. ASPECTOS TECNOLÓGICOS RELATIVOS AL TEXTO.ASPECTOS TECNOLÓGICOS RELATIVOS AL TEXTO.

2.1.- Introducción

ENTRE LAS DISTINTAS FUENTES DE INFORMACIÓN DE LOS ENTRE LAS DISTINTAS FUENTES DE INFORMACIÓN DE LOS SISTEMAS MULTIMEDIA EL TEXTO ES EL MEDIO BÁSICOSISTEMAS MULTIMEDIA EL TEXTO ES EL MEDIO BÁSICOSISTEMAS MULTIMEDIA, EL TEXTO ES EL MEDIO BÁSICO, SISTEMAS MULTIMEDIA, EL TEXTO ES EL MEDIO BÁSICO, TANTO POR SU VETERANÍA CÓMO POR SU USO TANTO POR SU VETERANÍA CÓMO POR SU USO GENERALIZADO.GENERALIZADO.

EN ESTE TEMA VEREMOS LAS DISTINTAS FORMAS DE EN ESTE TEMA VEREMOS LAS DISTINTAS FORMAS DE REPRESENTAR ESTE MEDIO, EMPEZANDO POR LAS MÁS REPRESENTAR ESTE MEDIO, EMPEZANDO POR LAS MÁS S S O, O O S SS S O, O O S SSIMPLES E INTRODUCIENDO FORMAS, CADA VEZ MÁS SIMPLES E INTRODUCIENDO FORMAS, CADA VEZ MÁS COMPLEJAS, DE DESCRIPCIÓN DE DOCUMENTOS BASADOS EN COMPLEJAS, DE DESCRIPCIÓN DE DOCUMENTOS BASADOS EN TEXTO HASTA LLEGAR A LO QUE PODRÍAMOS CONSIDERARTEXTO HASTA LLEGAR A LO QUE PODRÍAMOS CONSIDERARTEXTO, HASTA LLEGAR A LO QUE PODRÍAMOS CONSIDERAR TEXTO, HASTA LLEGAR A LO QUE PODRÍAMOS CONSIDERAR LENGUAJES DE DESCRIPCIÓN DE DOCUMENTOS MULTIMEDIA.LENGUAJES DE DESCRIPCIÓN DE DOCUMENTOS MULTIMEDIA.

2

2.2.- Estándares

(en(en nuestronuestro contexto)contexto) ConjuntoConjunto dede normasnormas quequeestablecenestablecen unauna formaforma mayoritariamentemayoritariamente aceptadaaceptada yyadoptadaadoptada dede representarrepresentar informacióninformación

TambiénTambién puedepuede serser porpor imposiciónimposición

ImportanciaImportancia parapara elel usuario/usuario/ desarrolladordesarrollador informáticoinformático::Si li id dSi li id d–– SimplicidadSimplicidad

–– UniformidadUniformidad

–– CompatibilidadCompatibilidad

3

–– CompatibilidadCompatibilidad

2.2.- Tipos de estándares

LosLos estándaresestándares sese puedenpueden clasificarclasificar enen::–– “de“de facto”facto” (“de(“de hecho”)hecho”):: aquellosaquellos queque sese hanhan impuesto,impuesto, sinsin ningunaninguna definicióndefinición

formal,formal, sinosino másmás bienbien porpor susu éxitoéxito enen determinadodeterminado sectorsector (ej(ej:: plataformaplataforma PCPC ooPDF)PDF).. SuelenSuelen serser propietariospropietarios..))

–– “de“de jure”jure” (“por(“por ley”)ley”):: aquellosaquellos queque hanhan sidosido desarrolladosdesarrollados porpor organismosorganismosoficialmenteoficialmente reconocidosreconocidos.. ExistenExisten institucionesinstituciones dedicadasdedicadas aa estasestas laboreslabores comocomo::

ANSIANSI (American(American NationalNational StandardsStandards InstitutInstitute)e)ITUITU (International(International TelecommunicationTelecommunication UnioUnion)n)(( ))IEEEIEEE (Institute(Institute ofof ElectricalElectrical andand ElectronicElectronic EngineerEngineers)s)ISOISO (International(International StandardsStandards OrganizatioOrganization)n)VESAVESA (Video(Video ElectronicsElectronics StandardsStandards AssociatioAssociation)n)AENORAENOR (Asociación(Asociación EspañolaEspañola dede Normalización)Normalización)..(( pp ))

EstándaresEstándares abiertosabiertos // invariablesinvariables

EstándaresEstándares enen creacióncreación digitaldigital–– CosteCoste dede creacióncreación yy tiempotiempo dede vidavida–– LongevidadLongevidad

PortabilidadPortabilidad

4

–– PortabilidadPortabilidad–– RentabilidadRentabilidad dede recursosrecursos

Conjuntos de caracteres

ASCII

UNICODE

5

ASCII (American Standard Code forASCII (American Standard Code for Information Interchange) (I).

6

ASCII (American Standard Code forASCII (American Standard Code for Information Interchange) (II).

CÓDIGOS EXTENDIDOS 8 BITS: LETRAS, SIMBOLOS, CÓDIGOS EXTENDIDOS 8 BITS: LETRAS, SIMBOLOS, OPERADORES (EJ ASCII extendido)OPERADORES (EJ ASCII extendido)OPERADORES (EJ. ASCII extendido)OPERADORES (EJ. ASCII extendido)

ISO LATIN 1, UTILIZADO POR DIFERENTES SISTEMASISO LATIN 1, UTILIZADO POR DIFERENTES SISTEMASISO LATIN 1, UTILIZADO POR DIFERENTES SISTEMAS ISO LATIN 1, UTILIZADO POR DIFERENTES SISTEMAS OPERATIVOS Y SERVICIOS DE WEB (navegadores, protocolos y OPERATIVOS Y SERVICIOS DE WEB (navegadores, protocolos y lenguajes). OFICIALMENTE SE LE DENOMINA ISOlenguajes). OFICIALMENTE SE LE DENOMINA ISO--88598859--1.1.

OTRO CONJUNTO UTILIZADO EN LOS GRANDES SISTEMAS DE OTRO CONJUNTO UTILIZADO EN LOS GRANDES SISTEMAS DE IBM ES EL EBCDIC (Extended IBM ES EL EBCDIC (Extended BinaryBinary--CodedCoded Decimal Decimal InterchangeInterchangeCodeCode).).

7

Unicode (I).

CÓDIGO DE CARACTERES DE 16 BITS DISEÑADO PARA CÓDIGO DE CARACTERES DE 16 BITS DISEÑADO PARA CODIFICAR TEXTO EN SU UTILIZACIÓN POR PARTE DE CODIFICAR TEXTO EN SU UTILIZACIÓN POR PARTE DE SISTEMAS BASADOS EN COMPUTADORESSISTEMAS BASADOS EN COMPUTADORESSISTEMAS BASADOS EN COMPUTADORES.SISTEMAS BASADOS EN COMPUTADORES.

SIMPLICIDAD Y CONSISTENCIA DEL CONJUNTO DE CÓDIGOS SIMPLICIDAD Y CONSISTENCIA DEL CONJUNTO DE CÓDIGOS ASCII (en particular la versión ampliada ISO LatinASCII (en particular la versión ampliada ISO Latin 1 y otras1 y otrasASCII (en particular la versión ampliada ISO LatinASCII (en particular la versión ampliada ISO Latin--1 y otras 1 y otras versiones ampliadas del mismo)versiones ampliadas del mismo)

CUBRE TODOS LOS CARACTERES QUE SE UTILIZAN ENCUBRE TODOS LOS CARACTERES QUE SE UTILIZAN ENCUBRE TODOS LOS CARACTERES QUE SE UTILIZAN EN CUBRE TODOS LOS CARACTERES QUE SE UTILIZAN EN TODAS LAS LETRAS ESCRITAS DEL MUNDO.TODAS LAS LETRAS ESCRITAS DEL MUNDO.

CÓDIGOS ASOCIADOS A LOS PRINCIPALES ALFABETOSCÓDIGOS ASOCIADOS A LOS PRINCIPALES ALFABETOSCÓDIGOS ASOCIADOS A LOS PRINCIPALES ALFABETOS CÓDIGOS ASOCIADOS A LOS PRINCIPALES ALFABETOS UTILIZADOS HOY EN DÍA: LATÍN, CIRÍLICO (USADO EN UTILIZADOS HOY EN DÍA: LATÍN, CIRÍLICO (USADO EN LENGUAS CÓMO EL RUSO, GRIEGO, HEBRERO Y ARÁBIGO), LENGUAS CÓMO EL RUSO, GRIEGO, HEBRERO Y ARÁBIGO), JAPONÉS, COREANO Y CHINO.JAPONÉS, COREANO Y CHINO.

8

,,

Unicode (II).

TAMBIÉN INCLUYE CONJUNTOS DE SÍMBOLOS: SIGNOS DE TAMBIÉN INCLUYE CONJUNTOS DE SÍMBOLOS: SIGNOS DE PUNTUACIÓN, MATEMÁTICOS, TÉCNICOS, FLECHAS, ETC.PUNTUACIÓN, MATEMÁTICOS, TÉCNICOS, FLECHAS, ETC., , , ,, , , ,

ACTUALMENTE QUEDAN, APROXIMADAMENTE, UNOS 29.000 ACTUALMENTE QUEDAN, APROXIMADAMENTE, UNOS 29.000 CÓDIGOS LIBRESCÓDIGOS LIBRESCÓDIGOS LIBRESCÓDIGOS LIBRES

PREVISTOS 3600 NUEVOS CARACTERESPREVISTOS 3600 NUEVOS CARACTERES ORIENTALES ORIENTALES (U i d ISO 10646)(U i d ISO 10646)(Unicode e ISO 10646)(Unicode e ISO 10646)

PARA USO PRIVADO SE HAN RESERVADO 6.000 CÓDIGOS PARA USO PRIVADO SE HAN RESERVADO 6.000 CÓDIGOS QUE DESARROLLADORES HARDWARE Y SOFTWARE PUEDEN QUE DESARROLLADORES HARDWARE Y SOFTWARE PUEDEN ASIGNAR INTERNAMENTE PARA SUS PROPIOS CARACTERES ASIGNAR INTERNAMENTE PARA SUS PROPIOS CARACTERES

9

Y SÍMBOLOS.Y SÍMBOLOS.

Estándares de texto formateado

RTFRTF

POSTSCRIPTPOSTSCRIPT

PDF

10

RTF (Rich Text Format)

ES UN ESTÁNDAR DE CODIFICACIÓN DE TEXTO Y GRÁFICOS CON ES UN ESTÁNDAR DE CODIFICACIÓN DE TEXTO Y GRÁFICOS CON FORMATO CUYO OBJETIVO ES FACILITAR LA TRANSFERENCIA ENTRE FORMATO CUYO OBJETIVO ES FACILITAR LA TRANSFERENCIA ENTRE APLICACIONES Y PLATAFORMAS DESARROLLADO POR MICROSOFTAPLICACIONES Y PLATAFORMAS DESARROLLADO POR MICROSOFTAPLICACIONES Y PLATAFORMAS DESARROLLADO POR MICROSOFT.APLICACIONES Y PLATAFORMAS DESARROLLADO POR MICROSOFT.

PUEDE SER UTILIZADO POR DIFERENTES DISPOSITIVOS DE SALIDA, PUEDE SER UTILIZADO POR DIFERENTES DISPOSITIVOS DE SALIDA, ENTORNOS Y SISTEMAS OPERATIVOS.ENTORNOS Y SISTEMAS OPERATIVOS.

CONJUNTO DE CARACTERES ANSI (PCCONJUNTO DE CARACTERES ANSI (PC--8 de Macintosh o IBM) PARA 8 de Macintosh o IBM) PARA CODIFICAR EL CONTENIDO Y FORMATO DE UN DOCUMENTO, TANTO CODIFICAR EL CONTENIDO Y FORMATO DE UN DOCUMENTO, TANTO EN PANTALLA COMO PARA SU IMPRESIÓN EN PAPELEN PANTALLA COMO PARA SU IMPRESIÓN EN PAPELEN PANTALLA COMO PARA SU IMPRESIÓN EN PAPEL.EN PANTALLA COMO PARA SU IMPRESIÓN EN PAPEL.

ELEMENTOS DE UN ARCHIVO RTFELEMENTOS DE UN ARCHIVO RTF–– Texto sin formato : ASCIITexto sin formato : ASCIITexto sin formato : ASCIITexto sin formato : ASCII–– Códigos de control “Códigos de control “\\secuencia_letras_alfabéticas <Delimitador>”secuencia_letras_alfabéticas <Delimitador>”–– Símbolos de control “Símbolos de control “\\+1carácter no alfabético”+1carácter no alfabético”–– Grupos “{ textos|códigos de control|símbolos de control}*”Grupos “{ textos|códigos de control|símbolos de control}*”

11

Grupos { textos|códigos de control|símbolos de control}Grupos { textos|códigos de control|símbolos de control}

Sintaxis de RTF (I).

EL INTERIOR DE UN ARCHIVO EN FORMATO RTF CONSISTE EN UNA EL INTERIOR DE UN ARCHIVO EN FORMATO RTF CONSISTE EN UNA SERIE DE CÓDIGOS ORGANIZADOS DE LA FORMA:SERIE DE CÓDIGOS ORGANIZADOS DE LA FORMA:

{ h d d t{ h d d t }}{<header><document>{<header><document>}}

–– Encabezado (header):Encabezado (header): Contiene elementos como la versión de RTF, conjunto de Contiene elementos como la versión de RTF, conjunto de caracteres tablas de fuentes fuentes contenidas (Embedding) soporte decaracteres tablas de fuentes fuentes contenidas (Embedding) soporte decaracteres, tablas de fuentes, fuentes contenidas (Embedding), soporte de caracteres, tablas de fuentes, fuentes contenidas (Embedding), soporte de códigos de página, tablas de ficheros, tablas de color, definición de estilos y códigos de página, tablas de ficheros, tablas de color, definición de estilos y marcas de revisión.marcas de revisión.

<header>: |<header>: |rtf rtf <charset> | <charset> | deff?deff?<fonttbl><filetbl>?<colortbl>?<stylesheet>?<revtbl>?<fonttbl><filetbl>?<colortbl>?<stylesheet>?<revtbl>?

Conjunto de caracteresConjunto de caracteres: incluye Windows ANSI, IBM PC, IBM 850 y Macintosh.: incluye Windows ANSI, IBM PC, IBM 850 y Macintosh.T bl d f t (f t )T bl d f t (f t ) i l li t d l f t tili d l d ti l li t d l f t tili d l d tTabla de fuentes (fonts)Tabla de fuentes (fonts): incluye una lista de las fuentes utilizadas en el documento. : incluye una lista de las fuentes utilizadas en el documento. Éstas son mapeadas sobre las fuentes disponibles en la aplicación recipiendaria.Éstas son mapeadas sobre las fuentes disponibles en la aplicación recipiendaria.Tabla de coloresTabla de colores: incluye una lista de los colores utilizados en el documento para : incluye una lista de los colores utilizados en el documento para remarcar el texto. remarcar el texto.

12

Sintaxis de RTF (II).

–– Área de Documento (document):Área de Documento (document): donde se encuentra la codificación de grupos de donde se encuentra la codificación de grupos de información, propiedades de formato del documento, texto y propiedades de la información, propiedades de formato del documento, texto y propiedades de la

ió b i d á i á f i d d í li tió b i d á i á f i d d í li tsección, cabeceras y pies de página, párrafos y propiedades, sangrías, listas, sección, cabeceras y pies de página, párrafos y propiedades, sangrías, listas, bordes y sombras de párrafos, posición de objetos y marcos, tablas, caracteres y bordes y sombras de párrafos, posición de objetos y marcos, tablas, caracteres y propiedades de los mismos, etc.propiedades de los mismos, etc.

<document>: <info>? <docfmt>* <section>+<document>: <info>? <docfmt>* <section>+

Formato del documentoFormato del documento: márgenes e indentación de párrafos con relación a los: márgenes e indentación de párrafos con relación a losFormato del documentoFormato del documento: márgenes e indentación de párrafos con relación a los : márgenes e indentación de párrafos con relación a los márgenes.márgenes.

Formato de seccionesFormato de secciones: saltos de sección y saltos de página.: saltos de sección y saltos de página.

Formato de párrafosFormato de párrafos: caracteres de control para justificación de párrafos, posición de : caracteres de control para justificación de párrafos, posición de t b l d i d t ió i d t á ft b l d i d t ió i d t á ftabuladores, indentación y espaciado entre párrafos.tabuladores, indentación y espaciado entre párrafos.

Formato generalFormato general: incluye notas al pie de página, anotaciones, marcas y dibujos.: incluye notas al pie de página, anotaciones, marcas y dibujos.

Formato de caracteresFormato de caracteres: negrita, itálica, subrayado, sombreado y outline, subíndices y : negrita, itálica, subrayado, sombreado y outline, subíndices y superíndices.superíndices.

13

pp

Caracteres especialesCaracteres especiales: backslashes, etc.: backslashes, etc.

Adobe PostScript (I).

¿FORMATO DE TEXTO O LENGUAJE DE PROGRAMACIÓN?

IMPRESIONES DE GRAN CALIDAD y FIABILIDAD EN EDICIÓN PROFESIONAL

SOPORTADO POR IMPRESORAS, MONITORES, PRENSAS DIGITALESDIGITALES.

CARÁCTER VECTORIAL. PÁGINAS COMO UNA SERIE DE OBJETOS GEOMÉTRICOS ABSTRACTOSOBJETOS GEOMÉTRICOS ABSTRACTOS.

LOS TIPOS DE LETRA POSTSCRIPT DEFINEN EL CONTORNO Á

14

(outline) DE CADA CARÁCTER.

Adobe PostScript (II).

IMPRESORAS NO POSTSCRIPT MAPAS DE BITS

CADA IMPRESORA PS CONTIENE UN INTÉRPRETE QUE EJECUTA LAS ÓRDENES PS (driver).

EXISTEN TRES VERSIONES BÁSICAS DE POSTSCRIPT L l 1 L l 2 ( j l )POSTSCRIPT: Level 1, Level 2 (mejor para color) y PostScript 3 (más fuentes, mejores gráficos, aceleración).

15

Adobe PDF (I)

ALGUNOS PROBLEMAS COMUNES– INDISPONIBILIDAD DE APLICACIONES ORIGINARIASINDISPONIBILIDAD DE APLICACIONES ORIGINARIAS.– INCOMPATIBILIDADES DE FORMATO y VERSIONES.– IMPRESIÓN INCORRECTA.

ESTÁNDAR DE FACTO EN LA DISTRIBUCIÓN DE DOCUMENTOS ELECTRÓNICOS

PRESERVA TODAS LAS FUENTES, EL FORMATO, LOS COLORES Y LOS GRÁFICOS (además de hipervínculos y controles ActiveX) DE CUALQUIER DOCUMENTO FUENTE, SIN QUE IMPORTE LACUALQUIER DOCUMENTO FUENTE, SIN QUE IMPORTE LA APLICACIÓN NI LA PLATAFORMA USADAS EN SU CREACIÓN.

BASADO EN EL LENGUAJE PS Y CÓMO ESTE, DESCRIBE LOS TIPOS DE LETRA IMÁGENES Y OTROS ELEMENTOS DE UNA PÁGINA COMO

16

DE LETRA, IMÁGENES Y OTROS ELEMENTOS DE UNA PÁGINA COMO UNA SERIE DE OBJETOS Y RELACIONES MATEMÁTICAS.

Adobe PDF (II)

LAS FUENTES DE CARACTERES SE CODIFICAN CÓMO DESCRIPCIONES MATEMÁTICAS DE LÍNEAS, CURVAS Y DISTANCIAS ENTRE CONJUNTOS DE PUNTOSPUNTOS.

– Ej: EL CARÁCTER V CONSTA FUNDAMENTALMENTE DE TRES PUNTOS (superior izquierdo, superior derecho y el inferior donde las dos líneas confluyen). LA DESCRIPCIÓN MATEMÁTICA DESCRIBE LAS LÍNEAS EXISTENTES ENTRE LOS TRES PUNTOS, LA DISTANCIA RELATIVA ENTRE ELLOS, EL GROSOR DE LA LÍNEA Y EL TAMAÑO DEL CARÁCTER.

PERMITEN VER EN PANTALLA LA FORMA QUE EL DOCUMENTO TOMA A LAPERMITEN VER EN PANTALLA LA FORMA QUE EL DOCUMENTO TOMA A LA HORA DE SER IMPRESO, POR LO QUE SE DENOMINAN WYSIWYG (what you seeis what you get)

LOS ARCHIVOS PDF SON COMPACTOS (más pequeños que sus archivos fuente)

17

Adobe PDF (III)

LOS ARCHIVOS PDF PUEDEN PUBLICARSE Y DISTRIBUIRSE EN TODAS PARTES: IMPRESOS, ADJUNTOS EN UN MENSAJE DE CORREO ELECTRÓNICO EN SERVIDORES CORPORATIVOS ENCORREO ELECTRÓNICO, EN SERVIDORES CORPORATIVOS, EN SITIOS WEB O EN CD-ROM.

CREACIÓN DE DOCUMENTOS– USANDO CÓDIGOS PS– CREAR LOS DOCUMENTOS CON OTRAS APLICACIONES Y CONVERTIDOS

A PDF.

LAS VENTAJAS DE CREAR ARCHIVOS EN OTRAS APLICACIONES Y CONVERTIRLOS A PDF SON LAS SIGUIENTES:

– ES UN PROCESO RÁPIDO Y SENCILLO.– EL DOCUMENTO FINAL PDF MANTIENE EL FORMATO DE LA

PÁGINA, LAS FUENTES Y LA CALIDAD DE IMÁGENES DEL ORIGINAL.PERMITE AL USUARIO SEGUIR UTILIZANDO LAS HERRAMIENTAS

18

– PERMITE AL USUARIO SEGUIR UTILIZANDO LAS HERRAMIENTAS QUE LE SON FAMILIARES.

PostScript vs PDF (I)

POSTSCRIPT ESTÁ DISEÑADO PARA UNA ÚNICA COSA: DESCRIBIR DE FORMA PRECISA LO QUE DEBE APARECER EN UNA PÁGINA.DE FORMA PRECISA LO QUE DEBE APARECER EN UNA PÁGINA.

– NECESITA SER PROCESADO O EJECUTADO.

– ESTO LO REALIZA UNA COMBINACIÓN DE HARDWARE Y SOFTWARE (QUÉ TÍPICAMENTE RESIDE EN UNA IMPRESORA) YSOFTWARE (QUÉ TÍPICAMENTE RESIDE EN UNA IMPRESORA) Y QUE SE LLAMA RIP (RASTER IMAGE PROCESSOR).

– UN RIP TOMA EL CÓDIGO POSTSCRIPT Y LO TRADUCE A ÁPUNTOS EN UNA PÁGINA.

– TAMBIÉN ES POSIBLE TRABAJAR CON FICHEROS EPS (ENCAPSULATED POSTSCRIPT) QUE, SIMPLEMENTE, SON UN ( ) , ,PROGRAMA POSTSCRIPT , GUARDADO EN FORMA DE FICHERO QUE INCLUYE UNA VERSIÓN DE MENOR RESOLUCIÓN VISUALIZABLE “ENCAPSULADA” EN SU INTERIOR..

19

PostScript & PDF (II)

PDF ESTÁ CONSTRUIDO SOBRE EL LENGUAJE POSTSCRIPT Y PDF ESTÁ CONSTRUIDO SOBRE EL LENGUAJE POSTSCRIPT Y ADEMAS DE DESCRIBIR, RECOGE INFORMACIÓN ACERCA DEL TIPO ADEMAS DE DESCRIBIR, RECOGE INFORMACIÓN ACERCA DEL TIPO DE INFORMACIÓN ESTÁ CONTENIDA EN EL FICHERO.DE INFORMACIÓN ESTÁ CONTENIDA EN EL FICHERO.DE INFORMACIÓN ESTÁ CONTENIDA EN EL FICHERO.DE INFORMACIÓN ESTÁ CONTENIDA EN EL FICHERO.

UN ARCHIVO PDF PUEDE CONTENER FUENTES DE LETRAS, UN ARCHIVO PDF PUEDE CONTENER FUENTES DE LETRAS, IMÁGENES, INSTRUCCIONES DE IMPRESIÓN, PALABRAS CLAVEIMÁGENES, INSTRUCCIONES DE IMPRESIÓN, PALABRAS CLAVEIMÁGENES, INSTRUCCIONES DE IMPRESIÓN, PALABRAS CLAVE IMÁGENES, INSTRUCCIONES DE IMPRESIÓN, PALABRAS CLAVE PARA REALIZAR BÚSQUEDAS Y CATALOGACIONES, MARCADORES, PARA REALIZAR BÚSQUEDAS Y CATALOGACIONES, MARCADORES, ENLACES INTERACTIVOS, VIDEOS, MECANISMOS DE PROTECCIÓN, ENLACES INTERACTIVOS, VIDEOS, MECANISMOS DE PROTECCIÓN, ETC.ETC.

UN FICHERO PDF ES, REALMENTE, UN FICHERO POSTSCRIPT QUE UN FICHERO PDF ES, REALMENTE, UN FICHERO POSTSCRIPT QUE YA HA SIDO INTERPRETADO Y DESCOMPUESTO EN OBJETOS YA HA SIDO INTERPRETADO Y DESCOMPUESTO EN OBJETOS CLARAMENTE DEFINIDOSCLARAMENTE DEFINIDOSCLARAMENTE DEFINIDOS.CLARAMENTE DEFINIDOS.

20

PostScript & PDF (III)

ESTOS OBJETOS SON VISIBLES EN PANTALLA, NO ESTOS OBJETOS SON VISIBLES EN PANTALLA, NO Ó ÓÓ ÓCÓMO CÓDIGO, SINO COMO LA CÓMO CÓDIGO, SINO COMO LA APARIENCIA FINALAPARIENCIA FINAL

DE ESOS OBJETOS.DE ESOS OBJETOS.

PUESTO QUE LOS OBJETOS YA HAN SIDO PUESTO QUE LOS OBJETOS YA HAN SIDO INTERPRETADOS SONINTERPRETADOS SON MÁS FIABLESMÁS FIABLES QUE UNQUE UNINTERPRETADOS, SON INTERPRETADOS, SON MÁS FIABLESMÁS FIABLES QUE UN QUE UN ARCHIVO EPS O PS.ARCHIVO EPS O PS.

LA LA VISUALIZACION EN PANTALLAVISUALIZACION EN PANTALLA PERMITE PERMITE IDENTIFICAR POSIBLES ERRORES EN LAIDENTIFICAR POSIBLES ERRORES EN LA

21

IDENTIFICAR POSIBLES ERRORES EN LA IDENTIFICAR POSIBLES ERRORES EN LA OPERACIÓN DE IMPRESIÓN.OPERACIÓN DE IMPRESIÓN.

PostScript & PDF (IV)

ParaPara imprimirimprimir unun ficherofichero PDF,PDF, sinsin embargo,embargo, aúnaún hayhay queque reconstruirreconstruirloslos objetosobjetos PDFPDF enen lala páginapágina yy unauna impresoraimpresora PostScriptPostScript siguesiguesiendosiendo lala formaforma másmás fiablefiable dede hacerhacer esteeste procesoproceso..

ExistenExisten impresorasimpresoras queque reconocenreconocen elel lenguajelenguaje PostScriptPostScript yy elel PDFPDF..

PDFPDF haha reemplazadoreemplazado aa EPSEPS yy eses utilizadoutilizado comocomo formatoformato dededistribucióndistribución parapara elel envíoenvío dede publicacionespublicaciones completascompletas aa lala imprenta,imprenta,comprobacióncomprobación dede resultadosresultados enen maquetaciónmaquetación distribucióndistribución enencomprobacióncomprobación dede resultadosresultados enen maquetación,maquetación, distribucióndistribución enenInternetInternet yy almacenamientoalmacenamiento dede ficherosficheros puestopuesto queque eses totalmentetotalmenteautocontenidoautocontenido..

SinSin embargo,embargo, parapara imprimirimprimir PDFPDF concon lala mayormayor calidadcalidad sese precisaprecisa dedeunun dispositivo,dispositivo, alal menosmenos compatible,compatible, AdobeAdobe PostScriptPostScript parapara obtenerobtener

bb lid dlid d

22

unauna buenabuena calidadcalidad..

Estándares orientados a contenidosEstándares orientados a contenidos web

SGMLSGML

HTMLHTML

XML

23

Introducción

Basados en mark-up (marcado)– Anotaciones junto al texto original para mejorar la j g p j

apariencia

– Permite incluir información (códigos) para el procesado electrónico

Marcado original (procedural)– Especificación detallada de apariencia

– Se pierde la estructura del documento

– Falta de portabilidad y flexibilidad

– Alta tasa de errores

24

Evolución del marcado

Codificación genérica– Uso de etiquetas de estilo

– Mayor portabilidad y flexibilidad

– Mayor fidelidad a la descripción de la estructura del documento (cita, título,..)documento (cita, título,..)

– Posibilidad de ciertos procesos automáticos (p.ej., índices)

Lenguajes de marcado generalizado– Descripción de la estructura del documento frente a

formato y estilo anterior

– Marcado único

25

Marcado único

– Formalismo para su procesamiento automático

SGML (Standard Generalized MarkupSGML (Standard Generalized Markup Language) (I).

SGML fue desarrollado en 1986 por ISO (ISO 8879) SGML fue desarrollado en 1986 por ISO (ISO 8879) cómo estándar de lenguaje de marcado generalizadocómo estándar de lenguaje de marcado generalizadocómo estándar de lenguaje de marcado generalizado cómo estándar de lenguaje de marcado generalizado para el intercambio de documentos en soporte para el intercambio de documentos en soporte electrónico, su almacenamiento y procesado.electrónico, su almacenamiento y procesado.

SGML es la base de dos estándares esenciales en SGML es la base de dos estándares esenciales en I t tI t tInternet:Internet:

–– HTML, el estándar más usado en la realización de páginas HTML, el estándar más usado en la realización de páginas WEB.WEB.

–– XML, metalenguaje de definición de lenguajes de marcas.XML, metalenguaje de definición de lenguajes de marcas.

26

SGML (Standard Generalized MarkupSGML (Standard Generalized Markup Language) (II).

Ámbito de usoÁmbito de uso

Complejidad Complejidad

Descripción de DTDsDescripción de DTDsDescripción de DTDsDescripción de DTDs

No especifica formatoNo especifica formato

Objetivo: Estructura, ignora aparienciaObjetivo: Estructura, ignora apariencia

Estructura: elementos + relacionesEstructura: elementos + relaciones

27

SGML (Standard Generalized MarkupSGML (Standard Generalized Markup Language) (III).

No impone estructura…se adapta a ellaNo impone estructura…se adapta a ellap pp p

Posibles tratamientos a partir de la estructuraPosibles tratamientos a partir de la estructuraPosibles tratamientos a partir de la estructuraPosibles tratamientos a partir de la estructura–– Formato de documentoFormato de documento

Generación de índices o elementos relevantesGeneración de índices o elementos relevantes–– Generación de índices o elementos relevantesGeneración de índices o elementos relevantes

–– Conversiones de estructuraConversiones de estructura

Ad t ió di di iti d lidAd t ió di di iti d lid–– Adaptación a diversos dispositivos de salidaAdaptación a diversos dispositivos de salida

Reutilización de documentos SGMLReutilización de documentos SGML

28

HTML (HyperText Markup Language) (I).

ES UN LENGUAJE DE MARCAS BASE DE LA ACTUAL WWW.ES UN LENGUAJE DE MARCAS BASE DE LA ACTUAL WWW.

ES UN FORMATO NO PROPIETARIO BASADO EN SGMLES UN FORMATO NO PROPIETARIO BASADO EN SGMLES UN FORMATO NO PROPIETARIO BASADO EN SGML.ES UN FORMATO NO PROPIETARIO BASADO EN SGML.

LOS TÍTULOS, CABECERAS, PÁRRAFOS, ETC. ESTÁN LOS TÍTULOS, CABECERAS, PÁRRAFOS, ETC. ESTÁN INDICADOS CÓMO TALES EN EL DOCUMENTOINDICADOS CÓMO TALES EN EL DOCUMENTOINDICADOS CÓMO TALES EN EL DOCUMENTO.INDICADOS CÓMO TALES EN EL DOCUMENTO.

ES POSIBLE LA INCLUSIÓN DE ENLACES EN EL DOCUMENTO, ES POSIBLE LA INCLUSIÓN DE ENLACES EN EL DOCUMENTO, GRACIAS A LAS POSIBILIDADES HIPERMEDIA DE ESTE GRACIAS A LAS POSIBILIDADES HIPERMEDIA DE ESTE LENGUAJE.LENGUAJE.

ES IMPORTANTE INDICAR QUE DEPENDIENDO DEL ES IMPORTANTE INDICAR QUE DEPENDIENDO DEL VISUALIZADOR UTILIZADO, EL ASPECTO FINAL DE LOS VISUALIZADOR UTILIZADO, EL ASPECTO FINAL DE LOS DIFERENTES ELEMENTOS INCLUIDOS EN EL DOCUMENTO, DIFERENTES ELEMENTOS INCLUIDOS EN EL DOCUMENTO,

29

,,PUEDE SER DIFERENTE.PUEDE SER DIFERENTE.

HTML (HyperText Markup Language) (II).

UN DOCUMENTO HTML ESTÁ CODIFICADO EN TEXTO PLANO UN DOCUMENTO HTML ESTÁ CODIFICADO EN TEXTO PLANO (ASCII) POR LO QUE PUEDE SER GENERADO CON CASI (ASCII) POR LO QUE PUEDE SER GENERADO CON CASI ( )( )CUALQUIER EDITOR DE TEXTO: VI, EDIT, NOTEPAD, ETC., EN CUALQUIER EDITOR DE TEXTO: VI, EDIT, NOTEPAD, ETC., EN GENERAL, CUALQUIER PROCESADOR DE TEXTO QUE PERMITA GENERAL, CUALQUIER PROCESADOR DE TEXTO QUE PERMITA GUARDAR LOS DOCUMENTOS EN FORMATO DE TEXTO.GUARDAR LOS DOCUMENTOS EN FORMATO DE TEXTO.

EL FORMATO DEL DOCUMENTO SE ESPECIFICA MEDIANTE EL FORMATO DEL DOCUMENTO SE ESPECIFICA MEDIANTE MARCADORES O TAGS QUE INDICAN EL INICIO Y EL FIN DE UNAMARCADORES O TAGS QUE INDICAN EL INICIO Y EL FIN DE UNAMARCADORES O TAGS QUE INDICAN EL INICIO Y EL FIN DE UNA MARCADORES O TAGS QUE INDICAN EL INICIO Y EL FIN DE UNA DETERMINADA OPCIÓN DE FORMATO APLICABLE AL TEXTO DETERMINADA OPCIÓN DE FORMATO APLICABLE AL TEXTO SITUADO ENTRE AMBOS.SITUADO ENTRE AMBOS.

LOS CÓDIGOS DE CONTROL COMIENZAN CON EL SÍMBOLO “<“ Y LOS CÓDIGOS DE CONTROL COMIENZAN CON EL SÍMBOLO “<“ Y TERMINAN CON EL SÍMBOLO “>”.TERMINAN CON EL SÍMBOLO “>”.

30

HTML (HyperText Markup Language) (III).

LA MAYORÍA TIENEN SU CORRESPONDIENTE MARCADOR DE LA MAYORÍA TIENEN SU CORRESPONDIENTE MARCADOR DE FINAL QUE ES SIMILAR AL INICIAL PERO INCLUYENDO ELFINAL QUE ES SIMILAR AL INICIAL PERO INCLUYENDO ELFINAL, QUE ES SIMILAR AL INICIAL, PERO INCLUYENDO EL FINAL, QUE ES SIMILAR AL INICIAL, PERO INCLUYENDO EL CARÁCTER “/”. Ej: <title> Titulo </title>. CARÁCTER “/”. Ej: <title> Titulo </title>.

De acuerdo con el estándar, para que un texto sea reconocido como De acuerdo con el estándar, para que un texto sea reconocido como HTML deberá incorporar:HTML deberá incorporar:

identificador de tipo de documento mediante el marcador <html> alidentificador de tipo de documento mediante el marcador <html> al–– identificador de tipo de documento mediante el marcador <html> al identificador de tipo de documento mediante el marcador <html> al principio del fichero y >/html> al final del mismo.principio del fichero y >/html> al final del mismo.

–– Tendrá una estructura básica que consta de:Tendrá una estructura básica que consta de:cabecera (<head>).cabecera (<head>).

Título Título --> Dentro de la cabecera (<title>).> Dentro de la cabecera (<title>).

Cuerpo del documento (<body>).Cuerpo del documento (<body>).

31

Cuerpo del documento ( body ).Cuerpo del documento ( body ).

–– El fichero debe tener además la extensión “.html” (ó .htm).El fichero debe tener además la extensión “.html” (ó .htm).

PDF vs HTML

–– PortabilidadPortabilidad

–– AparienciaApariencia

–– PaginaciónPaginación

–– Control de visualización e impresiónControl de visualización e impresión

Facilidad para cambiosFacilidad para cambios–– Facilidad para cambiosFacilidad para cambios

–– TamañoTamaño

–– Propiedad del formatoPropiedad del formato

C t d ióC t d ió

32

–– Coste de conversiónCoste de conversión

XML Introducción

Manteniendo la filosofía SGML, de él se derivó XML como subconjunto Manteniendo la filosofía SGML, de él se derivó XML como subconjunto simplificado eliminando las partes más engorrosas y menos útilessimplificado eliminando las partes más engorrosas y menos útilessimplificado, eliminando las partes más engorrosas y menos útiles. simplificado, eliminando las partes más engorrosas y menos útiles.

XML es un XML es un METALENGUAJEMETALENGUAJE: es un lenguaje para definir lenguajes.: es un lenguaje para definir lenguajes.

33

Estructura de un documento XML(I).

EN EL SIGUIENTE EJEMPLO PODEMOS COMPRENDER RÁPIDAMENTE EN EL SIGUIENTE EJEMPLO PODEMOS COMPRENDER RÁPIDAMENTE LA ESTRUCTURA DE UN DOCUMENTO XML (mensaje.xml).LA ESTRUCTURA DE UN DOCUMENTO XML (mensaje.xml).

<?xml version="1 0“<?xml version="1 0“?>?><?xml version= 1.0<?xml version= 1.0 ?>?>

<!DOCTYPE MENSAJE SYSTEM “mensaje.dtd”><!DOCTYPE MENSAJE SYSTEM “mensaje.dtd”><<mensajemensaje> > <<remiteremite>><nombre>Jesualdo Fernández</nombre><nombre>Jesualdo Fernández</nombre><nombre>Jesualdo Fernández</nombre><nombre>Jesualdo Fernández</nombre><email>[email protected]</email><email>[email protected]</email>

</remite></remite><destinatario><destinatario><nombre>Pedro Pérez</nombre/><nombre>Pedro Pérez</nombre/><email>[email protected]</email><email>[email protected]</email>

</destinatario></destinatario><asunto>Hola Pedro</asunto><asunto>Hola Pedro</asunto>asunto Hola Pedro /asuntoasunto Hola Pedro /asunto<texto><texto><parrafo>¿Hola que tal? Hace <enfasis>mucho</enfasis> que<parrafo>¿Hola que tal? Hace <enfasis>mucho</enfasis> queno escribes. A ver si llamas y quedamos para tomar algo.</parrafo>no escribes. A ver si llamas y quedamos para tomar algo.</parrafo>

</t t ></t t >

34

</texto></texto></mensaje></mensaje>

Estructura de un documento XML(II).

Este mismo documento puede verse de forma gráfica, para comprender mejor Este mismo documento puede verse de forma gráfica, para comprender mejor la estructura de un documento XML.la estructura de un documento XML.

remite

nombre: Jesualdo Fernández

il jf d@dif

mensaje

remite

destinatario

email: [email protected]

nombre: Pedro Pérez

asunto: Hola Pedro

email: [email protected]

asu to o a ed o

texto parrafo: ¿Hola que tal? ...

35.....................

Estructura de un documento XML(III).

AUNQUE NO ES OBLIGATORIO, LOS DOCUMENTOS XML PUEDEN EMPEZAR CON UNAS LÍNEAS QUE DESCRIBEN LA VERSIÓN DE XMLEMPEZAR CON UNAS LÍNEAS QUE DESCRIBEN LA VERSIÓN DE XML, EL TIPO DE DOCUMENTO Y OTRAS COSAS.

<?xml version=“1 0” encoding=“UTF-7” standalone=“yes”?><?xml version 1.0 encoding UTF 7 standalone yes ?>

36

Estructura de un documento XML(IV).

LA SEGUNDA LÍNEA O “DECLARACIÓN DE TIPO DE DOCUMENTO” LA SEGUNDA LÍNEA O “DECLARACIÓN DE TIPO DE DOCUMENTO” DEFINE QUE DTD (DOCUMENT TYPE DEFINITION) VALIDA Y DEFINE DEFINE QUE DTD (DOCUMENT TYPE DEFINITION) VALIDA Y DEFINE LOS DATOS QUE CONTIENE NUESTRO DOCUMENTO XMLLOS DATOS QUE CONTIENE NUESTRO DOCUMENTO XMLLOS DATOS QUE CONTIENE NUESTRO DOCUMENTO XML.LOS DATOS QUE CONTIENE NUESTRO DOCUMENTO XML.

<!DOCTYPE mensaje SYSTEM <!DOCTYPE mensaje SYSTEM “mensaje.dtd”“mensaje.dtd”>><mensaje><mensaje>

<!<!–– El contenido mensaje va aquí El contenido mensaje va aquí !!-->></mensaje></mensaje>

<!DOCTYPE etiqueta SYSTEM <!DOCTYPE etiqueta SYSTEM “http://www.empresa.com/dtds/etiqueta.dtd”“http://www.empresa.com/dtds/etiqueta.dtd”>>qq p p qp p q<etiqueta><etiqueta>

<!<!–– El contenido etiqueta va aquí El contenido etiqueta va aquí !!-->></etiqueta></etiqueta>

37

</etiqueta></etiqueta>

Estructura de un documento XML(IV).

LOS ELEMENTOS XML PUEDEN TENER CONTENIDO (MÁS LOS ELEMENTOS XML PUEDEN TENER CONTENIDO (MÁS ELEMENTOS, ATRIBUTOS, O AMBOS A LA VEZ, O BIEN SER ELEMENTOS, ATRIBUTOS, O AMBOS A LA VEZ, O BIEN SER

ÍÍELEMENTOS VACÍOS.ELEMENTOS VACÍOS.EJEMPLOS DE ELEMENTOS CON CONTENIDO SON LOS EJEMPLOS DE ELEMENTOS CON CONTENIDO SON LOS SIGUIENTES:SIGUIENTES:

<nombre><nombre>Jesualdo FernándezJesualdo Fernández</nombre></nombre><alarma tipo=<alarma tipo=“robo” “robo” planta=planta=“primera”“primera” puerta=puerta=“1.9”“1.9”>>Evacuen el edificioEvacuen el edificio</alarma></alarma>

LOS ELEMENTOS XML SIEMPRE EMPIEZAN CON UNA <etiqueta> LOS ELEMENTOS XML SIEMPRE EMPIEZAN CON UNA <etiqueta> QUE PUEDE CONTENER ATRIBUTOS O NO, Y TERMINA CON QUE PUEDE CONTENER ATRIBUTOS O NO, Y TERMINA CON UNA </etiqueta> QUE DEBE TENER EL MISMO NOMBRE. AL UNA </etiqueta> QUE DEBE TENER EL MISMO NOMBRE. AL CONTRARIO QUE EN HTML EN XML SIEMPRE SE DEBE “ ”CONTRARIO QUE EN HTML EN XML SIEMPRE SE DEBE “ ”CONTRARIO QUE EN HTML, EN XML SIEMPRE SE DEBE “cerrar” CONTRARIO QUE EN HTML, EN XML SIEMPRE SE DEBE “cerrar” UN ELEMENTO.UN ELEMENTO.

38

DOCUMENT TYPE DEFINITIONS (DTDs) (I).

CREAR UNA DEFINICIÓN DEL TIPO DE DOCUMENTO (DTD) ES CREAR UNA DEFINICIÓN DEL TIPO DE DOCUMENTO (DTD) ES COMO CREAR NUESTRO PROPIO LENGUAJE DE MARCADO, COMO CREAR NUESTRO PROPIO LENGUAJE DE MARCADO,

Ó ÍÓ ÍPARA UNA APLICACIÓN ESPECÍFICA.PARA UNA APLICACIÓN ESPECÍFICA.

POR EJEMPLO PODRÍAMOS CREAR UN DTD QUE DEFINA UNAPOR EJEMPLO PODRÍAMOS CREAR UN DTD QUE DEFINA UNAPOR EJEMPLO, PODRÍAMOS CREAR UN DTD QUE DEFINA UNA POR EJEMPLO, PODRÍAMOS CREAR UN DTD QUE DEFINA UNA TARJETA DE VISITA. A PARTIR DE ESTE DTD, TENDRÍAMOS TARJETA DE VISITA. A PARTIR DE ESTE DTD, TENDRÍAMOS UNA SERIE DE ELEMENTOS XML QUE NOS PERMITIRÍAN UNA SERIE DE ELEMENTOS XML QUE NOS PERMITIRÍAN DEFINIR TARJETAS DE VISITA.DEFINIR TARJETAS DE VISITA.DEFINIR TARJETAS DE VISITA.DEFINIR TARJETAS DE VISITA.

EL DTD DEFINE LOS TIPOS DE ELEMENTOS, ATRIBUTOS Y EL DTD DEFINE LOS TIPOS DE ELEMENTOS, ATRIBUTOS Y ENTIDADES PERMITIDAS Y PUEDE EXPRESAR ALGUNASENTIDADES PERMITIDAS Y PUEDE EXPRESAR ALGUNASENTIDADES PERMITIDAS, Y PUEDE EXPRESAR ALGUNAS ENTIDADES PERMITIDAS, Y PUEDE EXPRESAR ALGUNAS LIMITACIONES PARA COMBINARLOS.LIMITACIONES PARA COMBINARLOS.

39

DOCUMENT TYPE DEFINITIONS (DTDs) (II).

LA DTD PUEDE RESIDIR EN UN FICHERO EXTERNO O BIEN ESTARÁ LA DTD PUEDE RESIDIR EN UN FICHERO EXTERNO O BIEN ESTARÁ CONTENIDO EN EL PROPIO DOCUMENTO XML (standalone).CONTENIDO EN EL PROPIO DOCUMENTO XML (standalone).

Ejemplo:Ejemplo:<!DOCTYPE <!DOCTYPE direccion direccion [[<!ELEMENT<!ELEMENT direccion(nombre calle poblacion cp ciudad pais)direccion(nombre calle poblacion cp ciudad pais)>><!ELEMENT <!ELEMENT direccion(nombre_calle, poblacion, cp, ciudad, pais)direccion(nombre_calle, poblacion, cp, ciudad, pais)>><!ELEMENT <!ELEMENT nombre_callenombre_calle (#PCDATA)>(#PCDATA)><!ELEMENT <!ELEMENT poblacionpoblacion (#PCDATA)>(#PCDATA)><!ELEMENT <!ELEMENT cpcp (#PCDATA)>(#PCDATA)><!ELEMENT <!ELEMENT ciudadciudad (#PCDATA)>(#PCDATA)><!ELEMENT <!ELEMENT paispais (#PCDATA)>(#PCDATA)>]>]>

<direccion><direccion>< b ll >< b ll >C ll MC ll M </ b ll ></ b ll ><nombre_calle><nombre_calle>Calle MayorCalle Mayor</nombre_calle></nombre_calle><poblacion><poblacion>MonteagudoMonteagudo</poblacion></poblacion><cp><cp>3016030160</cp></cp><ciudad><ciudad>MurciaMurcia</ciudad></ciudad><pais><pais>EspañaEspaña</pais></pais>

40

<pais><pais>EspañaEspaña</pais></pais></direccion></direccion>

Ejemplo de DTD (I).

Crear un DTD para representar la información de un listín telefónico con la Crear un DTD para representar la información de un listín telefónico con la información siguiente:información siguiente:

El listín estará formado por varias personasEl listín estará formado por varias personasEl listín estará formado por varias personas.El listín estará formado por varias personas.

Los datos que necesitamos conocer para cada persona son los siguientes:Los datos que necesitamos conocer para cada persona son los siguientes:Cada persona debe tener un identificador único que la represente.Cada persona debe tener un identificador único que la represente.NombreNombreNombre.Nombre.Dirección, formada por CP, población y provincia.Dirección, formada por CP, población y provincia.Teléfono.Teléfono.0 o más e0 o más e--mails.mails.Género.Género.Género.Género.

41

Ejemplo de DTD (II). Fichero LISTIN.DTD

<?xml encoding=“UTF-8”?><!ELEMENT listin (persona)+><!ELEMENT persona (nombre, direccion, email*)><!ATTLIST persona id ID #REQUIRED>!ATTLIST persona id ID #REQUIRED<!ATTLIST persona género (hombre | mujer) #IMPLIED><!ELEMENT nombre (#PCDATA)><!ELEMENT direccion (cp, poblacion, provincia)><!ELEMENT cp (#PCDATA)><!ELEMENT poblacion (#PCDATA)><!ELEMENT provincia (#PCDATA)><!ELEMENT provincia (#PCDATA)><!ELEMENT email (#PCDATA)>

Basándonos en el anterior DTD podemos escribir el siguiente listín:

<?xml version=“1.0”?><!DOCTYPE listin SYSTEM “LISTIN.DTD”><listin>

<persona género=“hombre” id=“luis”><nombre>Luis Andrés</nombre><direccion><direccion>

<cp>10000</cp><poblacion>Madrid</poblacion><provincia>Madrid</provincia>

</direccion><email>[email protected]</email>

/

42

</persona></listin>

Ejercicio para casa

Hacer un DTD de una biblioteca– Una biblioteca tiene al menos 1 libro, tiene autores y y

personajes

– Un autor tiene nombre, apodo, fecha de nacimiento y de muerte, además de un atributo identificador obligatorio

U lib ti ISBN tít l t– Un libro tiene un ISBN, un título, autores y personajes. También tiene un atributo identificador obligatorioobligatorio

– Un personaje tiene un nombre y una descripción, así como un atributo identificador obligatorio

43

así como un atributo identificador obligatorio

Comparativa Plano vs HTML vs XML

Ejemplo 1. Texto PlanoJohn Citizen, 01/01/2000

Ejemplo 2. HTML<html>,<head><title>Name and Date of Births</title></head><body><table><tr>

<td>First Name</td><td>Last Name</td><td>Date of Birth</td>

Ejemplo 3. XML<name><first>John</first>

</tr><tr>

<td>John</td><td>Citizen</td><td>01/01/2001</td></t >

<last>John</last></name><date_of_birth>

</tr></table>

</body></html>

<month>January</month><day>01</day><year>2001</year>/d t f bi th

44

</html> </date_of_birth>

Un nuevo estándar: ODF

Open Document Format: Formato de documento abierto para aplicaciones informática de OASIS (2005)

Muchas compañías y tipos de usuarios implicadosMuchas compañías y tipos de usuarios implicados

Tipo de fichero Extensión Tipo Mime

Texto .odt application/vnd.oasis.opendocument.text

Hoja de cálculo .ods application/vnd.oasis.opendocument.spreadsheet

Presentación .odp application/vnd.oasis.opendocument.presentation

Dibujo .odg application/vnd.oasis.opendocument.graphics

Gráfica .odc application/vnd.oasis.opendocument.chart

Fórmula matemática .odf application/vnd.oasis.opendocument.formula

Base de datos .odb application/vnd.oasis.opendocument.database

Imagen odi application/vnd oasis opendocument image

45

Imagen .odi application/vnd.oasis.opendocument.image

Documento maestro .odm application/vnd.oasis.opendocument.text-master

Plantillas ODF

Tipo de fichero Extensión Tipo Mime

Texto .ottapplication/vnd.oasis.opendocument.text-template

Hoja de cálculo .otsapplication/vnd.oasis.opendocument.spreadshe

t t l tHoja de cálculo .ots

et-template

Presentación .otpapplication/vnd.oasis.opendocument.presentation-template

li ti / d i d t hiDibujo .otg

application/vnd.oasis.opendocument.graphics-template

46

Formato interno

Un fichero OpenDocument es un archivo comprimido a Formato de compresión JAR y quecomprimido a Formato de compresión JAR y que contiene varios ficheros y directorios:

Ficheros XML Otros ficheros Directorios

content.xml meta.xml settings.xml

mimetype layout-cache

META-INF/ Thumbnails/ Pictures/

styles.xml Configurations2/

47

El formato OpenDocument ofrece una clara separación entre el contenido, la disposición de éste en el documento y los metadatos

CONTENT.XML

Contenido real del documento (excepto los datos binarios como las imágenes).

<text:h text:style-name="Heading_2">Título</text:h>

<text:p text:style-name="Text_body"/>

<text:p text:style-name="Text_body"> Éste es un párrafo. La información sobre el formato se almacena en el fichero de estilo. La marca vacía text:p que se ve más arriba es un párrafo enLa marca vacía text:p que se ve más arriba es un párrafo en blanco (una línea vacía). </text:p>

48

STYLES.XML

Uso intensivo de los estilos para el formateo y disposición del contenido. La mayor parte de la información de estilo se almacena en este fichero (aunque hay parte que aparece en el fichero content.xml). Hay diferentes tipos de estilo, que incluyen los siguientes:– Estilos de párrafo.

– Estilos de página. p g

– Estilos de carácter.

– Estilos de marco.

– Estilos de lista.49

META.XML

Contiene los metadatos del documento. Por ejemplo, el autor, la identificación de la última persona que lo modificó, la fecha de última modificación, etc. El contenido tiene un aspecto similar a éste (DC implica Dublin Core:

<meta:creation-date>2003-09-10T15:31:11</meta:creation-date>

<dc:creator>Daniel Carrera</dc:creator>

<dc:date>2005-06-29T22:02:06</dc:date>

<d l > ES</d l ><dc:language>es-ES</dc:language>

<meta:document-statistic meta:table-count="6" meta:object-count="0" meta:page-count="59" meta:paragraph-count="676" meta:image-

t "2" t d t "16701" t h t t "98757"/count="2" meta:word-count="16701" meta:character-count="98757"/>

50

Otrossettings.xml: Este fichero incluye propiedades como el factor de zoom o la posición del cursor que afectan a la apertura inicial del documento, pero no son contenido ni afectan a la disposición de éste en el documento.

Pictures/: Esta carpeta contiene todas las imágenes del documento. El fichero content.xml contiene referencias a ellas mediante el uso de la etiqueta <draw:image> similar a la etiqueta <img> de HTML A continuación se da un<draw:image>, similar a la etiqueta <img> de HTML. A continuación se da un ejemplo de una de estas referencias:

<draw:image xlink:href="Pictures/10000000000005E80000049F21F631AB.tif"<draw:image xlink:href Pictures/10000000000005E80000049F21F631AB.tif xlink:type="simple" xlink:show="embed" xlink:actuate="onLoad"/>

mimetype: Se trata de un fichero con una única línea que contiene el tipo MIME del yp q pdocumento. Una implicación de esto último es que, en realidad, la extensión del nombre del fichero es indiferente del formato real, toda vez que la que prevalece es la definida por este fichero. Así, la extensión del fichero se utiliza sólo para f ilit l id tifi ió d l ti d fi h t d l ifacilitar la identificación del tipo de fichero por parte del usuario.

51

Consecuencias sobre ODF

Se garantiza el acceso a largo plazo a los datos producidos eliminando para ello las barreras té i l l h d i i t itécnicas o legales, muchas administraciones públicas y gobiernos han empezado a considerarlo un asunto de política de interés públicoun asunto de política de interés público

Recomendaciones de organizaciones y gobiernosRecomendaciones de organizaciones y gobiernos en Europa y América

Adaptación de Microsoft

52

Aplicaciones ODF

53