Los autores de la normalización de la información geográfica a nivel europeo (CEN), norteamericano (FGDC) e internacional (ISO), y su implementación en el Gestor Universal de Metadatos Geoespaciales (GeM+).
Otras iniciativas internacionales:
EL OpenGIS Consortium
Consideraciones sobre el OGC Abstract specification Topic 11: Metadata.
Implementación de las OpenGIS Abstract Specifications en el GeM+.
Otras iniciativas nacionales:
MIGRA v.1: Mecanismo de Intercambio de Información Geográfica Relacional formado por Agregación.
Los metadatos de MIGRA.
Implementación de MIGRA en el GeM+.
El Comité Européen de Normalisation (en adelante CEN) tiene como función promover la estandarización en todos los ámbitos dentro del espacio europeo. Lo forman las entidades nacionales de normalización de los países siguientes: Austria, Bélgica, República Checa, Dinamarca, Finlandia, Francia, Alemania, Grecia, Islandia, Irlanda, Italia, Luxemburgo, Holanda, Noruega, Portugal, España, Suecia, Suiza, y Reino Unido, así como las siguientes asociaciones representantes del sector industrial:
A finales de Octubre de 1991 el CEN creó el grupo de trabajo CEN/TC 287 (Technical Committee) responsable de la estandarización en el marco de la información geográfica. La normativa de él surgida, llamada EN (European Norm), substituirá la que hasta entonces rija en los países miembros anteriormente mencionados.
El Comité Técnico 287 (TC 287) llamado Geographic Information, ha publicado un total de 12 documentos con carácter prenormativo (ENV o normas experimentales). Estos documentos no son públicos. Hay que dirigirse al organismo nacional correspondiente, en nuestro caso AENOR (Asociación Española de Normalización y Certificación), para conseguir una copia en papel, previo pago del coste establecido. No están disponibles en formato digital ni en Internet. Está previsto que, una vez pasen a ser norma nacional (UNE) estos documentos sean traducidos del inglés al castellano, pero nosotros hemos usado todavía las versiones inglesas.
El Gestor Universal de Metadatos Geoespaciales (en adelante GeM+) recoge las especificaciones establecidas en los documentos siguientes:
Otras normas que, por su contenido, también afectan a la normalización de los metadatos del GeM+, son éstas:
Puede consultar una reseña del contenido de cada uno de ellos confeccionado por el propio Comité.
ESTRUCTURA DEL DOCUMENTO DE METADATOS DEL CEN
L'European Prestandard (ENV) 12657, Geographic Information - Data description - Metadata, fue aprobado por el CEN en Octubre de 1998. Su período de validez es inicialmente de tres años. Después de los dos primeros años se convoca a los integrantes del CEN para expresar sus opiniones, particularment en aquello que afecte a la conversión de este documento pre-normativo a norma europea. Está previsto, por tanto, para octubre del 2000. El período inicial de tres años de validez finaliza en octubre de 2001.
Se estructura en cuatro capítulos y tres anexos. El listado de los metadatos se recoge en el capítulo 4, en concreto en el punto 4.6 Element of metadata for describing geographic datasets. El Anexo A tiene carácter normativo y es la descripción de los metadatos en lenguaje EXPRESS. El lenguaje EXPRESS está recogido en la ISO 10303-11:1994 y se creó para definir entidades mediante sus atributos, así como la relación entre ellas. Los anexos B y C son informativos. El primero es nuevamente la descripción de los metadatos en EXPRESS-G, es decir, en forma de diagrama, mientras que el anexo C es el listado completo de los campos, con su descripción, la restricción (obligatoriedad o no), la cardinalidad y el tipo. Este último se limita a decir si son string o date, prácticamente (no pretende ser exhaustivo).
Durante el desarrollo del GeM+ hemos puesto un especial interés en esclarecer la verdadera utilidad del lenguaje EXPRESS, ya que parecía complicado en exceso. Hemos podido confirmar la tendencia, liderada por la ISO, a utilizar el UNIFIED MODELLING LANGUAGE (UML) para los esquemas conceptuales, y el XML como formato de intercanvio.
El documento empieza dando una sencilla y clásica definición de los metadatos ('data about datasets') y establece, como objetivo, la especificación de los datos que documentarán las bases geográficas (los datasets), los cuales incluyen información sobre el contenido, la representación, la extensión (geométrica y temporal), la referencia espacial, la calidad y la administración. También anuncia la definición del contenido mínimo obligado (mandatory) que deben tener los metadatos e incluye un glossary con las definiciones de los términos empleados.
No proviene de instrucciones o técnicas para la aplicación de su esquema porque, según justifica, ésta no es su finalidad. Asimismo, se autodefine como diseñado principalmente para definir datos digitales, pero aclarando que sus principios son también aplicables a la descripción de bases geográficas en otros formatos, como por ejemplo en papel.
Hay dos tipos de metadatos: obligatorios (mandatory) y opcionales (optional). Los obligatorios están indicados antecediéndolos por la palabra Shall y los opcionales por May.
Para que un conjunto de metadatos sea conforme con esta normativa, debe incluir las claves definidas como obligatorias en los capítulos siguientes:
e informar optativamente de los contenidos en los siguientes:
Todos los datos que se den en texto serán recogidos usando la norma EN 28601, es decir, Año-Mes-Dia (YYYY-MM-DD).
El lenguaje utilizado por los textos en la descripción de las bases será identificado por los códigos definidos en ISO 6 39 . Cuando convenga, podrán repetirse en otras lenguas.
El GeM+ está basado en el estándar europeo de metadatos ya que incorpora como obligatorios todos los contenidos que el CEN considera como tales, pero también es normativo según el estándar norteamericano, ya que incorpora como obligatorios todos los contenidos que el FGDC considera Mandatory o Mandatory if applicable.
Consulte un cuadro resumen de equivalencias entre los estándares del GeM+, del CEN y del FGDC
El FEDERAL GEOGRAPHIC DATA COMMITTEE
El Federal Geographic Data Committee (en adelante FGDC) es el organismo del gobierno de los Estados Unidos de América encargado de desarrollar la National Spatial Data Infrastructure en aquellos aspectos que afecten la distribución de los datos geográficos. El Junio de 1994 se aprobó el estándar de metadatos para datos geográficos digitales, the Content Standard for Digital Geospatial Metadata, la última revisión del cual se halla accesible en la página http://www.fgdc.gov/metadata/csdgm/. También puede consultar en formato pdf la versión que se ha usado para adaptar el GeM+ .
Estructura del Estándar
El estándar se organiza en una jerarquía de datos elementales y elementos compuestos que definen el contenido de los metadatos que documentan una base de datos digitales geográficos. El punto de partida son los "metadata" (sección 0). El elemento compuesto "metadata" se compone de otros elementos compuestos que, a su vez, representan aspectos diferentes de la base. Cada uno de estos elementos tiene una sección numerada en el estándar. En cada sección numerada, estos elementos compuestos se define por otros elementos compuestos y datos elementales. La sección "contact information" es una sección especial que especifica los datos de contacto de personas particulares y organizaciones. Otras secciones hacen uso de ésta, que se define una sola vez.
*Otras secciones comodín son Citation Information y Time Period Information.*
Elementos Compuestos (Compound Elements)
Un elemento compuesto es un grupo de datos elementales y otros elementos compuestos. Todos los elementos compuestos están descritos por datos elementales, o bien, directamente, o bien, a través de los elementos compuestos intermedios. Elementos compuestos representan conceptos de más alto nivel que no se puede representar por datos elementales individuales. La forma de la definición de los elementos compuestos es:
Compound element name -- definition.
Type: compound
Short Name:
El "type" (tipo) "compound" identifica exclusivamente los elementos compuestos en los listados de términos y definiciones. Se incluyen nombres abreviados de ocho, o menos, caracteres alfabéticos para facilitar la implementación del estándar.
Datos elementales (Data Elements)
Un dato elemental es un dato, lógicamente primitivo. La entrada de un dato elemental incluye el nombre del dato, su definición, una descripción de los valores que pueden ser asignados al dato elemental, y un nombre abreviado del dato elemental. La forma de la definición de los datos elementales es:
Data element name -- definition.
Type:
Domain:
Short Name:
La información sobre los valores de los datos elementales incluye una descripción del tipo de valor, y una descripción del rango de valores válidos. El tipo de elemento describe el tipo de valor por proporcionar. Las opciones son: "integer" para números enteros, "real" para números reales, "text" para caracteres ASCII, "date" para el día del año, y "time" para la hora del día.
El "domain" (rango) propone los valores válidos que puedan asignarse a cada dato elemental. El rango puede especificar una lista de valores válidos, referencias a listas de valores válidos, o limites de una gama de valores que puedan asignarse a los datos elementales.
El estándard categoriza los elementos como "mandatory", "mandatory-if-applicable", o "optional" (obligatorio, obligatorio si aplica, opcional) :
La optatividad de una sección o de un elemento compuesto siempre tiene prioridad sobre la optatividad de los elementos contenidos por dicha sección o elemento. Una vez que el productor de la base reconoce la aplicabilidad de la sección o del elemento compuesto se interpretan los elementos subordinados.
Reglas de producción (Production Rules)
Una regla de producción especifica la relación entre un elemento compuesto, los datos elementales y los otros elementos compuestos (de rango inferior). Cada regla de producción tiene una parte izquierda (identifier - identificador) y una parte derecha (expression - expresión) vinculados por el símbolo "=", indicando que el término de la izquierda se reemplaza por, o produce, el término de la parte derecha. Los término de la parte derecha son elementos compuestos o datos elementales individuales. A través de las substituciones realizadas con los términos emparejados en las reglas de producción es posible explica los conceptos de más alto nivel mediante datos elementales. Los símbolos utilizados en las reglas de producción tienen el significado que se detalla a continuación:
= se reemplaza por, produce,
consiste en + y [|] selection - selecciona un término de la lista de términos adjuntos (exclusive or). Los términos se separan por "|" m{}n iteration - el (los) término(s) adjunto(s) es (son) repetido(s) de "m" a "n" veces () optional - el (los) término(s) adjunto(s) es(son) opcional(es) |
El productor puede decidir si proporciona o no proporciona la información solamente cuando los términos están entre paréntesis.
El concepto "mandatory if applicable" (obligatorio si aplica) se tuvo que inventar porque existe gran variedad de maneras de producir y distribuir datos geográficos, por el hecho de que no todos los datos geográficos tienen las mismas características, y por el aspecto de que los detalles de bases en proyecto o en producción no siempre se saben. Este concepto quiere decir que, si una base muestra una característica determinada (o una base en producción o en proyecto se sabe que lo va a mostrar) el productor tiene que proporcionar la información necesaria para describir dicha característica. Este concepto se define en la regla de producción:
0{ term }1
El contenido se estructura de la siguiente manera:
Identification Information | Mandatory |
Data Quality Information | Mandatory if applicable |
Spatial Data Organization Information | Mandatory if applicable |
Spatial Reference Information | Mandatory if applicable |
Entity and Attribute Information | Mandatory if applicable |
Distribution Information | Mandatory if applicable |
Metadata Reference Information | Mandatory |
De la normalitzación a nivel internacional se encarga la International Organization for Standardization (en adelante ISO). Toma su nombre de un juego de palabras con prefijo griego que significa 'igual en cualquier aspecto', no de sus iniciales reales. Está emplazada en Ginebra e integra los organismos nacionales de normalización de más de 80 países, entre ellos el ANSI en EEUU o la AENOR en España, por citar sólo dos ejemplos conocidos.
ISO ha creado el Comité Técnico TC 211 Geographic information/Geomatics. Su trabajo se basa en los estándares previamente desarrollados por el FGDC, el CEN y el OpenGIS Consortium.
Estos son los proyectos que forman parte del TC 211 en
mayo del 2000:
19101 (15046-1): Geographic information - Reference model
19102 (15046-2): Geographic information - Overview
19103 (15046-3): Geographic information - Conceptual schema language
19104 (15046-4): Geographic information - Terminology
19105 (15046-5): Geographic information - Conformance and testing
19106 (15046-6): Geographic information - Profiles
19107 (15046-7): Geographic information - Spatial schema
19108 (15046-8): Geographic information - Temporal schema
19109 (15046-9): Geographic information - Rules for application schema
19110 (15046-10): Geographic information - Feature cataloguing methodology
19111 (15046-11): Geographic information - Spatial referencing by coordinates
19112 (15046-12): Geographic information - Spatial referencing by geographic identifiers
19113 (15046-13): Geographic information - Quality principles
19114 (15046-14): Geographic information - Quality evaluation procedures
19115 (15046-15): Geographic information - Metadata
19116 (15046-16): Geographic information - Positioning services
19117 (15046-17): Geographic information - Portrayal
19118 (15046-18): Geographic information -: Encoding
19119 (15046-19): Geographic information - Services
19120 (15854): Geographic information - Functional standards
19120/Amedmend 1: Geographic information - Functional standards - Amendment 1
19121 (16569): Geographic information - Imagery and gridded data
19122 (16822): Geographic information/Geomatics - Qualifications and Certification of Personnel
19123 (17753): Geographic information - Schema for coverage geometry and functions
19124 (17754): Geographic information - Imagery and gridded data components
19125: Geographic information - Simple feature access - SQL option
19126: Geographic information - Profile - FACC Data Dictionary
19127: Geographic information - Geodetic codes and parameters
Puede consultarse una reseña del contenido de cada uno de estos proyectos en la página web http://www.statkart.no/isotc211/scope.htm
El calendario de trabajo del TC211 ha ido cambiando en cada reunión de trabajo. Según la web del FGDC, en la última reunión plenaria, que tuvo lugar el 23 y 24 de marzo del 2002 en Bangkok, Tailándia, se fijaron las siguientes previsiones para el ISO Metadata Standard (el primer borrador, DIS, se aprovó en Septiembre del 2001):
Final Draft International Standard: Septiembre de 2002
International Standard: Diciembre de 2002
Los borradores no son de acceso público. A menos que la política de la ISO cambie, sus documentes solamente están disponibles en papel, previo pago del coste reglado en las respectivas instituciones normalizadoras nacionales, como AENOR. En Internet solamente se encuentra el índice de publicaciones con la posibilidad de hacer el pedido vía red. Curiosamente a los usuarios de los Estados Unidos se les facilita un password que les da acceso gratuito a estos documentos.
En normas telemáticas, las normas ISO tienen un equivalente en ITU-CCITT (ITU, International Telecommunication Union; CCITT, Comité Consultatif International Télégraphique et Téléphonique) y éstas sí están a libre disposición en Internet. En otros casos, los borradores previos de los documentos también han sido accesibles mediante esta vía.
A pesar de todo, hay algunas direcciones de Internet donde puede hallarse documentación diversa y algunas normas ISO, como por ejemplo en ftp.uni-erlangen.de.
El GeM+ se mantiene atento a la publicación de las normas ISO para adaptar su contenido en todo aquello que sea normativo, con la seguridad de que los cambios a realizar no afectarán substancialmente lo que ya está implementado proveniente de la normativa europea y norteamericana.
El OpenGIS Consortium (OGC), es una organización internacional fundada en 1994. En la actualidad está formada por 210 miembros, entre los que se encuentran prestigiosas universidades y centros de investigación, así como las principales compañías de software y telecomunicaciones (Autodesk, Inc., Bentley Systems, Inc., Intergraph Corporation, MapInfo Corporation, Microsoft Corporation y un largo etcétera). También participan de forma muy activa los organismos nacionales americanos productores de cartografía, como por ejemplo el US Army ERDC, el US Census Bureau, el US Federal Geographic Data Committee, el US National Aeronautics and Space Administration-NASA, el US National Imagery and Mapping Agency y otros.
EL OpenGIS participa, al mismo tiempo, en las diferentes iniciativas de estandarización, entre las que destaca especialmente la ISO TC 211.
El objetivo del OGC es acabar con los problemas originados en el intercambio de información entre sistemas operativos, entre DCPs (Distributed Computing Platforms) y entre diferentes comunidades de usuarios que definen modelos de datos específicos.
El Technical Committee (TC) es el encargado de desarrollar las
llamadas OpenGIS Interface Specifications. Está organizado en base
a los Special Interest Groups (SIGs), que a su vez se subdividen en
dos grandes categorías según el tipo de tarea a desarrollar: las Domain
Technology y las Core Technology. A continuación explicamos
brevemente sus funciones:
Feature SIG: Desarrolla consenso sobre la
geometría, identidad y relación de elementos.
Coordinate Transformation SIG: Desarrolla estrategias para la
codificación de los sistemas de coordenadas y las transformaciones
entre estos sistemas.
A continuación transcribimos un párrafo bastante significativo del trabajo que llevan a cabo los SIGs (Special Interest Groups - Grupos de interés especial) y del proceso posterior:
Cada SIG desarrolla un libro blanco describiendo el propósito y alcance del trabajo del SIG. Los SIG desarrollan "use cases" (casos de uso) o escenarios detallados que 1) identifican los participantes (personas y sistemas) y los servicios (p.e. en tratamiento de imagen: rectificación, orto-rectificación, registración, diferenciación, detección de elementos, comparación imagen-imagen, generación sintética de fotos, etc) y 2) identifican dónde aparecen los servicios dentro del escenario, y dónde se genera el valor. Los requerimientos de las interfaces se detallan en un lenguaje formal de programación (UML) y así se convierten en una parte de la OpenGIS Abstract Specification, una especificación de alto nivel independiente de los plataformas informáticos.
La OpenGIS® Abstract Specification es un documento abierto, sujeto a cambios y añadidos en cada reunión del OGC Technical Committee. Solamente los miembros del OGC pueden proponer cambios y añadidos.
Pueden descargarse en: http://www.opengis.org./techno/specs.htm
Conviene insistir en que estas especificaciones están sujetas a cambios, pero que estos cambios únicamente pueden provenir de los miembros del OGC.
Unos ejemplos de Abstracts:
Topic 1 - Feature Geometry version 4
Topic 2 - Spatial Reference Systems
Topic 11 - Metadata
A la publicación de las OGC Abstract Specifications siguen los Request for Proposals (RFP), que son el paso intermedio a las Implementation Specifications:
OpenGIS® Simple Features Specification for CORBA
Revision 1
OpenGIS® Simple Features Specification for SQL
El OGC también publica Recommendations:
Actualmente se ha publicado solamente una, con fecha reciente (el 12 de mayo de 2000) con el título Geography Markup Language (GML).
Consideraciones sobre el OGC Abstract specification Topic 11: Metadata
La versión que cuelga actualmente del web del OGC es del 3 de marzo de 1998. La última modificación data del mismo mes de 1999. El documento define el Essential Model y el Abstract Model para los metadatos.
La selección final de cuales entidades de metadatos y elementos se asocian con cada uno de los "Feature and Feature Collection" se deja al criterio de cada productor de datos y/o cada comunidad de información geo-espacial. Esta selección de entidades y elementos de metadatos variará con frecuencia entre los tipos de entidades (features) y los propósitos de las diferentes colecciones de entidades (Feature Collections). Este documento del OGC deja la definición de los elementos de metadatos y entidades estandarizados para otras organizaciones, incluyendo ISO/TC 211, Federal Geographic Data Committee (FGDC), y organizaciones más específicos a comunidades de información geo-espacial.
Este documento está sujeto a cambios hasta que sus contenidos permitan la realización de la Implementation Specification.
Implementación de las OpenGIS Abstract Specifications en el GeM+
El trabajo del OGC sobre los metadatos se basa íntegramente en el que paralelamente desarrolla la ISO, que a su vez hereda el trabajo hecho en la sede del CEN y del FGDC.
Otras iniciativas nacionales
MIGRA v.1: Mecanismo de Intercambio de Información Geográfica Relacional formado por Agregación.
Nació a iniciativa de la AENOR (Asociación Española de Normalización y Certificación) y la COAXI (Comisión Nacional para la Cooperació entre las Administraciones Públicas en el campo de los Sistemas y Tecnologías de la Información) que agrupa el Ministerio de Administraciones Públicas (MAP) y la Federación Española de Municipios y Provincias (FEMP).
Se desarrolló durante los meses de enero-septiembre de 1996 y es norma española experimental (UNE exp.) desde el 30 de enero de 1997, revisable antes de tres años (habría tocado ahora, en enero del 2000, pero no hay noticias), con la intención de substituirla por la normativa europea o internacional que esté disponible en este momento. Puede hallarse una reseña en http://www.map.es:80/csi/pg5m51.htm.
Características principales:
MIGRA es un estándar de transferencia de datos geográficos digitales, que incluye:
Solamente es aplicable a datos vectoriales. Los rásters no son tenidos en cuenta. Son citados en la introducción para señalar que ya existen formatos comerciales suficientemente extendidos como para que no sea un problema la transferencia de datos.
Tampoco considera la referenciación indirecta, sino únicamente los sistemas de referencia basados en coordenadas.
No incluye ninguna manera de realizar consultas en un SIG y transferir las posibles respuestas, ni ningún mecanismo para transferir actualizaciones.
Utiliza el lenguaje EXPRESS (ISO 10303-11:1993) -adaptado por el CEN para la definición del modelo conceptual de datos-, pero más para mantener la coherencia con las directrices europeas que para que las características de este lenguaje lo hagan el más idóneo para la difusión e implementación de las directrices de MIGRA, como expresan claramente sus autores en la introducción al modelo conceptual en Express.
El modelo de datos de MIGRA contempla cuatro niveles de estructuración:
La norma incluye un ejemplo de cada nivel de estructuración.
El catálogo de elementos de MIGRA está formado por:
Se han recogido por agregación las clases de elementos utilizadas por el Instituto Geográfico Nacional (IGN) y la Dirección General del Catastro (CGC), más las incorporadas por la Federación Española de Municipios y Provincias (FEMP).
El criterio de codificación sigue un modelo jerárquico con tres niveles: Tema, Grupo y Subgrupo.
El modelo físico de MIGRA especifica que, a excepción del de metadatos, todos los ficheros y todos los campos son de longitud de registro fijo y se trata de tablas relacionales en 3ª Forma Normal. Esta última afirmación sirve para garantizar que las tablas no contienen redundancia de datos, y que en su modificación no se podrá incurrir en anomalías durante la actualización, el borrado y la inserción de datos.
El contenido de los campos en los archivos en formato MIGRA podrán ser de los tipos siguientes:
En caso de que un campo contenga cualquiera de los dos últimos casos, les será de aplicación la norma siguiente:
La novedad de MIGRA respecto a la normativa del CEN, es que MIGRA sí define un formato para los ficheros de los metadatos. En este formato existen dos clases de registros:
Aunque MIGRA no lo explicita, sigue fielmente el formato de los ficheros INI de Windows, de la misma manera que el GeM+, con las dos siguientes excepciones:
Las abreviaturas NA y ND serán usadas cuando sean de aplicación, de manera que ninguna variable tenga como valor el carácter blanco.
MIGRA no especifica ningún nivel de obligatoriedad ni indicación del tipo de cardinalidad de las secciones y variables en que organiza los metadatos. Las secciones son las siguientes:
[PRODUCTOR]
[DISTRIBUIDOR] (si es distinto al Productor)
[DATOS]
[CONTENIDO]
[NOTAS]
Dentro de la sección [CONTENIDO] se encuentra la información referida a los atributos temáticos y a la calidad. A continuación hacemos un pequeño resumen.
Los atributos temáticos
Se desglosan en dos subsecciones:
[FICHERO_DE_ATRIBUTOS_1]
Es la descripción física de los ficheros de atributos: longitud y número
de registros, mida en bytes, etc.
[ATRIBUTOS_DEL_FICHERO_1]
Es la información específica de cada atributo:
La calidad
Los criterios de calidad aplicables a un intercambio de datos, según MIGRA, son los referentes a:
Los criterios que establecen la calidad de los datos son: