Els organismes de normalització de la informació geogràfica i la seva implementació en el Gestor Universal de Metadades Geoespacials (GeM+).
El Comité Européen de Normalisation (en endavant CEN) té com a funció promoure l'estandardització en tots els àmbits dins l'espai europeu. El formen les entitats nacionals de normalització dels següents països: Àustria, Bèlgica, República Txeca, Dinamarca, Finlàndia, França, Alemanya, Grècia, Islàndia, Irlanda, Itàlia, Luxemburg, Holanda, Noruega, Portugal, Espanya, Suècia, Suiza, i Regne Unit, així com les següents associacions representants del sector industrial:
A finals d'Octubre del 1991 el CEN creà el grup de treball CEN/TC 287 (Technical Committee) responsable de la estandardització en el marc de la informació geogràfica. La normativa d'ell sorgida, anomenada EN (European Norm), substituirà la que fins aleshores regeixi en els països membres abans esmentats.
El Comitè Tècnic 287 (TC 287) anomenat Geographic Information, ha publicat un total de 12 documents amb caràcter prenormatiu (ENV o normes experimentals). Aquests documents no són públics. Cal adreçar-se a l'organisme nacional corresponent, en el nostre cas AENOR (Asociación Española de Normalización y Certificación), per aconseguir una còpia en paper, previ pagament del cost establert. No estan disponibles en format digital ni a Internet. Està previst que, un cop passin a ser norma nacional (UNE) aquests documents siguin traduïts de l'anglès al castellà, però nosaltres encara hem utilitzat les versions angleses.
El Gestor Universal de Metadades Geoespacials (en endavant GeM+) recull les especificacions establertes en els següents documents:
Altres normes que, pel seu contingut, també afecten la normalització de les metadades del GeM+, són aquestes:
Podeu consultar una ressenya del contingut de cadascun d'ells feta pel mateix Comité.
ESTRUCTURA DEL DOCUMENT DE METADADES DEL CEN
L'European Prestandard (ENV) 12657, Geographic Information - Data description - Metadata, va ser aprovat pel CEN l'Octubre del 1998. El seu període de validesa és inicialment de tres anys. Després dels dos primers anys els integrants del CEN són convocats a donar les seves opinions, particularment en allò que afecti la conversió d'aquest document pre-normatiu a norma europea. Està previst, doncs, per l'octubre del 2000. El període inicial de tres anys de validesa finalitza l'octubre del 2001.
S'estructura en quatre capítols i tres annexos. El llistat de les metadades es recull en el capítol 4, en concret en el punt 4.6 Element of metadata for describing geographic datasets. L'Annex A té caire normatiu i és la descripció de les metadades en llenguatge EXPRESS. El llenguatge EXPRESS està recollit en la ISO 10303-11:1994 i es va crear per a definir entitats mitjançant els seus atributs, així com la relació entre elles. Els annexos B i C són informatius. El primer és de nou la descripció de les metadades en EXPRESS-G, és a dir, en forma de diagrama, mentre que l'annex C és el llistat complet dels camps, amb la seva descripció, la restricció (obligatorietat o no), la cardinalitat i el tipus. Aquest darrer es limita a dir si són string o date, pràcticament (no pretén ser exhaustiu).
Durant el desenvolupament del GeM+ hem tingut especial interès en aclarir la veritable utilitat del llenguatge EXPRESS, ja que semblava en excés complicat. Hem pogut confirmar la tendència, liderada per la ISO, d'utilitzar l'UNIFIED MODELLING LANGUAGE (UML) per els esquemes conceptuals, i l'XML com a format d'intercanvi.
El document comença donant una senzilla i clàssica definició de les metadades ('data about datasets') i estableix, com a objectiu, la especificació de les dades que documentaran les bases geogràfiques (els datasets), les quals inclouen informació sobre el contingut, la representació, l'extensió (geomètrica i temporal), la referència espacial, la qualitat i l'administració. També anuncia la definició del contingut mínim obligat (mandatory) que han de tenir les metadades i inclou un glossari amb les definicions dels termes emprats.
No prové d'instruccions o de tècniques per l'aplicació del seu esquema perquè, segons justifica, aquesta no és la seva finalitat. Tanmateix, s'autodefineix com dissenyat principalment per definir dades digitals, però aclarint que els seus principis són també aplicables per descriure bases geogràfiques en altres formats, com per exemple en paper.
Hi ha dos tipus de metadades: obligatòries (mandatory) i opcionals (optional). Les obligatòries estan indicades antecedint-les per la paraula Shall i les opcionals per May.
Perquè un conjunt de metadades sigui conforme amb aquesta normativa, ha d'incloure les claus definides com obligatòries en els següents capítols:
i optativament informar-ne de les contingudes en els següents:
Totes les dates que es donen en text seran recollides utilitzant la norma EN 28601, és a dir, Any-Mes-Dia (YYYY-MM-DD).
El llenguatge utilitzat pels textos en la descripció de les bases serà identificat pels codis definits en ISO 639. Quan convingui, es podran repetir en altres llengües.
El GeM+ està basat en l'estàndard europeu de metadades ja que incorpora com obligatoris tots els continguts que el CEN considera com a tal, però també és normatiu segons l'estàndard nord-americà, ja que incorpora com obligatoris tots els continguts que el FGDC considera Mandatory o Mandatory if applicable.
El FEDERAL GEOGRAPHIC DATA COMMITTEE
El Federal Geographic Data Committee (en endavant FGDC) és l'organisme del govern dels Estats Units d'Amèrica encarregat de desenvolupar la National Spatial Data Infrastructure en aquells aspectes que afectin la distribució de les dades geogràfiques. El Juny del 1994 va aprovar l'estàndard de metadades per dades geogràfiques digitals, the Content Standard for Digital Geospatial Metadata, la darrera revisió del qual es troba accessible a la plana http://www.fgdc.gov/metadata/csdgm/. També podeu consultar en format pdf la versió que s'ha fet servir per adaptar el GeM+ .
Estructura de l'Estàndard
L'estàndard s'organitza amb una jerarquia de dades elementals i elements compostos que defineixen el contingut de les metadades que documenten una base de dades digitals geogràfiques. El punt de partida són les "metadades" (secció 0). L'element compost "metadada" es compon d'altres elements compostos que, al seu torn, representen aspectes diferents de la base. Cada un d'aquests elements té una secció numerada a l'estàndard. A cada secció numerada, aquests elements compostos es defineixen per altres elements compostos i dades elementals. La secció "contact information" és una secció especial que especifica les dades de contacte de persones, particulars i organitzacions. Altres seccions fan ús d'aquesta, que es defineix un sol cop.
*Altres seccions comodins són Citation Information i Time Period Information.*
Elements Compostos (Compound Elements)
Un element compost és un grup de dades elementals i altres elements compostos. Tots els elements compostos estan descrits per dades elementals, o bé, directament, o bé, a través dels elements compostos intermedis. Els elements compostos representen conceptes de més alt nivell que no es poden representar per dades elementals individuals. La forma de la definició dels elements compostos és:
Compound element name -- definition.
Type: compound
Short Name:
El "type" (tipus) "compound" identifica exclusivament als elements compostos als llistats de termes i definicions. S'inclouen noms abreviats de vuit, o menys, caràcters alfabètics per facilitar la implementació de l'estàndard.
Dades elementals (Data Elements)
Una dada elemental és una dada, lògicament primitiu. L'entrada d'una dada elemental inclou el nom de la dada, la seva definició, una descripció dels valors que poden ser assignats a la dada elemental, i un nom abreviat de la dada elemental. La forma de la definició de les dades elementals és:
Data element name -- definition.
Type:
Domain:
Short Name:
La informació sobre els valors de les dades elementals inclou una descripció del tipus de valors, i una descripció del rang de valors vàlids. El tipus d'element descriu el tipus de valor a proporcionar. Les opcions són: "integer" per nombres enters, "real" per nombres reals, "text" per caràcters ASCII, "date" pel dia de l'any, i "time" per l'hora del dia.
El "domain" (rang) proposa els valors vàlids que poden assignar-se a cada dada elemental. El rang pot especificar una llista de valors vàlids, referències a llistes de valors vàlids, o límits d'una gamma de valors que poden assignar-se a les dades elementals.
L'estàndard categoritza els elements com "mandatory", "mandatory-if-applicable", o "optional" (obligatori, obligatori si és apropiat, opcional):
L'optativitat d'una secció o d'un element compost sempre té prioritat sobre la optativitat dels elements continguts per aquesta secció o element. Un cop el productor de la base reconeix l'aplicabilitat de la secció o de l'element compost, és quan ha d'interpretar els elements subordinats.
Regles de producció (Production Rules)
Una regla de producció especifica la relació entre un element compost, les dades elementals i altres elements compostos (de rang inferior). Cada regla de producció té una part esquerra (identifier - identificador) i una part dreta (expression - expressió) vinculats pel símbol"=", indicant que el terme de l'esquerra es substitueix per, o produeix, el terme de la part dreta. Els termes de la part dreta són elements compostos o dades elementals individuals. A partir de les substitucions realitzades amb els termes emparellats a les regles de producció és possible explicar els conceptes de més alt nivell mitjançant dades elementals. Els símbols utilitzats a les regles de producció tenen el significat que es detalla a continuació:
= es
substitueix per, produeix, consisteix en + i [|] selection - selecciona un terme de la llista de termes adjunts (exclusive or). Els termes se separen per "|" m{}n iteration - el/s terme/s adjunt/s és/són repetit/s de "m" fins a "n" vegades () optional - el/s terme/s adjunt/s és/són opcional/s |
El productor pot decidir si proporciona o no proporciona la informació només si els termes están entre parèntesis.
El concepte "mandatory if applicable" (obligatori si és apropiat) es va haver d'inventar perquè existeixen gran varietat de maneres de produir i distribuir dades geogràfiques, pel fet que no totes les dades geogràfiques tenen les mateixes característiques i per l'aspecte de que els detalls de bases en projecte o producció no sempre es coneixen. Aquest concepte vol dir que si una base presenta una característica determinada (o una base en producció o en projecte se sap que la presentarà) el productor ha de proporcionar la informació necessària per descriure aquesta característica. Aquest concepte es defineix a la regla de producció:
0{ term }1
El contingut s'estructura de la següent manera:
Identification Information | Mandatory |
Data Quality Information | Mandatory if applicable |
Spatial Data Organization Information | Mandatory if applicable |
Spatial Reference Information | Mandatory if applicable |
Entity and Attribute Information | Mandatory if applicable |
Distribution Information | Mandatory if applicable |
Metadata Reference Information | Mandatory |
La INTERNATIONAL ORGANITZATION FOR STANDARDIZATION
De la normalització a nivell internacional s'encarrega la International Organization for Standardization (en endavant ISO). Pren el seu nom d'un joc de paraules amb prefix grec que significa 'igual en qualsevol aspecte', no pas de les seves inicials reals. Està emplaçada a Ginebra i integra els organismes nacionals de normalització de més de 80 països, entre ells American National Standards Institute (ANSI) a EUA o AENOR a Espanya, per citar només dos exemples coneguts.
ISO ha creat el Comité Tècnic TC 211 Geographic information/Geomatics. La seva feina es basa en els estàndards prèviament desenvolupats pel FGDC, el CEN i l'Open Geospatial Consortium.
El GeM+ es manté atent a la publicació de les normes ISO per adaptar-ne el seu contingut en tot allò que sigui normatiu, amb la seguretat que els canvis a realitzar no afectaran substancialment el què ja està implementat provinent de la normativa europea i nord-americana.
ISO 19115:2003 Geographic information - Metadata
La norma ISO 19115:2003 Geographic information - Metadata, pertanyent a la família de normes Internacionals ISO 19100 per la Informació Geográfica desenvolupada pel Comité Técnic 211 (Geomatic/Geographic Information) dins de l'Organització d'Estandardització Internacional (ISO). Ha estat adoptada com a Norma Europea pel CEN/TC287 i com a norma espanyola per AEN/CNT148. Defineix l'esquema requerit per descriure la informació i els serveis geogràfics. Proporciona informació sobre la identificació, l'extensió, la qualitat, l'esquema espacial i temporal, la referencia espacial i la distribució de dades geogràfiques digitals. Es aplicable a:
Proporciona una estructura per descriure la informació geogràfica mitjançant elements de metadades i estableix una terminologia comuna pels mateixos. Per a poder desenvolupar la seva implementació s'utilitza la norma ISO 19139.
El GeM+ està organitzat basant-se en les components de la informació espacial, temporal i temàtica.
ISO/TS 19139:2007 Geographic information - Metadata - XML schema implementation
La norma ISO/TS 19139:2007, Geographic information - Metadata - XML schema implementation defineix la codificació Geographic MetaData XML (gmd), una implementació d'esquema XML derivada de la norma ISO 19115. Aquesta norma defineix un conjunt d'esquemes en XML que descriuen les metadades associades a cada nivell d'informació, permeten així la seva descripció, assegurar la validació i posterior intercanvi. En el següent enllaç estan disponibles els esquemes definits http://standards.iso.org/ittf/PubliclyAvailableStandards/ISO_19139_Schemas/
L'Open Geospatial Consortium (OGC), és una organització internacional fundada en 1994. En l'actualitat està formada per més 500 membres, empreses, agencies governamentals, organitzacions d'investigació i universitats impulsades per a generar informació geoespacial (localització) i serveis seguint els principis FAIR (Findable, Accessible, Interoperable and Reusable), és a dir que es puguin trobar, que siguin accessibles, interoperables i reutilitzables. OGC participa, alhora, en les diferents iniciatives d'estandardització, entre les que destaca especialment la ISO TC 211.
L'OGC participa, alhora, en les diferents iniciatives d'estandardització, entre les que destaca especialment la ISO TC 211.
Consideracions sobre l'OGC Abstract specification Topic 11: Metadata
La versió que hi ha disponible en la web de l'OGC és va actualitzar a la darrera versió de l'estàndard de metadades ISO, el 21 de setembre de 2016. Abans d'aquesta data, aquest tema era el mateix que ISO 19115:2003. El treball de l'OGC sobre les metadades es basa íntegrament en el que paral·lelament desenvolupa la ISO, que alhora hereta la feina feta a la seu del CEN i del FGDC.
El GeM+ és conforme a les normes d'implementació de metadades de la normativa INSPIRE.
La Comissió Europea estableix la Directiva INSPIRE (Infrastructure for Spatial Information in Europe). Va ser desenvolupada en col·laboració dels Estats membres i països en procés d'adhesió, amb la finalitat de fer disponible la informació necessària per a la gestió de polítiques ambientals de la Unió Europea. Aprovada el 14 de març de 2017 (Directiva 2007/2/CE).
Altres iniciatives nacionals
MIGRA v.1: Mecanismo de Intercambio de Información Geográfica Relacional formado por Agregación.
Va nèixer a iniciativa de la Asociación Española de Normalización y Certificación (AENOR) i la Comisión Nacional para la Cooperación entre las Administraciones Públicas en el campo de los Sistemas y Tecnologías de la Información (COAXI) que agrupa el Ministerio de Administraciones Públicas (MAP) i la Federación Española de Municipios y Provincias (FEMP).
Es va desenvolupar durant els mesos de gener-setembre de 1996 , va esdevenir norma espanyola experimental (UNE 148001:1998 EX) i es va anular l'any 2006. BOE-A-2007-469.
Característiques principals:
MIGRA és un estàndard de transferència de dades geogràfiques digitals, que inclou:
Només és aplicable a dades vectorials. Els ràsters no els considera. Els cita en la introducció per dir que ja existeixen formats comercials prou estesos com per què no sigui un problema la transferència de dades.
Tampoc considera la referenciació indirecta, sinó només els sistemes de referència basats en coordenades.
No inclou cap forma de realitzar consultes a un SIG i transferir les possibles respostes, ni cap mecanisme per transferir actualitzacions.
Utilitza el llenguatge EXPRESS (ISO 10303-11:1993) -adaptat pel CEN per la definició del model conceptual de dades-, però més per mantenir la coherència amb les directrius europees que no pas perquè les característiques d'aquest llenguatge el facin el més idoni per la difusió i implementació de les directrius de MIGRA, com expressen clarament els seus autors en la introducció al model conceptual en Express.
El model de dades de MIGRA contempla quatre nivells d'estructuració:
La norma inclou un exemple de cada nivell d'estructuració.
El catàleg d'elements de MIGRA està format per:
S'han recollit per agregació les classes d'elements utilitzades per l'Instituto Geográfico Nacional (IGN) i la Dirección General del Catastro, més les incorporades per la Federación Española de Municipios y Provincias (FEMP).
El criteri de codificació segueix un model jeràrquic amb tres nivells: Tema, Grup i Subgrup.
El model físic de MIGRA especifica que, a excepció del de metadades, tots els fitxers i tots els camps són de longitud de registre fixe i es tracta de taules relacionals en 3ª Forma Normal. Aquesta darrera afirmació serveix per garantir que les taules no contenen redundància de dades, i que en la seva modificació no es podrà incòrre en anomalies durant l'actualització, l'esborrat i la inserció de dades.
El contingut dels camps en els arxius en format MIGRA podran ser dels següents tipus:
En cas que un camp contingui qualsevol dels dos casos darrers, els serà d'aplicació la següent norma:
La novetat de MIGRA respecte a la normativa del CEN, és que MIGRA sí defineix un format pels fitxers de les metadades. En aquest format existeixen dues classes de registres:
Encara que MIGRA no ho explicita, segueix fidelment el format dels fitxers INI de Windows, de la mateixa manera que fa el GeM+, amb les dues excepcions següents:
Les abreviatures NA i ND seran usades quan siguin d'aplicació, de manera de cap variable tingui com a valor el caràcter blanc.
MIGRA no especifica cap nivell d'obligatorietat ni indicació del tipus de cardinalitat de les seccions i variables en què organitza les metadades. Les seccions són les següent:
[PRODUCTOR]
[DISTRIBUIDOR] (si és distint que el Productor)
[DATOS]
[CONTENIDO]
[NOTAS]
Dins la secció [CONTENIDO] es troba la informació referida als atributs temàtics i a la qualitat. A continuació en fem un petit resum.
Els atributs temàtics
Es desglossen en dues subseccions:
[FICHERO_DE_ATRIBUTOS_1]
És la descripció física dels fitxers d'atributs: longitud i nombre de
registres, mida en bytes, etc.
[ATRIBUTOS_DEL_FICHERO_1]
És la informació específica de cada atribut:
La qualitat
Els criteris de qualitat aplicables a un intercanvi de dades, segons MIGRA, són els referits a:
Els criteris que estableixen la qualitat de les dades són: