Present i futur dels formats GIS - Capítol I
En l’univers del GIS hi ha molts mons i un dels més importants i canviants és el dels formats.
La incorporació dels sistemes d’informació geogràfica (GIS) a cada vegada a més àmbits i disciplines, ha fomentat un creixement notable del número de formats GIS existents.
Què és un format GIS?
És la manera d’emmagatzemar de forma codificada, informació geogràfica vectorial o raster, en un fitxer o base de dades.
En aquest primer capítol parlarem del present i futur dels formats per a tractar dades vectorials, formes geomètriques diferenciades entre punts, línies i polígons en 2D. En capítols posteriors parlarem de la gestió en bases de dades geoespaials i dels formats més adequats per a tractar dades en 3D.
Shapefile, un clàssic
Va ser creat per ESRI(ArcGIS) fa més de 25 anys, tot i que és compatible amb qualsevol software GIS. El més estès, acceptat i utilitzat.
A nivell estructural, cada shapefile pot representar un sol tipus de geometria (punt, línia o polígon) i consta de 7 subfitxers. D’aquests n’hi ha 3 que són obligatoris: *.shp (geometries), *.dbf (taula d’atributs associada) i *.shx (índex de les geometries). A banda, n’hi ha 4 més d’ús opcional tot i que recomanat: *.prj (sistema de coordenades i projecció), *.sbn i *.sbx (índex espaial per a la optimització de consultes) i *.xml (metadades)..
Com a punts favorables tenim seva popularitat i acceptació general, així com la facilitat a l’hora de fer conversions a d’altres formats. També resulta pràctic poder consultar la taula d’atributs (*.dbf) sense necessitat de programari GIS.
En contra hi juga la necessitat d’un mínim de 3 subfitxers per a representar un únic tipus de geometria. La mida màxima del format és de 2 Gb, el límit és de 10 caràcters per al nom de cada camp i de 254 per al contingut de cada registre de la taula d’atributs (*.dbf). Cal tenir en compte que no té capacitat per tractar dades raster.
En definitiva, la facilitat per a la conversió a d’altres formats i l’ús generalitzat en la majoria d’institucions, fa que encara segueixi sent el més popular. No obstant, l’aparició de nous formats més optimitzats i compactes, sense les limitacions que hem comentat, fan pensar que el seu horitzó d’obsolescència no està massa llunyà.
Geopackage, l’aspirant
Amb tot just 10 anys d’existència, totalment obert i transversal, està preparat per tractar grans volums de dades amb geometries complexes.
Estructuralment, estem davant d’un únic fitxer *.gpkg, capaç d’emmagatzemar diversos tipus de geometries. Empaquetat en forma de contenidor SQLite (motor de bases de dades més utilitzat al món), té característiques similars al d’una base de dades geoespaial, podent referir-nos-hi com a base de dades personal.
A favor hi juga la seva optimització, ja que només cal un fitxer per a emmagatzemar diversos tipus de geometries. Té capacitat de tractar geometries complexes, així com dades raster. Pot allotjar volums de dades superiors als 100 Tb, sense limitacions en el número de caràcters per camps i registres.
Com a punts en contra podríem considerar que al ser un format relativament nou, encara no està molt estès. A banda, la complexitat de la seva estructura interna fa que sigui imprescindible l’ús d’un programari GIS per a poder consultar-ne la informació.
En resum, la optimització en l’empaquetat, les bones prestacions d’allotjament i la capacitat de tractar geometries complexes, fan que es postuli com a ferm aspirant a ser el format GIS més popular en els propers anys.
File Geodatabase, l’aposta d’ESRI
És el format d’ESRI amb el que actualment es creen noves dades per defecte amb la seva eina GIS desktop (ArcGIS PRO).
La seva estructura és la d’un conjunt de fitxers empaquetats que emula a una geodatabase per al seu ús en àmbit local. En aquest cas, també podem parlar d’una base de dades personal, permetent emmagatzemar diversos tipus de geometries vectorials, així com dades raster.
Com a punts a favor tenim que es tracta d’un paquet de fitxers que permet allotjar n tipus de geometries. A banda, dins l’entorn ESRI, presenta funcionalitats equivalents a les d’una geodatabase.Un punt fonamental en contra és que aquestes funcionalitats de geodatabase es perden quan no es treballa amb ArcGIS PRO (ESRI). A banda, tal com passa amb el format Geopackage, la informació no és àgilment consultable sense un programari GIS.
En definitiva, es tracta d’una bona opció a l’hora de treballar en un àmbit local amb les funcionalitats d’una base de dades. L’inconvenient és que moltes d’aquestes funcionalitats queden restringides quan es treballa amb eines GIS fora del món ESRI.
GeoJSON, el més àgil
Creat al 2008, tot i que alliberat per a l’ús al 2016, és el format més útil per intercanviar dades, treballant en entorn web amb un format senzill i lleuger.
A nivell d’estructura, és molt similar al d’un JSON ja que és el format en el que està basat. Es tracta d’una evolució que incorpora la capacitat d’administrar geometries vectorials senzilles.
Els seus principals punts favorables són la seva lleugeresa i simplicitat; al estar basat en el format JSON, és plenament consultable com a fitxer pla. A banda es pot considerar com un dels més utilitzats per a la creació d’aplicacions web.
En contra trobem que no està preparat per tractar geometries complexes i presenta limitacions a l’hora de fer-hi anàlisis espaials.
Com a resum, es pot dir que és el format més àgil per a l’intercanvi i la generació de web apps, sempre que es treballi amb geometries de poca complexitat.
Conclusions
Determinem que hi ha dos formats “guanyadors” totalment compatibles, amb aplicacions variables en funció del propòsit.
El Geopackage, per a treballar amb un fitxer compacte a l’hora que apte per a volums de dades importants i amb capacitat per a poder-hi executar anàlisis geoespaials.
El GeoJSON, per a l’intercanvi àgil, en l’ús en aplicacions web i allotjant dades sense gran complexitat. És exportable, convertible i llegible.
D’altra banda, podem concloure que, tot i la persistència de la seva popularitat, estem encarant la fi de l’era del Shapefile.
Tot i que en aquest article no n’hem parlat i el seu protagonisme a hores d’ara encara és relatiu, cal tenir en compte els mapes en 3D. Podem aventurar que, el creixent augment en el seu ús, marcarà l’evolució dels formats en els propers anys. En qualsevol cas, això ja ho deixem per un altre capítol.
Roger Conesa, arquitecte GIS