Appearance
Ingreso de datos espaciales
La creación de una base de datos geográficos (geodatos) es una operación compleja que involucra: adquisición de datos, verificación, estructuración y almacenamiento.
Adquisición de datos
Están disponibles datos geográficos crudos en muchas diferentes formas analógicas y digitales, por ejemplo: mapas, fotografías aéreas, imágenes de satélite, etc.
Una base de datos geográficos puede ser construida en múltiples formas:
- Adquirir datos en forma digital desde un proveedor de datos
- Digitalizar datos analógicos existentes
- Llevar a cabo una recolección de datos
- Interpolar desde observaciones puntuales hacia superficies continuas
En todos los casos los datos deben ser referenciados geométricamente a un sistema de coordenadas aceptado y codificados de forma que puedan ser almacenados en una estructura de base de datos.
Fuentes de datos geográficos
Entre las fuentes de datos geográficos se encuentran mapas en papel, fotografías aéreas, sensores remotos y recolección de datos.
Mapas en papel
El mapa en papel es la fuente de geodatos más común. Este es una representación gráfica de la distribución de los fenómenos geográficos. Los mapas son dibujados a cierta escala y muestran atributos de entidades mediante diferentes símbolos o colores. La localización de las entidades en la superficie de la tierra es especificada mediante un sistema de coordenadas.
Fotografías aéreas
Las fotografías aéreas son tomadas por sistemas ópticos montados en satélites o aviones. Existen al menos dos tipos: fotografías aéreas estereoscópicas y fotografías aéreas digitales.
Las fotografías aéreas estereoscópicas son pares de imágenes traslapadas que cuentan con muchas aplicaciones tales como creación de mapas topográficos, y creación de ortofotomapas.
Las fotografías aéreas estereoscopias proveen una gran fuente de datos para interpretación humana, determinación de cobertura del terreno, estudios de geología y tipos de vegetación.
Las fotografías aéreas digitales proveen datos sobre elevaciones de terreno y cobertura de la tierra directamente en forma digital sin requerir la conversión desde un documento en papel.
Sensores remotos
Un amplio rango de rastreadores montados en satélites o aviones proveen datos digitales directamente. Existen dos tipos de estos sistemas: receptores pasivos y receptores activos.
El primer tipo de sistemas son receptores pasivos de la radiación refleja por la superficie de la tierra. La cantidad de energía reflejada es registrada en múltiples rangos de onda. Esto incluye desde ondas térmicas hasta microondas del espectro electromagnético.
Los receptores pasivos reaccionan a diferentes niveles de absorción y reflectividad de los componentes de la superficie de la tierra. Esto provee información de patrones espaciales de diferente tipo.
En el caso del receptor activo este envía una señal que luego recibe cuando rebota contra algún objeto. Los sistemas activos incluyen rastreador de radar de banda lateral, rastreador de altimetría láser, y rastreadores de sonar (batimetría). Este tipo de sistemas proveen información sobre elevaciones y la densidad de los materiales en la superficie de la tierra o el fondo del océano.
Recolección de datos
El método tradicional de recolectar datos geográficos se realiza mediante un levantamiento en el campo de valores a partir de muestras que se toman en localizaciones conocidas. Esto incluye el uso de instrumentos para registrar información así como para realizar mediciones físicas o químicas.
El resultado de estos levantamientos son registrados en términos de una serie de localizaciones de puntos y valores de atributos en una tabla. Estos luego pueden ser interpolados para crear una superficie continua.
Hoy en día se utilizan dispositivos digitales de mano para grabar datos en intervalos de tiempo o cuando se les indica manualmente. Se pueden conectar con instrumentos de medición, o bien, con dispositivos GPS para obtener directamente la localización. También pueden descargar los datos directamente a una computadora.
Georeferenciación
Es muy importante que los datos geográficos están localizados con respecto a un marco común de referencia. Este marco de referencia consiste de un sistema de coordenadas geodésicas.
El sistema de coordenadas más común es el plano (coordenadas cartesianas ortogonales) orientadas convenientemente de norte a sur y de este a oeste. Sin embargo, como la tierra no es plana (sino ligeramente esférica) la longitud (o posición este-oeste) está relacionada con el meridiano de Greenwich y la latitud (o posición norte-sur) está relacionada con el paralelo del Ecuador. La longitud se mide desde 180 grados oeste hasta 180 grados este (-180 hasta 180) y la latitud se mide desde 90 grados sur hasta 90 grados norte (-90 hasta 90).
Proyecciones
Debido a que la tierra no es una esfera verdadera, sino que es ligeramente plana en los polos, los geodestas han definido diversos elipsoides para trasladar la verdadera superficie curva de la tierra en un plano. Los elipsoides más comunes son: Krasousky, Bessel, y Clarke 1880.
Existen tres formas principales de proyectar posiciones desde un elipsoide en una superficie plana, llamadas proyecciones cilíndricas, proyecciones azimutales (o polares), y proyecciones cónicas. La mejor proyección para utilizar depende de la posición en la superficie de la tierra, en general se ha determinado que las proyecciones cilíndricas son mejores para regiones en los trópicos, las proyecciones cónicas son mejores para latitudes moderadas, y las proyecciones azimutales para áreas polares.
La proyección general mas utilizada es la Mercator o UTM (Universal Transverse Mercator). Esta corresponde con una proyección cilíndrica modificada, y ha sido elegida como el estándar internacional para intercambio de datos digitales.
Georeferenciación de datos crudos
En la práctica, los levantamientos de campo son georeferenciados en muchas formas. Verificaciones en el terreno son necesarias para localizar fotografías aéreas e imágenes de satélite. Las fronteras de parcelas para sistemas catastrales son medidas con mucha precisión en el terreno utilizando teodolitos láser, también estos son usados para localizar infraestructura pública (carreteras, electricidad, cables telefónicos, gas, agua, y tuberías de alcantarillado).
Georeferenciación por GPS
Un dispositivo GPS es un instrumento capaz de definir su posición y altitud geográfica, a varios grados de precisión, en cualquier lugar en la tierra. Utiliza un algoritmo de triangulación tomando como base las posiciones de al menos tres satélites NAVSTAR GPS, los cuales son geoestacionarios.
Un dispositivo GPS en el terreno debe ser capaz de recibir señales de al menos tres de estos satélites que poseen detalles de sus órbitas y un reloj atómico que les permite conocer la hora a un nivel de precisión muy exacto.
La distancia de cada satélite al receptor son una función del largo de onda y su posición. Esto es suficiente para calcular la localización del receptor en latitud, longitud y altura. Los resultados son mostrados en el dispositivo GPS y pueden ser descargados a una computadora.
Las principales las limitaciones de los dispositivos GPS son la cantidad satélites a la vista, la obstrucción de la señal (por edificios o montañas) y la calidad del receptor GPS. Sin embargo, usando una estación base, en una posición bien conocida, se puede realizar un cálculo diferencial que mejora la precisión (+/- 1m).
Proveedores y recolectores de datos
Institutos nacionales, ministerios, organizaciones públicas y privadas, e investigadores individuales están involucrados en la recolección y diseminación de datos espaciales tanto en forma analógica como digital. Las instituciones gubernamentales son los principales recolectores, proveedores, y usuarios de información geográfica. De todos los datos que ellas recolectan entre un 60 % y 80 % pueden ser clasificados como geográficos.
Recolectores sistemáticos de datos
Tradicionalmente, las instituciones gubernamentales mantienen una recolección sistemática de datos geográficos. Muchos países tienen agencias cartográficas nacionales o regionales responsables de recolectar de forma sistemática datos sobre fenómenos tales como la naturaleza del terreno, recursos naturales, asentamientos humanos, e infraestructura.
Los datos que estas instituciones recolectan tienden a ser de propósito general y son empleados por un amplio rango de usuarios. Otros levantamientos son llevados a cabo por instituciones más especializadas que registran variables tales como: los propietarios de terrenos, patrones de empleo, geología, precipitación y temperatura, caudal hidrológico, y calidad del agua.
En muchos países los levantamientos catastrales y el registro de infraestructura pública, como una base de datos digital, se realiza de forma sistemática.
Proveedores de imágenes de satélite
Varias agencias internacionales y empresas privadas proveen imágenes de satélite en forma sistemática, a diferentes niveles de precisión, de cualquier región de la tierra. Los datos recibidos son almacenados en medio digital y puede ser provistos en dicho medio o mediante Internet. Estos datos son generalmente corregidos tanto geométricamente como radiométricamente, antes de su distribución.
Los principales problemas asociados con las imágenes de satélite son: su disponibilidad está limitada por factores tales como la cobertura de nubes, su costo, y la necesidad posteriormente de sistemas de procesamiento de imágenes que puedan reconocer información basada en entidades derivada desde dichas imágenes raster.
Proveedores de datos ad-hoc
Los datos recolectados por organizaciones comerciales tales como topógrafos privados, ingenieros civiles, investigadores de mercados, organizaciones políticas, o instituciones académicas son generalmente específicos de un proyecto determinado.
Ellos son recolectados con un propósito específico tal como investigación de mercados, estudios de minería, estudios de impacto ambiental, o un proyecto universitario. La escala del estudio y los métodos de observación usados, junto con la clasificación de los datos e interpretación, son aveces únicos al levantamiento, y por tanto son de un uso limitado en otras aplicaciones. Además, el acceso a este tipo de datos a veces es restringido debido a su interés comercial.
Proveedores de datos geográficos
Los proveedores de datos ofrecen o venden datos geográficos en una variedad de detalle, formatos, escalas y estructuras. Hasta recientemente, muchos datos geográficos eran provistos en forma analógica y este era uno de los mayores problemas para los usuarios de SIGs debido a que el esfuerzo, que ellos tenían que hacer para convertir mapas en papel a archivos digitales, era inmenso y aveces tan grande como hacer un levantamiento de área usando instrumentos contemporáneos.
En la última década, sin embargo, organizaciones gubernamentales y comerciales han reconocido el mercado potencial de los datos geográficos, y en algunos países al menos, tales datos pueden ser obtenidos fácilmente, aunque por un precio y con restricciones de derechos de autor. Por ello, es ahora posible obtener o comprar un amplio rango de datos geográficos digitales par aplicaciones naturales y socio-económicas.
Muchos datos digitales provistos por el gobierno son de naturaleza general (elevaciones, caminos, ciudades, ríos, etc.) para un amplio rango de usuarios, así que los esfuerzos de distribución son facilitados por un amplio mercado. De hecho, en los últimos años se ha estado discutiendo en muchos países con respecto al desarrollo de bases de datos geográficos integrados a nivel nacional, continental y global.
En paralelo con estos desarrollos en el sector público, organizaciones comerciales han iniciado el desarrollo de un conjunto de datos geográficos digitales para ayudar a llenar la demanda incremental por información. Los proveedores tienden a desarrollar productos de datos temáticos orientados a nichos de mercado tal como datos socio-económicos referenciados a códigos postales, rutas de transporte, o representaciones de elevaciones de terreno.
Creación de datos digitales
El ingreso manual de datos geográficos en un SIG involucra cuatro etapas principales: ingreso de datos geográficos; ingreso de datos de atributos; verificación y edición de datos geográficos y de atributos; y cuando es necesario, enlazar los datos geográficos a los datos de atributos.
Específicamente la captura y procesamiento de datos geográficos para construir una base de datos raster involucra: corrección de la orientación y distorsión de imágenes de satélite, fotografías aéreas o documentos rasterizados; digitalización de fronteras y rasterización desde mapas temáticos; interpolación de datos puntuales; y la integración de capas en una estructura raster.
Por su parte, la captura y procesamiento de datos geográficos para construir una base de datos vectorial involucra: corrección de la orientación y distorsión de imágenes de satélite, fotografías aéreas o documentos rasterizados; detección de bordes, clasificación y segmentación de imágenes; vectorización de líneas y fronteras de imágenes; digitalización de fronteras a sistemas de coordenadas desde mapas temáticos; interpolación de datos puntuales; generación de contornos o creación de TINs; y por último la integración de capas en una estructura vectorial.
Ingreso de datos geográficos
Con un modelo de entidades, los datos geográficos están en la forma de puntos, líneas, o áreas/pixeles que son definidos usando una serie de coordenadas. Estas coordenadas son obtenidas referenciando un sistema de referencia geográfica del mapa o fotografía aérea, o por traslape de una rejilla sobre ellos.
La forma más simple de ingresar datos es digitar las coordenadas en un archivo o programa de entrada en un SIG. El enorme trabajo de escribir manualmente las coordenadas y luego digitarlas en la computadora puede ser reducida usando dispositivos de hardware tales como digitalizadores, rastreadores (scanners), o estereotrazadores para codificar las coordenadas X y Y de los puntos deseados.
Digitalizadores
Un digitalizador es una tableta electrónica o electromagnética sobre la que un mapa o documento es puesto. Incrustado a la tableta, o localizado directamente bajo ella, existe un dispositivo sensor que puede localizar de forma precisa la posición de un dispositivo apuntador (cursor) que es usado para ubicar los datos puntuales del mapa.
El proceso de digitalización inicia con asegurar el mapa a capturar, a la superficie del digitalizador con cinta. Luego la tarea continua digitalizando al menos cuatro puntos de referencia que acotan la región del mapa. Estos actúan como un marco de referencia dentro del que todas las siguientes coordenadas son registradas. Estas coordenadas podrían ser ajustadas mediante escalamiento y traslación.
Las líneas pueden ser digitalizadas en formas formas: el método continuo y el método puntual. En el método continuo se arrastra el cursor a través de toda la línea y luego la computadora captura posiciones cada cierto de tiempo o distancia. En el método manual se ingresan puntos individuales discretos que aproximan la forma de la línea. Generalmente, se ingresan pocas coordenadas en secciones rectas de la línea y un número mayor de coordenadas en secciones curvas o complicadas.
El problema con el método continuo es que si el operador no trabaja a la velocidad esperada, demasiadas coordenadas serán grabadas. Además, se presentan grandes errores debido a que el operador tiene menos tiempo para posicionar el cursor en forma precisa.
Rasterización
La rasterización es el proceso de convertir datos vectoriales en una rejilla de pixeles. Esto involucra básicamente el colocar una rejilla sobre el mapa y luego codificar los pixeles de acuerdo a la ocurrencia o no del fenómeno espacial. Rutinas para realizar la rasterización son provistas por muchos SIGs.
Los rastreadores son dispositivos para convertir datos analógicos en imágenes digitales basadas en rejilla (pixeles). Se utilizan para capturar mapas, fotografías aéreas, e imágenes de satélite en papel. Se pueden aplicar filtros que mejoren la imagen capturada por ejemplo aplicando eliminación de ruido, resaltado de bordes, o aumento de contraste.
La imagen rastreada debe ser referenciada a la posición y escala correcta. Una forma de hacer esto es identificar en la imagen ciertos puntos conocidos. Posteriormente la posición geográfica exacta de dichos puntos es especificada. Un algoritmo de georectificación calcula la posición correcta de cada pixel (celda) de la imagen con base en las posiciones conocidas. Esto puede involucrar la rotación de la imagen, o el estirado.
Vectorización
La vectorización es el proceso de convertir arreglos de pixeles a datos vectoriales. Existen al menos tres métodos conocidos: método automático, método manual, y el método híbrido.
El proceso automático consiste en reconocer líneas entre los pixeles de una imagen rastreada utilizando lo que se conoce como algoritmos de adelgazamiento. Estos reducen las líneas pixeladas a un solo pixel de ancho. Luego estos son enlazados para formar unidades lineales utilizando algoritmos automáticos que rastrean y reúnen pixeles vecinos del mismo valor.
Generalmente al utilizar un método de vectorización automático, los datos resultantes requieren mucha edición para codificar las unidades individuales y corregir los errores en la conectividad de las líneas.
En el método manual se selecciona el inicio de la línea. Luego la computadora sigue la línea hasta que llega a una unión o regresa al inicio. El operador luego guía a la computadora al inicio de la siguiente línea y así el proceso continua. Cuando una línea es reconocida en forma incorrecta, el operador la puede borrar inmediatamente. Su gran desventaja es que requieren una gran cantidad de control por parte del usuario.
El método híbrido consiste de realizar la digitalización directamente en el despliegue utilizando la imagen raster como fondo. La geometría de las varias entidades es definida mediante la digitalización desde la pantalla usando un cursor controlado por el mouse. Este método se puede utilizar también con imágenes de satélite y fotografías aéreas. En general, es el método mas popular y económico pero requiere de grandes monitores y una buena cantidad de memoria en el computador.
Estereotrazador analítico
El estereotrazador analítico es un tipo de instrumento fotogramétrico usado para registrar los niveles y posiciones de terreno directamente desde fotografías aéreas estereoscópicas. Las imágenes son tomadas de la misma área pero en ángulos diferentes. Algunas técnicas utilizan imágenes de satélite para generar modelos de terreno.
Ingreso de datos no espaciales
Los datos no espaciales son aquellas propiedades de las entidades espaciales que necesitan ser manejadas por el SIG, pero que ellas mismas no son espaciales.
Aún cuando estos valores de atributos, y sus identificadores asociados, pueden ser agregados a las entidades gráficas directamente en la digitalización, no es eficiente ingresar gran cantidad de atributos complejos interactivamente. Los datos son entonces almacenados separadamente de la información geográfica en el caso de bases de datos relacionales, y son ingresados junto con descripciones geográficas en las bases de datos orientadas a objetos.
Los datos de atributos provienen de diferentes fuentes tales como registros en papel, hojas de cálculo, bases de datos existentes, etc. Ellos pueden ser ingresados en la base de datos del SIG directamente o pueden ser importados usando un formato estándar como TXT, CSV o ASCII.
Verificación de datos y edición
La mejor forma de verificar errores espaciales es imprimir el mapa en acetato, sobreponerlo al mapa original, compararlos visualmente, e identificar diferencias u omisiones. Algunos SIG muestran directamente, mediante codificación de color, cierto tipo de errores topológicos o de identificadores.
Los atributos no espaciales pueden ser verificados mediante la impresión de tablas de datos y su revisión visual. Un método mejor es revisar los archivos de datos con un programa de computadora y verificar errores tal como texto en lugar de números, números que exceden un rango, etc.
Tipos de errores en la captura
Los errores que se presentan durante la captura de datos geográficos se pueden agrupar en: datos geográficos incompletos o duplicados, datos geográficos en ubicaciones incorrectas, datos geográficos definidos con muchos pares de coordenadas, datos geográficos en una escala incorrecta, y datos geográficos distorsionados.
La incompletitud de datos geográficos se debe a omisiones en el ingreso de puntos, líneas o celdas de datos ingresados manualmente. En datos rastreados las omisiones se presentan en la forma de separaciones entre líneas donde la conversión raster-vector a fallado. También, la digitalización de líneas puede ser realizada en forma duplicada.
La ubicación incorrecta de datos geográficos puede ir desde errores de ubicación menores hasta errores geográficos mayores. Los primeros son generalmente el resultado de digitalización descuidada; y los segundos son debido a cambios de escala u origen originados por problemas de software o hardware.
Como resultado de los procesos de vectorización o de digitalización las líneas pueden ser almacenadas en la base de datos utilizando demasiados puntos. Esto requiere una cantidad grande de espacio de almacenamiento y provoca ineficiencia en el procesos posteriores de despliegue y análisis espacial.
Si todos los datos están a una escala incorrecta esto se debe a que la digitalización fue hecha a una escala incorrecta. Con datos rasterizados los problemas generalmente se deben a que el proceso de georeferenciación se realizó con valores incorrectos.
Los datos geográficos pueden estar distorsionados porque los mapas base no estaban a la escala correcta. Muchas fotografías aéreas no están a escala y sufren deformaciones debido a la distancia de los objetos en diferentes partes del terreno. Todos los mapas en papel sufren de distorsión generalmente más en una dirección que en otra. También, la transformación de coordenadas puede ser necesaria para solucionar los problemas de distorsión.
Enlace de datos espaciales y no espaciales
El enlace de datos espaciales y no espaciales se realiza mediante identificadores que son comunes en ambas representaciones. Los identificadores de puntos y líneas son generados automáticamente o son agregados manualmente durante el proceso de digitalización o vectorización.
Los identificadores de polígonos son agregados después del proceso de generación de topología. Una vez que los polígonos han sido formados se les puede un identificador único en forma interactiva. Otra técnica usa la operación de punto en polígono para transferir el identificador de puntos ya digitalizados o entidades de texto al polígono que las contiene.
La operación de enlace de datos brinda una oportunidad ideal para verificar la calidad de tanto los datos espaciales como los no espaciales. Cada entidad gráfica debe recibir un único conjunto de atributos no espaciales, y no deben resultar atributos sin una entidad gráfica asignada. Los enlaces incorrectos son usualmente el resultado de códigos de identificación incorrectos al realizar la digitalización o bien en el proceso de generación de topología.
Ejercicios
- Explique detalladamente en qué consiste una fotografía aérea estereoscópica e indique que ventajas presenta sobre una fotografía aérea sencilla.
- Describa en forma detallada en qué consisten los dispositivos de sensores remotos, y explique la diferencia entre sensores pasivos y sensores activos.
- Explique en forma detallada en que consisten las proyecciones cartográficas e indique cuál tipo de proyección resulta más conveniente para representar las siguientes latitudes de la tierra: (a) trópicos, (b) latitudes intermedias, y (c) zonas polares.
- Explique en forma detallada el método mediante el cuál un dispositivo GPS establece su posición sobre la superficie de la tierra. Además, señale dos limitaciones que presenta esta tecnología.
- Señale y describa en forma detallada cuáles son los principales problemas asociados a la adquisición y utilización de imágenes de satélite.
- Indique y describa detalladamente dos ejemplos del tipo de datos geográficos que son recolectados y provistos por organismos del sector público; y dos ejemplos de datos geográficos ofrecidos por el sector privado.
- Describa detalladamente los métodos (continuo y puntual) de digitalización de datos geográficos. Además, señale cuáles desventajas presenta el método continuo sobre el método puntual.
- Describa en forma detallada los métodos (automático, manual e híbrido) para realizar la vectorización de datos geográficos. Además, señale cuáles limitaciones presenta cada uno de estos métodos.
- Señale y describa en forma detallada al menos cuatro tipos de errores que ocurren comúnmente en la captura de datos geográficos, y explique a que factores obedecen.
- Explique detalladamente dos técnicas diferentes para realizar la identificación de polígonos en la etapa de enlace de datos espaciales y no espaciales.