Eco-informática: Nuevas herramientas de informática en manos de los investigadores

Documento disponible en PDF aqui( ecoinformatica)

Progreso en las ciencias naturales y sociales depende críticamente en la capacidad de grupos de investigación de generar, conjuntar, sistematizar y analizar grandes cantidades de información. Datos fragmentados y desorganizados solamente pueden contestar preguntas limitadas. En la última década el internet ha revolucionado el modelo científico, facilitando el trabajo en conjunto de grupos formados de individuos distribuidos en distintas instituciones. Ejemplos de colaboraciones exitosas varían en escala entre iniciativas para secuenciar genomas [14] hasta proyectos de tésis con miembros del comité en diversas instituciones. Sin embargo, el conocimiento y uso de las herramientas informáticas no es consistente entre instituciones y líneas de investigación. La diferencia entre ellos en el acceso, conocimiento y habilidad en el uso de la tecnología abre lo que se ha llamado la división digital [15]. Institutos e investigadores que no aprovechan plenamente de la nueva tecnología sufren una reducción en su competitividad, reflejada en el número de publicaciones a nivel internacional.

La situación actual en Ecosur

Hay tres rubros en el uso de herramientas informáticas relevantes al trabajo en Ecosur. Bioinformática, Geoinformática y Servicios Bibliotecarios generales. Desde hace mas de un década Ecosur ha contado con un departamento de servicio en Geoinfomática en la forma del LAIGE. Todavía no se ha desarrollado formalmente un área de Bioinformática en la institución, aunque varios investigadores usan herramientas relacionadas al nivel de sus proyectos. La biblioteca (SIBE) ha mostrado un avance muy sólido proporcionando un rango amplio de nuevos servicios digitales a los investigadores. El uso del equipo de video-conferencia ha facilitado la comunicación entre unidades.

Entonces, es claro que Ecosur ha registrado avances continuos en el uso de herramientas informáticas. Sin embargo hay indicaciones preocupantes que este proceso ha sido mas lento que en otras instituciones. La cultura asociada con la rigidez de las reglas administrativas de una dependencia federal no siempre ha fomentado la adopción temprano de innovaciones tecnológicas. Múltiples investigadores han expresado su preocupación que la velocidad relativa de cambio se ha deteriorado rápidamente en los últimos dos años. Este proceso esta evidenciado por una creciente diferencia entre el nivel de sofisticación en el uso de herramientas informáticas por parte de organizaciones no gubernamentales locales y escuelas y lo que se registra en Ecosur. Esta contrasta con la expectativa general que una institución del tamaño de Ecosur cuenta con ventajas sustantivas en términos de recursos.

La tendencia al nivel global

Al nivel global, desde 2006, se ha registrado un incremento muy rápido en el uso de comunicación directa de voz y video por internet (Skype, Messenger, Ekiga etc), la producción y almacenamiento de fotos y vídeos digitales (You Tube, FlickR etc) y el uso de herramientas de análisis y plataformas de software libre (Linux, Apache, MySQL, PHP). La misma tecnología que proporciona plataformas para usos recreativos proporciona nuevas herramientas para la investigación, muchas veces a cero o bajo costo. Programas como GRASS, R y PostGIS son herramientas de investigación y análisis muy comparables en poder al software comercial ([8]). Imágenes de satélite de alta resolución están disponibles gratis en Google Earth. La construcción de un Wiki o Weblog puede aprovechar de software libre como WordPress. MediaWiki, Drupal o Joomla, Estos avances representan múltiples oportunidades nuevas no solamente para la divulgación de la información generada por proyectos de investigación, pero también para la actividad de investigación misma. En las universidades y centros de investigación Europeos el desarrollo de herramientas informáticas están siempre estrechamente integrados en la investigación. En contraste el departamento de informática de Ecosur ha concentrado su atención en el mantenimiento de la infraestructura de los servicios de comunicación. Esta actividad ha absorbido recursos sin generar productos de investigación tangibles. Hasta la fecha hay pocos ejemplos de colaboración técnica entre programadores del departamento de informática e investigadores. El departamento de informática no emplea personal con conocimiento técnico orientado hacia la investigación y no se ha realizado un análisis a fondo de las necesidades actuales de investigadores en términos de herramientas informáticas.

El concepto de Ecoinformática

La palabra que mejor describe las nuevas tendencias globales en el campo relevante a las actividades de investigadores de Ecosur es “Ecoinformática”. Se define como una nueva ciencia de la información en Ecología y ciencias ambientales con la meta de desarrollar y aplicar formas innovadoras para compartir y analizar información relevante a la conservación y manejo de sistemas ecológicos[16]. En el contexto de Ecosur se puede interpretar la Ecoinformática como la integración de bioinformática, geoinformática y la ciencia de la comunicación dentro de un marco consistente. Hay ejemplos del uso de herramientas de ecoinformática en diversos campos de investigación involucrando monitoreo, captura y almacenamiento de datos [2] [10][11][9]). El futuro de Ecoinformática esta estrechamente vinculado por el movimiento hacia la red semántica. Ecoinformática tiene que ser dinámica y con una visión a futuro.

La gran meta de las herramientas siendo desarrolladas y divulgadas para la web semántica es la integración de todo tipo de información en una forma consistente. Este objetivo complementa el enfoque interdisciplinario de Ecosur. Por ejemplo, un trabajo de tesis de un estudiante puede generar múltiples productos digitales. Estos productos incluyen vídeos y grabaciones de entrevistas, fotos digitales y datos de inventarios de la vegetación. En este momento el único producto entregado es la tesis. Esta queda en papel o pdf y la información interno es poco accesible. Un estudio que sigue los pasos en la misma zona o del mismo tema podría beneficiarse mas de la información y datos originales que la información parcial condensada y plasmada en el documento formal. Por ejemplo fotos y videos correctamente tomados y georefenciados están jugando un papel cada vez mas importante en la investigación ecológica ([1][3][2][12][13]). Software puede extraer información en una forma automatizada de colecciones de imágenes. Para lograr la meta de compartir diversas fuentes de información en una forma accesible se requiere conocimiento técnico a varios niveles. Los datos cuantitativos de estudiantes típicamente no cumplen con la normatividad para un base de datos relacional [6]. Fotos y videos están tomados sin georeferencias ni metadatos [5]. Estudiantes e investigadores pueden ignorar estándares internacionales. Aunque superficialmente el almacenamiento de información parece una actividad rutinaria, en realidad el manejo eficiente de archivos digitales requiere conocimiento sofisticado de programación (ej [4]). La existencia de un grupo de programadores con una preparación actualizada puede inyectar un nuevo dinamismo y nivel de eficiencia al nivel institucional.

El futuro

Este año se ha empezado la tarea de integrar la información geográfica con las colectas biológicas en una estructura uniforme proporcionado por una base de datos geográficamente explicita ([7]). Esta iniciativa aprovecha del nuevo poder y facilidad de uso de software libre. La institución se beneficiaría de una extensión de este proceso para asegurar la incorporación de múltiples fuentes de información en una estructura bien planeada y accesible tanto adentro como afuera de Ecosur. Este proceso actualmente esta limitado por la capacidad técnica institucional y la estructura y orientación del departamento de informática hacia el servicio de la administración. Se propone entonces una re-estructuración de los departamentos de servicio para favorecer la integración de la informática en la investigación.

Múltiples elementos deben estar contemplados antes de empezar este proceso. No se considera dentro del alcance de este documento proponer los detalles técnicos de tal reestructuración. Sin embargo se visualizan cambios estructurales en el LAIGE, las colecciones biológicas, la biblioteca y el departamento de informática para unificar esfuerzos y facilitar el intercambio de información y capacidad técnica. También sería necesario la contratación de personal adicional con conocimiento técnico actualizado bajo la dirección de personal académica con preparación formal en el área de informática.

Una visión de la estructura y actividades de un departamento de Ecoinformática

El concepto de ecoinfomática debe estar visto no como un paraguas a nivel administrativo pero como una realidad funcional estrechamente integrada con la investigación. Por ejemplo no deben existir servidores separados para la biblioteca, Laige, colecciones biológicas y paginas web. Toda la información en Ecosur debe estar mantenida en una sola estructura con la capacidad de almacenar terrabytes de información. Hace dos años el concepto sería ambicioso. Hoy en día el costo de espacio de almacenamiento es mínimo. La arquitectura para trabajar a esta escala esta establecida. Dado de que las características del servidor(es) proporciona la funcionalidad del sistema entero su configuración sería un trabajo vital para asegurar la plataforma sólida para todas las otras actividades de Ecoinformática. Es natural que el sistema estaría basado en Linux. Entonces hay la necesidad de contratar una persona con conocimiento técnico avanzado y amplia experiencia en la configuración y mantenimiento de servidores Linux. El experto puede configurar y mantener un rango de servicios usando el software libre integrado en los servidores de Linux (Firewall, servidor de email, paginas web, ftp, ssh, PHP, MySQL, PostGIS, mapserver etc). El costo de pagar por los servicios de un profesional con experiencia previamente comprobado en una institución de investigación de prestigio internacional estaría ampliamente recompensado con la reducción en los gastos actuales en licencias de software, especialmente porque la configuración de software propietario en uso actual ha causado problemas adicionales (especialmente Lotus Domino). Para seguridad y velocidad de acceso se montará servidores espejos (copias idénticas) en cada unidad.

La persona contratada de mantener el sistema naturalmente proporcionará capacitación a todo el grupo. Este representará un recurso humano importante. El aumento en la capacidad tecnológica local actúa para estimular el desarrollo regional. Ecosur puede ofrecer cursos sobre la configuración y uso de software libre para reducir el gasto de ONGs, escuelas e instituciones gubernamentales.

El mantenimiento de la conectividad física y redes de telecomunicación no debe estar a cargo del grupo de ecoinformática. Sería mejor tener un contrato transparente con un proveedor externo de servicios. Para asegurar que el servicio sea proporcionado a un costo competitivo hay que aprovechar al máximo el poder de negociación de una institución con el tamaño y prestigio de Ecosur. Los términos del contrato tienen que estar publicados bajo la ley de transparencia. Se puede pasar la responsabilidad de contratar y negociar los términos del servicio al personal administrativo. El futuro de la conectividad de las redes institucionales es en el uso de tecnología inalámbrica, la cual esta bajando en costo. Entonces sería necesario analizar el uso de la tecnología periódicamente para asegurar su actualización.

El trabajo principal de ecoinformática no sería simplemente la recompilación y mantenimiento de bases de datos. Mas bien sus actividades estarían unificadas alrededor del servidor donde se guarda y maneja la información.

  1. Grupo de servicios bibliotecarios. Este grupo aprovechará al máximo la experiencia exitosa previa del personal de SIBE. Se contempla una área activa de actualización en el uso de nuevas herramientas de acceso a la información usando extensiones del concepto de búsqueda de texto completo, traducciones automatizadas, material fotográfico, documentos históricos, bases de datos estadísticas etc.
  2. Grupo de Geoinformática. Este grupo extenderá el trabajo cartográfico del LAIGE hacia nuevos productos en línea. Se contempla la ampliación de herramientas como bases de datos espacialmente explicitas (por ejemplo PostGIS) y servidores de mapas. Se aprovecharán nuevas herramientas como Google Maps. La producción de herramientas novedosas, adaptados a las necesidades regionales, requiere conocimiento de programación en idiomas como SQL, Java y PHP.
  3. Grupo de Bioinformática. Este grupo sería responsable de mejorar las bases de datos de colecciones y potencialmente empezar de integrar mas información genética. Su trabajo estaría estrechamente vinculado con el grupo de Geoinformática dado de que preguntas ecológicas tratan de la abundancia y distribución de especies. Se buscarán formas innovadoras de presentar la información taxonómica en forma de claves interactivas y búsquedas de imágenes escaneadas y fotos en el campo por características morfológicas.
  4. Grupo de simulación y modelación. Dado la necesidad de emplear programadores de bases de datos sería natural integrar la actividad de modelación ecológica dentro del concepto de Ecoinformática. Investigadores con necesidades de programadores especializados para sus lineas podrían colaborar directamente con este grupo.
  5. Grupo de estadística y sistematización de datos. Este grupo colaborará con todos los otros grupos, pero también ofrecerá un servicio a los investigadores en el uso de bases de datos, asegurando que no se siga la tendencia actual de mantener datos en formas “Ad hoc” en violación de normas internacionales (por ejemplo hojas de cálculo de Excel). El grupo dará cursos en el uso de herramientas como ODBC y estadística avanzada. Mantendrá bases de datos sustantivos que requieren conocimiento avanzado en su manejo, como por ejemplo datos climatológicos de la zona.
  6. Grupo de comunicaciones y multi media. Este grupo investigará el uso de medios de comunicación dinámicos y visuales como la fotografía y video. Se proporcionará ayuda en la configuración y uso de herramientas de comunicación como video conferencias personales para actividades de investigación.

Una visión del uso de las herramientas de Ecoinformática

En 2010 un investigador joven en Sud Africa esta interesado en el efecto del cambio climático en el bosque seco de la depresión central de Chiapas. Ha leído un informe de un proyecto en la zona (Reforlan) y quiere investigar con mas detalle por su cuenta. Tiene un par de días para formular una hipótesis para plantar un proyecto nuevo. Su primera pregunta es “¿cual ha sido la tendencia en el clima en los últimos 50 años en la zona?”. Entra en el sistema de Ecoinformática de Ecosur. A través de un mapa interactivo consigue los datos históricos del clima en la zona y los análisis usando software estadístico integrado al sistema. Se notan tendencias ambiguas que podrían ser artefactos. Entonces busca publicaciones sobre la calidad de datos climáticos en Chiapas. Encuentra que efectivamente los datos oficiales pueden tener sesgos y errores y la tendencia a largo plazo todavía esta oculta dentro de una variabilidad asociada con el efecto del Niño. Luego se le ocurre que la vegetación misma puede mostrar la tendencia mejor. Busca todas las colectas de árboles de la zona y grafíca la proporción de colectas de especies caducifolias contra el tiempo. Tampoco encuentra una tendencia clara. Además el uso del bosque y la perturbación antropogénica podría influir mas que el cambio climático. Entonces el investigador visualiza los mapas de cambio en la cubertura boscosa en la zona. Hay poca evidencia de cambios recientes. Se cruza con mapas de incendios, pero se encuentra que los incendios son mas bien quemas de pastizales. Empieza a formular nuevas hipótesis sobre la historia del uso en la zona. Busca fotografías del bosque y paisaje en un mapa interactivo, corriendo un “tour” virtual de la zona. Se nota una dominancia de especies dispersadas por ganado. ¿Cuando empezó la ganadería en la zona?” Busca documentos históricos sobre el uso del suelo en el siglo XIX. Había un uso extensivo de los terrenos establecido ya en 1858. Pero ¿cuales han sido las tendencias después de la Revolución Mexicana? Encuentra una tesis escrita sobre el tema recientemente, pero no puede leerla en Español. Usa el servicio de traducción automatizado para extraer la información esencial del documento. Luego encuentra que el estudiante de maestría había entrevistado algunos habitantes mas viejos de la zona. Baja los videos, con sus subtítulos en Inglés (no perfectamente traducidos dado de que la transcripción fue automatizada, pero suficientemente bien para entender), y pasa un rato fascinado con los cuentos emocionantes del tiempo de los Mapaches. Luego se vuelve a concentrar en la tarea. Busca información sobre la dinámica de la vegetación bajo disturbio. Encuentra un modelo de simulación interactivo en el sitio y lo corre con diferentes escenarios. Finalmente decide sobre su estudio. “Calibración de modelos succesionales espacialmente explícitos usando datos históricos”. Baja las capas geográficas relevantes a su estudio a su laptop y produce mapas y figuras para respaldar su propuesta. Busca las direcciones actuales del estudiante y del investigador responsable para el modelo y les invita a participar en su proyecto. Los llama por video conferencia en línea para discutir la colaboración.

Referencias

[1] R. M. Bekker, E. van der Maarel, H. Bruelheide, and K. Woods. Long-term datasets: From descriptive to predictive data using ecoinformatics. Journal of Vegetation Science, 18(4):458–462, 2007.

[2] J. W. Brunt, P. McCartney, K. Baker, and S. G. Stafford. The future of ecoinformatics in long term ecological research. 6th World Multiconference on Systemics, Cybernetics and Informatics, Vol Vii, Proceedings, pages 367–372, 2002.

[3] M. A. Crimmins and T. M. Crimmins. Monitoring plant phenology using digital repeat photography. Environmental Management, 41(6):949–958, 2008.

[4] G. B. Curry and R. C. H. Connor. Automated extraction of data from text using an xml parser: An earth science example using fossil descriptions. Geosphere, 4:159–169, 2008.

[5] Duncan Golicher. Como georeferenciar fotos. https://duncanjg.wordpress.com/2008/08/31/como-georeferenciar-fotos-con-precision-sin-costo-ni-esfuerzo/.

[6] Duncan Golicher. Mantenimiento de datos. https://duncanjg.wordpress.com/2008/02/13/mantenimiento-de-datos/.

[7] Duncan Golicher. https://duncanjg.wordpress.com/2008/04/29/presentacion-de-postgis-en-ecosur/, 2008.

[8] Duncan J Golicher and Luis Cayuela. A methodology for flexible species distribution modelling within an open source framework: Technical report presented to the third international workshop on species distribution modelling: San cristobal de las casas, chiapas, mexico. Technical report, El Colegio de La Frontera Sur, Chiapas, Mexico, 2007.

[9] S. Kraines, R. Batres, M. Koyama, D. Wallace, and H. Komiyama. Internet-based integrated environmental assessment – using ontologies to share computational models. Journal of Industrial Ecology, 9(3):31–50, 2005.

[10] P. Mika, T. Elfring, and P. Groenewegen. Application of semantic technology for social network analysis in the sciences. Scientometrics, 68(1):3–27, 2006.

[11] J. D. Olden, N. L. Poff, and B. P. Bledsoe. Incorporating ecological knowledge into ecoinformatics: An example of modeling hierarchically structured aquatic communities with neural networks. Ecological Informatics, 1(1):33–42, 2006.

[12] V. Reif and R. Tornberg. Using time-lapse digital video recording for a nesting study of birds of prey. European Journal of Wildlife Research, 52(4):251–258, 2006.

[13] A. D. Richardson, J. P. Jenkins, B. H. Braswell, D. Y. Hollinger, S. V. Ollinger, and M. L. Smith. Use of digital webcam images to track spring green-up in a deciduous broadleaf forest. Oecologia, 152(2):323–334, 2007.

[14] M. Ridley. Won for all: How the drosophila genome was sequenced. Nature, 441(7090):153–153, 2006.

[15] Lisa Servon. Bridging the digital divide: Technology, community, and public policy. Malden, MA: Blackwell.

[16] Wikipedia. Ecoinformatics. http://en.wikipedia.org/wiki/Ecoinformatics, 2008.

Leave a comment