Duncan Golicher’s weblog

Research, scripts and life in Chiapas

Archive for September 2008

Accidente 2: El valor de la verdad en Chiapas.

with one comment

Ayer perdí todo el día de trabajo en el Ministerio Público y la Delegación de Tránsito “arreglando” el asunto del accidente de Adriana.

Dado el hecho de que el ajustador del seguro  Homero Trujillo parecía tener mas simpatía con el grupo de taxistas que con sus clientes, contactamos a la agencia de seguros para retirarlo de caso y mandaron una abogada de Tuxtla para intervenir en su lugar.

Decidimos que haríamos todo lo posible por evitar procedamientos largos en el Ministerio Público, con la exepción claro, de nunca mentir sobre la causa del accidente. Los hechos ocurrieron exactamente como mostrado en la maqueta y había varios testigos del evento.

Al final la Licenciada Ferrara  resultó muy profesional y ademas agradable. Ella entedió nuestra posición, pero también entendía bien las reglas del juego en SCLC. Logramos un arreglo en el cual aceptamos que nuestra aseguradora  pagaría el daño al taxista pero sin aceptar reponsabilidad por causar el accidente.

Para liberar el coche de corralón yo tenía que ir a la Delegación de Tránsito. Fue allí que las cosas empezaban a complicarse de neuvo. El Sub-director de tránsito insitió que teníamos que pagar una infracción por haber causado el accidente. Esta insistencia fue en contra de nuestra decisión de respetar siempre los hechos. Discutí el asunto, explicando que Adriana no me ha contado una mentira en todo el tiempo que la conozco y no creo que ella ha cambiado de su costumbre. El señor insistió que su agente había hecho un periitaje correcto, y los “hechos” contados por el taxista eran verificables. De acuerdo de este versión no había un tercer coche en el accidente, Adriana había cometido una imprudencia “impidiendo el tránsito” y que si había testígos padres del Pequeño Sol, esos no valían, pues son todos iguales.

Hay ciertos limites a mi capacidad de denegrarme para tener la vida facil. Claramente no estaba dispuesto de aceptar ese dictamen, asi que parecía que estabamos condenados a regresar al Ministerio Público. Pero en el último momento salió a la luz otro detalle. La licencia de conducir de Adriana estaba vencida. Esto ocurrió porque nunca hay material para renovar licencias en SCLC.  La oficina de transito aparentemente acaba de recibirlo pero hay que hacer cita, La fecha mas cercana es a mediados de noviembre. Mi esposa estaba esperando todavia la cita. Pero el hecho de que su licencia estaba vencida era un hecho verdadero. Asi que yo dije al Subdirector que estaba dispuesto de pagar la infracción si dejaba de acusar a  mi esposa de haber causado el accidente. Todos felices. Aparte del detalle que el taxista, un hombre irresponsable y un peligro para otros conductores y pasajeros, salió completemente sin culpa del asunto.

Written by Duncan Golicher

September 27, 2008 at 5:37 pm

¿Software libre para el UNICH?

with one comment

La Universidad Intercultural de Chiapas es una institución nueva en San Cristóbal con la misión  de proporcionar mas oportunidades de educación superior de calidad a los jóvenes de la zona. El término “intercultural” viene del reconocimiento que la zona de los Altos de Chiapas esta compuesta de diversos grupos étnicos.

La UNICH recientemente me contactó para ayudar a analizar una propuesta para un laboratorio de información geográfica. El presupuesto inicial fue de 809,000 pesos. Una parte sustancial de este gasto (135,000 pesos) estaba en el rubro de Software. No estaba bien calculado, dado de que la intención fue comprar solamente una licencia para cada elemento. Este corría el riego de uno de dos resultados. 1) El uso muy restingido del laboratorio. 2) La tentación de usar software sin haber pagado correctamente por los derechos. Hoy en día herramientas geográficas deben estar puesto a la disposición de todos, particularmente los jóvenes procedentes del ámbito rural alrededor de San Cristóbal.

Hoy escribí una nueva propuesta para el laboratorio basado en el uso de Software libre. Esta disponible haciendo clic abajo.

unich

Written by Duncan Golicher

September 27, 2008 at 3:13 pm

Como hacer un gif animado en Linux

with 4 comments

Curiosamente algunos personas ya me preguntaron no solamente sobre el acontecimiento de ayer,

http://duncanjg.wordpress.com/2008/09/25/accidente-en-el-cruce-del-pequeno-sol/

Tambien querian saber como hice la maqueta! Es muy facil y rapido en Linux.

Instalas imagemagick

sudo apt-get install imagemagick

Pon las fotos que quieres convirtir un directorio. Cambia a este directorio. Las fotos  deben estar numerado  en el orden  que quieres. En el caso de mi camera son de *.JPG

Este linea luego produce el gif.

convert -geometry 400 -delay 100 -loop 0 *.JPG choque3.gif

Cambia el 400 si quieres un imagen mas grande o mas pequeño y el 100 (microsegundos) de pausa entre cada uno.

Muy facil. Ademas mucho mas rapido que entrando en un programa que te pide importar y exportar las fotos y arreglarlos en pantalla. En este caso nada mas tenia que abir dos de las fotos antes en Gimp para añadir las luces de la camioneta.

Aqui hay un imagen mas alegre usando este comando.

Accidente en el cruce del pequeño sol

with 2 comments

(El siguiente episodio esta disponible aqui http://duncanjg.wordpress.com/2008/09/27/accidente-2-el-valor-de-la-verdad-en-chiapas/)

Hoy nuestra famila sufrió un evento muy estresante. Adriana esta involucrada en un accidente de tránsito en el  cruce del Pequeño Sol.

Afortunadamente el choque por si fue relativamente leve. Ni Adriana ni Mickey estaban lesionados. Hasta el daño al coche no fue tan severo. Pero desgraciadamente la forma en la cual el policía de tránsito y el representante del agencia de seguros manejaron el asunto ha dejado mucho daño psicológico.

Adriana estaba parada en el crucero esperando que una camioneta diera vuelta en frente de ella a la izquierda. El conductor de la camioneta dio señales con sus faros para dar  prioridad a Adriana de dar vuelta a su propia izquierda. Adriana no estaba convencida y no se movió. El conductor dio el señal una segunda vez. Entonces ella empezaba a cruzar. En este momento un taxi  atrás de la camioneta se desesperó y aceleró  a toda velocidad rebasando ilegalmente por el lado derecho de la camioneta. El taxi (con matrícula 31-68- BHC y calcomanía del alien)  embistió el auto de Adriana. Había múltiples testigos del accidente. Todos conicidieron exactamente con la versión mostrada en la animación en esta página. No había  duda sobre lo que pasó y tampoco había ninguna otra explicación viable al accidente. Desafortunadamente el conductor de la camioneta se fue,  evidentemente no quería involucrarse. Estamos buscandolo para ayudar en aclarar los acontecimientos a los autoridades. El oficial de transito niega aceptar la existencia del tercer vehiculo dado de que no estaba presente cuando el llego.

El taxista claramente había actuado en una forma muy imprudente y peligrosa, dejando que su impaciencia dominaba todo sentido común. Adriana no podía ver el taxi por el tamaño de la camioneta. Además ella estaba señalando que daba vuelta a la izquierda. El taxista ni la vió.

Al principio el evento parecía un poco triste y frustrante pero fácil de resolver. El coche estaba asegurado y además Adriana no tenía la culpa. Sin embargo se complicó mucho al llegar el policía de tránsito, el agente de seguros y un montón de compañeros del taxista. Mientras Adriana todavía estaba en estado de shock ellos hablaron entre sí. Dijeron que Adriana había causado un accidente por “impedir el tránsito libre”. Al final no daban otra alternativa a Adriana mas que firmar un papel en el cual ella se responsabilizaba del evento y en el cual ella solo estipuló:  -acepto la “parte de responsabilidad” que me corresponde.

El último daño a nuestra tranquilidad pasó a las cinco de la tarde. Ya Adriana estaba tan estresada  que no podía enfrentar la situción mas. Yo fui a una reuníon en la delegación de tránsito con el represesntante de seguros Tepayac, un tal señor  Homero Trujillo.

Explique mi inquietud sobre la forma que mi esposa había sentido forzada de aceptar responsiblidad por un accidente que ella no causó, en contra del interés de su propia compañía de seguros de evitar pagos innecesarios. El me explicó claramente que no había alternativa aparte de pasar dos meses sin coche esperando un dictámen legal del Ministerio Público, el cual seguramente ibamos a perder por el poder político del dueño del taxi como líder del cooparativo.

Lo curioso es que a pesar de la rabia que sentia acepté los argumentos por pragmatismo. Dije al Sr. Trujillo que firmaré culaquier papel para que no se alarga el asunto. Necesitamos el coche. Al entrar en un proceso legal se puede retener en el corralon durante varios meses. Pero el Sr. Trujillo claramente ya tenía otra agenda distinta. Salió a llamar por celular al dueño del taxi. Cuando llegaron los taxistas ya no estaban dispuestos de hacer nungún trato. El señor Trujillo  dijo que nosotros no debemos  preocuparnos sobre el costo del proceso legal largo que se estaba empezando, la compañía Tepeyac pagará todos los gastos asociado con los procedimientos legales. Pero no tendríamos el coche durante meses y tendríamos que pasar varios dias de cada semana esperando turno en el ministerio.

Si yo fuera accionista en la compañía Tepeyac estaría cuestionando mucho esta forma de operación. Una compañía de seguros tiene la obligación de no aceptar un pago innecesario. El taxista no estaba asegurado, asi que para nosotros sería mas difícil recuparar el daño al coche si estabamos esperando el pago por parte del dueño del taxi. Pero estariamos dispuesto de aceptar este riesgo si la taxista nos da la razón. El causo el accidente, no fue Adriana. La retención del coche en el corralón (500 pesos por día) nos cuesta mucho mas en tiempo perdido y obviamante mucho mas a  la misma compañía de seguros. ¿Cuales intereses realmente representa Sr Trujillo?¿Los avogados, la compania Tepayac, o otros?





x

Written by Duncan Golicher

September 25, 2008 at 11:40 pm

Graficos malos en ecologia

leave a comment »

Acabo de ver una pagina interesante del departamento de Estadistica de Vanderbilt University. Aparentemente el departamento tiene la politica de prohibir el uso de untipo de grafico que sigue siendo injustamente  popular en Ecologia, los “dynamite plots”. Una vez un arbitro me regaño por haber usado un grafico de barras de este tipo. Tenia mucha razón. Son malos.

Entonces, llevo varios años diciendo a los estudiantes que odio estos graficos. Normalmente un boxplot o dotplot es mejor. Al mismo tiempo  llevo años escuchando la respuesta por parte de otros tutores de que  boxplots son “meramente descriptivos”. Hay que publicar graficos de barras con “intervalos de confianza”, aun cuando los intervalos de confianza son engañosos y mal fundamentado porque los arbitros prefieran este tipo de grafico.

Yo por mi parte simplemente quiero ver los datos, no los supuestos.

Good Statistical Practice

General

Graphics

At a department meeting on 18Oct06, statisticians in the department voted in favor of the following policy:

  • In a small dataset (e.g., < 15 observations per category) it is mandatory to show the raw data in a graphic in a publication, and this cannot be done with dynamite plots (bar charts with error bars). Example

The vote was 22 in favor, 3 against. All 3 against would be in favor if “mandatory” were replaced with “usually”. Therefore the following is department policy:

  • Dynamite plots often hide important information. This is particularly true of small or skewed data sets. Researchers are highly discouraged from using them, and department members have the option to decline participation in papers in which the lead author requires the use of these plots.

Written by Duncan Golicher

September 23, 2008 at 6:02 pm

Simplest possible clean PostGIS install in Ubuntu Heron

with 2 comments

If these instructions are followed carefully with Ubuntu Heron, at the time of writing, you will get PostGIS running with QGIS in a few minutes.

These instructions are now out of date.

Use these to install in the latest version of Ubuntu

http://duncanjg.wordpress.com/2011/09/24/installing-postgis-in-ubuntu-natty/

First place the following in your sources list either using synaptics or pasting the line at the bottom of  /etc/apt/sources.list  (sudo gedit /etc/apt/sources.list)

deb http://ppa.launchpad.net/qgis/ubuntu hardy main

Then

sudo apt-get update
sudo apt-get install qgis
sudo apt-get install postgresql-8.3
sudo apt-get install postgis
sudo apt-get install postgresql-8.3-postgis
sudo apt-get install pgadmin3

One small step that is necessary is to change the user password for postgres within the database as for some reason after installing PostGIS it is no longer the default value “postgres” (Although the linux password for postgres is) . You can do this with psql. Care needed here. This has to be done correctly. The following line gets you into psql.

sudo -u postgres psql -d template1

Type this (being very careful with quotation marks and the semicolon).

alter user postgres with password ‘postgres’;

If successul you get a message saying ALTER ROLE (If there is any problem here then retype the single quotation marks to make sure they are simple. WordPress keeps changing them for some reason if they are not in an HTML box).

Then exit psql with \q or control d

Now create a database

sudo -u postgres createdb gisdb

Download a small test database with the countries of the word from this site with wget. Again the file  is disguised as a word doc in order to go into the wordpress site.

wget http://duncanjg.files.wordpress.com/2008/09/paises.doc

Restore this database.

sudo -u postgres psql gisdb<paises.doc

Now run qgis and connect to your new PostGIS data base.

You can then experiment importing shapefiles into the database using the graphical plugin “SPIT” and looking at the structure of the database using pgadmin.

The trial database with a single countries of the world table can also be downloaded without wget by clicking here.

paises

Written by Duncan Golicher

September 22, 2008 at 5:06 pm

Categoria “Ecosur” en este Weblog

leave a comment »

No fue mi intención usar este sitio para hacer comentarios asociado con Ecosur, donde trabajo. Estos comunicaciónes deben estar limitado a miembros de la propia institución.

Empecé el weblog en febrero con el proposito de tener un sitio donde puede compartir pensamientos sueltos, ideas, opiniónes y incluso experiencias de la familia con otros conocidos sin tener que copiar emails a todos. WordPress te da la opción de abrir el sitio al publico, y dado de que no hay nada en el que me causa verguenza, asi lo hice. Actualmente el weblog recibe alrededor de 100 visitas por dia de desconocidos, muchos buscando información tecnico de R y PostGIS.

Esperaba que ya por estas fechas Ecosur ofreceriá un espacio propio a cada investigador, no solamente para textos y fotos, pero tambien para datos y videos. Se requiere alrededor de 10 GB por investigador, configurado con Apache, PHP, MySQL (lo tipico) ofreciendo hosting para Drupal, Joomla, phpesp (para encuestas .. no debo tener que usar SurveyMonkey) etc. ¿Se puede tener? Claro que si. O se usa un servidor propia bien conectado al Internet o se contrat el servicio externo. No tiene que ser muy caro. El costo en el mercado sería alrededor de $5 US por mes por investigador. Pero no se ha percibido la necesidad.

Asi que sigo usando el servidor de WordPress porque es gratis y sencillo. Pero no he firmado nungún acuerdo con Ecosur sobre su uso. Este no es realmente correcto, y estoy muy conciente del hecho. Estoy dispuesto de borrar toda las paginas que he puesto en la categoria Ecosur si recibo una comunicación al respeto.

Written by Duncan Golicher

September 19, 2008 at 8:11 am

Posted in Ecosur

Texto de un email escrito al departamento de informatica 5 de noviembre 2007

leave a comment »

El mensaje abajo fue escrito el 5 de noviembre 2007. Hace casi un año. Me gustaría tener la posibildad de compartir algunos de las comunicaciones previas y la contestación por parte de Informatica, pero hay que respetar el hecho de que las comunicaciones son confidenciales. No veo problema en publicar mis propias palabras.

En este epoca estaba tratando de clasificar imagenes en mi oficina y no podia mover la información. Tenia dinero para comprar mas anchura de banda para el proyecto. Pero me negaron permiso de contratarlo. La consecuencia fue el entorpecimiento del proyecto.

No fue mi intención de publicar este detalle nunca. Pero lo que me estimuló a actuar publicamente es que finalmente vinieron a mi oficina hace dos semanas para instalar Infinitum. Ya habia cerrado el proyecto y habia devuelto el dinero para telecomunicacions a Conservation International sin gastarlo. Aparentemente nunca existia una regla prohibiendo un contrato. Ademas, como evidenciado en la encuesta, estudiantes con laptos lleno de  programas piratas y virus sigue contaminando la red institucional.

Estimada Ceci,

Por este medio reitero con urgencia, y con un sensación de creciente desesperación, la petición de información escrita sobre las razones del rechazo de mi petición de solucionar los problemas de conectividad en el edificio E con el uso de recursos externos contratando un servicio de internet independiente a la red institucional.

De nuevo repito que he pedido ya en mas de cuatro ocasiones la explicación para el rechazo de este petición basado en las normas institucionales o en los detalles de los contratos firmados entre Ecosur y la compania privada que proporciona el servicio de telecomunicaciónes. No he recibido este información por escrito. Información escrita es imprescindible para permitir un análisis detallada y debidamente documentado, lo cual me comprometo a hacer al recibir la información para cerrar estos comunicaciones infructíferos.

La razón de insistir otra vez es sencilla. La falta de conectividad esta afectando tan negativamente mis capacidades de realizar los labores cotidianos desde la oficina que estoy seriamente considerando la opción de trabajar siempre desde la casa. Este dia de asueto sentí que he logrado aumentar mi productividad por un factor de cinco, resolviendo asuntos pendientes rápidamente desde mi casa donde cuento con muy buen servicio de internet comercial. La diferencia era asombrosa.

También insisto que ustedes analizan mi sugerencia complementario de prohibir la entrada de cualquier laptop, equipo externo o PC que recibe USBs en la red institucional.

Al caso de estar en desacuerdo, creo que merezco un escrito formal estipulando las razones de rechazar esta ultima sugerencia. A mi juicio es sumamente necesario evitar que haya equipos de computo que entran en la red institucional (no en el internet, lo cual es otra cosa) que cuentan con derechos de administrador independientes. La razón es la seguridad. He registrado dos casos recientes de virus destructivo. Aunque estos solamente afectan equipos corriendo Windows, me preocupan el efecto que pueden tener en los equipos de mis compañeros. Muchos todavía corren Windows XP, lo cual es menos seguro que Vista (claro, ya no voy a mencionar mi alternativa preferida en el campo de sistemas operativas)

Entonces insisto en la prohibición absoluta que laptops de estudiantes forman parte de la red institucional. Al mismo tiempo lo considero absolutamente necesario que se permite que equipos de estudiantes y visitantes a la institución navegan el internet libremente bajo su propio riesgo con equipos propios físicamente dentro la institución usando una conexión que no forma parte de la red institucional, como he sugerido antes.

He consultado con varios amigos profesionales en informática en el Reino Unido. El consensos de todos es resumido en dos palabras sencillos en ingles. Son espantosos. Me impactaron. Me han dicho que estamos permitiendo el “enemy within”.

Los amigos Británicos opinan que actualmente estamos “patas arriba”. Me gustaría recibir la opinión de Abraham Mena sobre este comentario. Respeto mucho su conocimiento detallada y técnicamente fundamentado en asuntos de seguridad.
Explico los consejos brevemente. El consenso que he recibido es que nunca será factible bloquear los que tienen IPS ya adentro de la red, hay que bloquear los que están afuera, y por supuesto tratar las maquinas de estudiantes como los visitantes cualquiera, suponiendo que la mayoría son muy irresponsables y portadores de virus etc etc etc. Asi que deben entrar por el portal común, lo cual se puede controlar. Al mismo tiempo hay que respetar el hecho que los estudiantes dependen el los recursos académicos proporcionado por el internet para hacer su trabajo y darles acceso libre al internet. El hecho que ellos llegan ya todos con sus propios equipos ahorra mucho dinero al institución. Hay que respetar esta inversión y incluso estimularlo mas.

Lo claro es que es mucho mas fácil bloquear la entrada de sus IPs desde afuera donde forman parte del internet libre que tratar de bloquear todo el trafico que sale y entra. Así se puede administrar el Firewall o el servidor proxy con mucha calma y sin problemas mayores. Incluso puedes ser mucho mas estricto con los equipos ya adentro evitando el jaqueo de recursos con privilegios determinado por IP como los de la biblioteca.

Claro, hay que comprar un poco mas anchura de banda para asegurar los tomas de internet para todos, pero este es muy barato en el mercado libre (800 pesos por mes por ~2MB .. ¿o es que nosotros en Ecosur no podemos conseguir este precio por reglas de Telmex?).

El arreglo inverso es siempre incomodo, conflictivo, impopular, innecesario y no sostenible en una institución académica. Hay demasiado excepciones a cualquier regla que tratas de implementar.

Reitero. El único cambio necesario es lo que surgiere. Da a los estudiantes (y en el proceso porque no nos incluimos nosotros en el edificio E) una, o mas, tomas de internet inalambricos separados de la red institucional, como si fueron en un cybercafe. Al mismo tiempo regulariza muy bien y mucho mas estrictamente el uso de los recursos institucionales quitando todos los programas piratas etc etc etc y evitando la instalación de software no autorizado por completo.

¿Es una idea tan loca y poca convencional? Entonces por que es considerado tan obvio y de tanto sentido común por todos los que he consultado al respeto. Adémas, si TelMex no nos ofrece precios mas caros que los usuarios domésticos no representa un costó adicional. Al revés, nos ahorra un chorro.

Saludos,

Duncan

Written by Duncan Golicher

September 19, 2008 at 7:09 am

Posted in Ecosur, Uncategorized

Rationality and fisheries

leave a comment »

Politics can only fly in the face of rational scientific evaluation for so long. I have followed the debate on North Sea fisheries since my undergraduate times in Edinburgh. There was some optimism that progress would be rapid at the end of the nineties. However the narrowness of the political agenda seems to have prevented any common sense from being exercised and a policy review in 2002 was not comprehensive.

Biologists and fishery scientists cannot be expected to take into account all the social implications when advising governments. At the same time, short sighted policies aimed at placating a local electorate over a short political horizon are no way to ensure sustainability.

Previous policies have led to large amounts of scarce edible fish of reproductive age being dumped back into the sea dead, against all logic.  Yet the basic premise of EU policy, that fish stocks have to be regulated at a transnational level, have always  been sound. This is quite paradoxical.

So I was encouraged to read of  what seems, on the face of it, to real be signs of a serious movement  towards a fisheries policy based on science and common sense. What took so long?

http://news.bbc.co.uk/2/hi/europe/7621618.stm

The relevance of fisheries for a forest ecologist is that both have a tendency to suffer from the tragedy of the commons. I found this follow up on the BBC regarding individual transferable quotas extremely interesting

http://news.bbc.co.uk/2/hi/science/nature/7623341.stm

Written by Duncan Golicher

September 17, 2008 at 11:13 pm

Resultados de la encuesta 2

with 3 comments

A las 18:00 de la tarde el día 17 de septiembre ya habia recibido 112 respuestas a la encuesta.  Cerre la encuesta un par de horas mas tarde (20.00) para evitar mas distracciones del trabajo. Hay un pdf con los resultados disponible aqui.

surveysummary_09192008

Debajo trato de mostrar rápidamente una parte critica de los resultados divididos por Unidad y categoría. Una gran parte (71) de San Cristóbal. Siempre es un reto presentar datos categóricos en una forma  entendible para una audencia general, sin distorciones. Gráficos de pastel son las peores figuras inventadas, pero por alguna razón son muy populares. Gráficos de mosaico son mucho mejores, pero son relativamente poco usados asi que hay que explicar sus caracteristicas.

Un gráfico de mosaico es una forma de visualizar una tabla de contingencia. No son complicados. Piensa  en el problema de la encuesta de Ecosur. Hay cinco unidades. Varían mucho en tamaño. Una muestra como esta encuesta refleja la población subyacente. Entonces no todas las Unidades deben pesar igual. En la última parte de la encuesta los participantes estaban invitados a expresar su opinión en una escala de 1-4. Hay una diferencia grande entre una calificación de 2 (por debajo de la mitad) y un 3 (por encima de la mitad). Al mismo tiempo la decisión es subjetiva y debe respetar el hecho de que se puede escoger entre cuatro categorias ordenales. No hay un valor absoluto, asi que tomar un promedio no tiene sentido.

Un gráfico de mosaico respeta el peso de cada parte de una muestra, dividiendolo en una forma proporcional a su tamaño. Asi que la figura abajo muestra la proporción de satisfacción (arriba desatisfecha, abajo satisfecha) con la conectividad del Internet en cada Unidad. La anchura de la barra es la proporción en cada Unidad. La altura es la proporción en cada categoría (1-4).

Grafico de mosaico mostrando el grado de satisfacción con la conectividad del Internet en las cuatro unidades. Roja oscura =mala,roja=regular,verde=aceptable,verde oscura=bien

Gráfico de mosaico mostrando el grado de satisfacción con la conectividad del Internet en las cuatro Unidades. Rojo obscuro =mala,rojo=regular,verde=aceptable,verde obscuro=bien

Muestra un detalle interesante. El problema de conectividad al Internet, algo que que ha evitado múltiples labores productivas de investigación en la Unidad San Cristobal durante el último año, no es tan evidente en la unidad de Tapachula, pero al mismo tiempo afecta una gran proporción de la muestra entera dado el peso de SCLC.

En contraste la buena opinión sobre la biblioteca es compartida entre Unidades, aunque con muestras de problemas en San Cristóbal. En este caso, como me han comunicado muchas personas hoy, las bases de datos de la biblioteca si se ven muy bien, pero puede tardan horas en bajar los documentos de texto completos de los servidores externos que tienen los textos en la unidad de SCLC. Las frustraciones asociadas con la pésima conectividad en este Unidad ha afectado injustamente la imágen del SIBE en San Cristóbal. La conectividad a servidores externos es reponsibilidad de informatica, no SIBE.

Esta problema ha sido aparente por mucho tiempo, pero sigue sin solución definativa. (Ver este mensaje madado en noviembre del año pasado http://duncanjg.wordpress.com/2008/09/19/conectividad-en-scl/)

Los gráficos de 16 análisis de este tipo estan disponibles abajo en un solo archivo ligero de PDF. Es interesnate verlo.

Haz clic aqui para bajar los rplots en PDF condicionado por unidad y categoria.

No tengo ni el tiempo ni las ganas de analizar cada uno de estos gráficos uno por uno. Además hay otros análisis posibles si bajas los datos en R (ver abajo). Este Weblog recibe comentarios al fondo. Los datos crudos y el código R para hacer los gráficos mosaicos estan disponibles abajo (pegalo en tu consola de R y tendrás el PDF en tu directorio de trabajo y los datos cargados en un data frame llamado d en R)

library(vcd)
load(url("http://duncanjg.files.wordpress.com/2008/09/encuesta.doc"))
pdf(width=12,height=6)
for (i in 24:32){
mosaicplot(table(d$X.Categoria,as.factor(d[,i])),
col=c("darkred","red","green","darkgreen"),main=names(d)[i])}
#dev.off()

#png(file="Unidad%00d.png",w=1200,h=600)
for (i in 24:32){
mosaicplot(table(d$Unidad,as.factor(d[,i])),
col=c("darkred","red","green","darkgreen"),main=names(d)[i])}

dev.off()

Written by Duncan Golicher

September 17, 2008 at 7:44 pm

Posted in Ecosur, Uncategorized

Geotagging example 2

leave a comment »

As a quick proof of the Geotagging concept (explained in Spanish here) for use in vegetation research I spent quite literally no more than fifteen minutes of my time producing a KMZ file with images of the vegetation in the field next to my house, this afternoon. This was in response to a message from a colleague who was concerned that the technique could be overly  time consuming. In fact it is much more likely to be time saving.

If I had laid down standard sized quadrats and used higher resolution settings on the camera I  imagine that it would be quite  possible to produce standardised cover estimates for most of the species in the quadrats after the event (perhaps a a job for the  long winter evenings if the work were done in the UK) , although admittedly some of the smaller cryptic species could be missed.

The spatial error was no more than 3m in my case. The spatial relationship between the “quadrats” is also correct. There is a limit to the zoom on the photos when they are looked at within Google Earth itself. However  a high resolution image could always be zoomed into using other software. The nice feature of using GPicSync is that the geographical information is permanently written into the file header for posterity. When spatial visuliazation techniques become more sophisticated they will be able to use this information. However if it is not placed within the photo at the time it is taken it could be lost.

To look at my example download the file below and rename it to somethig with an *.kmz extension. For example quadratsexample.kmz. Then open it in Google Earth (downloaded from http://earth.google.com/download-earth.html)

quadratsexamplekmz

My own geopositioning was achieved using an ultra cheap NMEA gps attached to the  laptop I call tiny (for characteristics see http://duncanjg.wordpress.com/2008/09/10/ssh-dont-tell-anyone-its-so-easy/). The setup under Linux that I explained previously works very well  with tiny and is very convenient to use once it has been configured.

As I understand it Windows users can get a version of gpsbabel with a graphical user interface that can be used with a Garmin GPS from here

http://www.gpsbabel.org/download.html

And  they can download GpicSync from here.

http://code.google.com/p/gpicsync/

I did get a missing dll message when I tried it on my version of Windows XP. I solved it by following instructions here

http://code.google.com/p/gpicsync/wiki/TroubleShooting

But I do confess that I still haven’t gone through the whole process using Windows and Garmin. It should be extremely simple. All that is involved is

  1. Check that the camera time is set exactly.
  2. Check that the GPS is receiving enough satellites when in the field.
  3. Record waypoints or save a tracklog at the time when the photographs are taken.
  4. Download the recorded waypoints or tracklog to the computer in gpx format using gpsbabel.
  5. Import the photos to the computer.
  6. Run GPicSync to add the coordinates into the photo headers and build the kml file based on correlations between the gps coordinate time stamps and those recorded for the photos by the camera.

Written by Duncan Golicher

September 16, 2008 at 7:24 pm

Posted in Uncategorized

Ecoinformatica y el uso racional del Internet 2

leave a comment »

Tal vez en Mexico el nombre de Tim Berners Lee no esta bien conocido. En el Reino Unido el ha recibido el titulo de Sir Berners Lee y es considerado uno de los individuos mas influenciales del siglo veinte. Al Gore no invento el Internet. Ni realmente fue Berners Lee. Pero Berner Lee tiene credenciales. El fue muy influencial no solamente en el diseño de hypertexto, pero en la abertura de la infraestructura del Internet al publico.

Me parece muy interesante algunos detalles de sus recientes comentarios a la prensa sobre la transparencia del internet y la importancia de saber los limites aceptables de la vigilancia del uso.

“I myself feel that it is very important that my ISP supplies internet to my house like the water company supplies water to my house. It supplies connectivity with no strings attached. My ISP doesn’t control which websites I go to, it doesn’t monitor which websites I go to.

“Imagine that everything you are typing is being read by the person you are applying to for your first job. Imagine that it’s all going to be seen by your parents and your grandparents and your grandchildren as well.”

Sir Tim said his data and web history belonged to him.

“It’s mine – you can’t have it. If you want to use it for something, then you have to negotiate with me. I have to agree, I have to understand what I’m getting in return.”

“The development of the Web will have major social, economic and political implications for our future, At its core must be a commitment to maintain the principles of openness as a platform for the sharing of information.”

Como se puede resumir sus comentarios.  TBL argumenta para libertad individual. Libertad  de compartir información, pero al mismo tiempo libertad de mantener tu propia privacidad. Tu debes escoger cuanto información personal compartes con los demas. Ni tu ISP ni tu empresa, ni la universidad o centro de investigación donde trabajas tiene derecho automatico a tu información personal sin entrar en una negociación abierto contigo. Hay razones ligitimas de vigilar y controlar el uso y aceceso al internet. Pero nadie tiene derecho automatico de tu información personal.

Written by Duncan Golicher

September 15, 2008 at 10:09 pm

Posted in Ecosur, Uncategorized

Encyclopedia of Life 2

with 3 comments

In February I wrote in this weblog that I had signed up to the Encyclopedia of Life. This is an ambitious project that aims to provide access for scientists to multiple sources of information on the Internet. I was very excited by the idea, The aims of the project inspired some of the comments I placed here.

However on receiving the second newsletter I have to admit that I was disappointed to find that the EOL had decided to promote the use of closed source photographic software. eol_newsletter_issue2 . Even though this software is free, it usage is restricted to those running the well known proprietary operating system. Furthermore, although I am an advocate of the use of photographic tools and 3d graphics in research, I simply couldn’t see the practical purpose of this particular software tool for research. It appears glossy, but it hardly revolutionizes research practice and knowledge of the world in the way something like Google Earth has done. I also thought that the EOL could complement an Open access information source such as Wikipedia. I am now concerned that the underlying philosophies differ.

I find the the  use of 3d graphics and animation thrilling and inspiring. However I  believe that initiatives such as the EOL should concentrate their attention on the science first and the presentation later. They should always aim to use cross platform open source solutions for the latter. The showcased plant I was presented with on visiting the site (Calanthea roseus) may perhaps have played an important role in my own family’s destiny (my wife was successfully treated for Hodgkins 10 years ago). However it was detailed knowledge of its chemical composition that allowed this to happen, not a pretty presentation in pseudo 3d. Maybe  accepting sponsorship money from Microsoft can further research in some situations. But there is a danger that it comes at the expense of restricting  developing elements of academic bioinformatics. Gift horses should sometimes be looked at in the mouth.

Written by Duncan Golicher

September 15, 2008 at 6:10 pm

Nombres de comunidades y municipios: Exportar a Google Earth de PostGIS

leave a comment »

Siempre es util tener los bordes de municipios y todas las localidades de Chiapas en Google Earth

Se puede exportar facilmente de una base de datos PostGIS con una consulta usando ogr2ogr. Por ejemplo

ogr2ogr -f "KML" conteo2005.kml "PG:dbname=gisdb" -sql "SELECT nom_loc,pobtot,the_geom from mex.conteo2005 where nom_ent like 'Chiapas' sort by pobtot" -dsco NameField=nom_loc

Encontré que aparentemente hay un problema de exportar multipolygons. A veces se puede resolver quitando las tags si realmente hay nada mas un polygono por cada fila en la tabla usando sed. Por ejemplo.

ogr2ogr -f "KML" chismunicpios.kml "PG:dbname=gisdb" -sql "SELECT nom_mun,the_geom from mex.municipios where nomedo like 'Chiapas'" -dsco NameField=nom_mun
#Getting rid of unwanted multipolygon

sed 's/<MultiPolygon><polygonMember>//' chismunicpios.kml >chismunicpios2.kml
sed 's/<\/polygonMember><\/MultiPolygon>//' chismunicpios2.kml >chismunicpios3.kml

Aqui hay unos archivos de kmz (quita la extensión de doc)

conteo2005kmz #Conteo de población de Chiapas 2005

municpioskmz  #Todo Mexico >25 MB

chismunicpios3kmz Chiapas

Written by Duncan Golicher

September 14, 2008 at 11:14 pm

Posted in Ecosur, Linux, POSTGIS

Resultados provisionales de una encuesta sobre el uso de software libre e internet en Ecosur

leave a comment »

El viernes 12 septiembre 66 empleados de Ecosur llenaron una encuesta que elaboré con en fin de saber que tal extendido es el uso de software libre en Ecosur, y como actualmente se usa el internet.

Los resultados cuantitativos van a cambiar con mas participación. Se pueden ver aqui.

Clic para ver los resultados en tiempo real.

Clic aqui para resultados finales.

Algunos conclusiones generales preliminarios y cualitativas son los siguientes

  1. El uso de Linux es incipiente todavia.
  2. Hay mas usuarios de Mac que se sospechaba.
  3. El programa que asegura la dominancia de Windows es claramente Office.
  4. Hay suficiente usuarios de browsers distintos a IE para necesitar asegurar que la pagina web institucional siempre funciona con ellos, no solamente con Internet Exploror.
  5. Muchos (50%) usan Excel como una base de datos. Es probable entonces que estan guardando sus datos en una forma ineficiente y mal estructurados. La practica de usar Excel como base de datos es generalmente mal visto.
  6. Algunos usan Excel para hacer estadistica, otra practica que generalmente no esta bien visto en circulos cientificos. El uso de R es casi nulo (a pesar de mis esfuerzos)
  7. La mayoria de usuarios todavia no han cambiado al uso de Lotus Notes. Sospecho que los que contestaron que usan otros “clientes” realmente quieren decir que usan webmail como hotmail, gmail etc. La licencia para Notes cuesta Ecosur 145,800 pesos.
  8. La mayoria estan dispuesto a admitir que no todo el software en uso personal cuenta con licencia (una cifra que aumentará si mas estudiantes participan y contestan honestamente).  Bill Gates recientemente dijo abiertamente que sin la pirateria Windows no podría competir con Linux.
  9. Alrededor de 20% de personas han probado Linux pero siente que no tiene las caracteristicas que buscan. Este pregunta requiere siguimiento porque no se preguntó que falta.
  10. La mayoria de usuarios de Windows estan perdiendo tiempo y datos por inseguridad.
  11. El uso del email es muy alto. Cualquier problema con el servicio de correos afectará el trabajo.
  12. Se estan bajando bastantes documentos. Si la conectividad es lenta esta actividad puede ser frustrante.
  13. El uso de chat de texto es casi general. Este no ocupa nada de anchura de banda (se trata de 16 bits por letra mas un poco adicional para mantener la conección, entonces es casi imperceptible) pero si ocupa tiempo. El uso puede variar entre social a trabajo serio. Un detalle ironico,  ¡los que usan chat de texto todo el dia piensan que la conectividad es bueno! Y asi es logico realmente. Chat de puro texto es claramente el uso mas ligero del internet possible.
  14. Mas de la mitad tiene chat de voz instalado. Algunos lo usan diario. Probablemente se usaria mas si la conectividad era mejor.
  15. La mayoria se interesan ver videos, los cuales ocupan bastante anchura de banda.
  16. Mas de la mitad encuentra servicios de mapas como Google Earth esencial, aunque algunos no pueden usarlo por la falta de conectividad. Google Earth tiene imagenes de alta resolución y un usuario de GE ocupa mas anchura de banda (>100 kbs) que 12- 20 usuarios simultaneos de Skype con voz (7-9 kbs).
  17. Un numero importante tiene sus propios sitios de web afuera de la institución.
  18. En terminos generales hay poca satisfacción con los servicios actuales.
  19. La biblioteca destaca por su excelencia. La pagina web y servicio de video conferencia estan considerados como aceptables.
  20. El servicio de correos y la conectividad reciben calificaciónes que cualquiera se puede considerar muy inaceptable.

En resumen, la situación actual de conectividad por debajo de 10 kbs en la unidad SCLC ha restringido el desarollo y uso de herramientas cientificas (bases de datos, videos educativos, transferencia de documentos y mapas)  pero  ha dejado libre un uso muy popular (chat de texto) que al ser abusado potencialmente baja la productividad.

Ecosur todavia no ha desarollado una cultura de uso de software libre de uso bajo GPL (General Public License). Al mismo tiempo la institución paga por software que no ha logrado una aceptación amplia (Lotus Notes).

Los resultados entonces respalda las reflecciones expresado aqui.

http://duncanjg.wordpress.com/2008/09/10/el-uso-racional-del-internet/

Written by Duncan Golicher

September 13, 2008 at 8:12 am

Colecciones de plantas en la reserva de la Sepultura

leave a comment »

Localidades de colectas de plantas registrado por Conabio en La reserva de La Sepultura

Localidades de colectas de plantas registrado por Conabio en La reserva de La Sepultura

Conabio (El consejo nacional de la biodiverdidad) acaba de mandar a Ecosur una lista de las colectas de plantas registrado en la reserva de la Sepultura. De acuerdo con la base de datos de Conabio  toda la información es de dominio publico.

Forma de citar:

Título del proyecto. Colección, Institución. Bases de datosSNIB-CONABIO proyecto XXX. México, D.F.

Responsable del proyecto CONABIO: BE 5

Inventario Florístico de la Reserva de la Biósfera La Sepultura del Corredor Biológico Sierra Madre del Sur. Fase II

Número de registros aportados por el proyecto: 4256

M en C. Mario Sousa Sánchez

InvestigadorHerbario Nacional MEXU Departamento de Botánica Instituto de Biología Universidad Nacional Autónoma de México Apartado Postal 70-367, Coyoacán México, DF, 04510, México Tel: 622 9113 Fax: 5550 1760 e-mail: sousa@servidor.unam.mx

Lo importé a PostGIS. Para visualizarlo en Google Earth se puede usar ogr2ogr para exportar datos de PostGIS  a KML usando una consulta sencilla. En este caso usé

ogr2ogr -f “KML” Sepaltura.kml “PG:dbname=gisdb” -sql “SELECT genero,especie,familia,the_geom from conabiosepaltura” -dsco NameField=genero

Aqui esta el resultado (como siempre otra vez hay que quitar la extensión de doc una vez que bajes el archivo para que se queda en algo como sepaltura.kml)

sepalturaconabiokml

Visualización de las colectas de plantas registrado por Conabio en la Reserva de La Sepultura

Visualización de las colectas de plantas registrado por Conabio en la Reserva de La Sepultura

Written by Duncan Golicher

September 12, 2008 at 8:02 pm

Ssh, don’t tell anyone it’s so easy!

with 3 comments

I am constantly surprised by just how easy it is to do really useful little tricks in Linux once you know how. The difficulty is finding out what is available.

Ssh (secure shell) is a really fantastic way to connect several machines on a local wireless network. Once it is setup its pretty much seamless. You can transfer files between machines as you like. Combine that with rsync and cron and you never have to worry again that you forgot to back up your thesis or latest paper if one of your laptops gets stolen. Just make sure you don’t lose both at the same time! Given the extreme insecurity we have to live with on a daily basis in Mexico this possibility does  worry me rather much more than any technical details of the configuration.

I recently bought a tiny Acer Aspire One for travelling and GPS work. It needed some slight tweaking to get Ubuntu running well. All the necessary instructions are contained here,

https://help.ubuntu.com/community/AspireOne

Acer laptops are not particularly  Ubuntu friendly so I was relieved to get most of the hardware working around an hour after install.  However the machine is very good value for the price tag. It has a 120 GB hard drive so it has plenty of space for mirroring work in progress. To connect the two machines over the wireless network I first made sure that both the shh server and client were running on the tiny Acer

sudo apt-get install ssh

This gives you both client and server while a default Ubuntu install only includes the client. The client alone is enough for the main machine (Toshiba)

I called the Acer “tiny”. So I log onto the Toshiba using the the same user as I have on “tiny” (“duncan”). To follow this yourself simply change tiny and duncan to your own versions. If I type in a console

ssh tiny

Then tiny replies and I authenticate with the password. I’m then connected to tiny from the Toshiba. Exit by typing exit. Notice that you can move around and even run programs such as R that output to the console before you leave.

Now the interesting step is to do away with the password and use a secure key instead. This will tell “tiny” to trust the Toshiba.

type

ssh-keygen -t dsa

Follow the defaults entering a suitable passphrase

Then type

ssh-copy-id -i ~/.ssh/id_dsa.pub duncan@tiny

Thats all there is to it. Now

ssh tiny

will get me in without a password. I can browse tiny and transfer files as if they were on the Toshiba with Nautilus simply by bookmarking sftp://tiny/

ssh -X tiny

Will even allow me to run programs with graphical output as if I were in front of tiny itself. This can be quite useful in this particular case if using the small screen becomes tiring. The alternative way is with Remote-desktop, but using a shell is much more direct.

An optional step for a bit more security is to now disallow any further plain password authentication by changing the configuration file on the server (tiny).

sudo gedit /etc/ssh/sshd_config

Find the line

#PasswordAuthentication yes

Uncomment it, and change yes to no:

PasswordAuthentication no

Save the file, and restart ssh.

Perhaps you wouldn’t want quite such a low level of security at work, but it is an ideal and rock solid setup between two trusted computers. After all, nobody can get in unless they physically  have their hands on a part of the hardware that makes up the link, They also need to know a password to run Linux itself.  If any component in the network did get into the wrong hands I can always just delete the key. Both machines would have to be on the same network to use it anyway. So no worries at all for a home user. Ssh really does just what it says on the can. It is a secure shell. If it is set up so login using a password without a key is not allowed only machines that have been configured by a trusted person can log in.

This is clearly  a very useful option for research groups wanting to allow some trusted mobile devices access to potentially sensitive data. It requires nothing more complex than a fixed PC as server and a laptop on a LAN.

Now to backup all my personal stuff I just run rsync from Toshiba

rsync -e ssh -varuzP /home/duncan/Documents/MyWork tiny:/home/duncan/backup/

This is a safe set of options. Verbose, archive, recursive, update, compress, partial. It won’t delete any files on tiny, but will recursively copy all folders within MyWork and update to the latest version if I run it again later. This can be entered into crontabs and run automatically every night, or I can just find it in the shell history and run it whenever I get home from work. Really, really easy…… When you know how of course. Thanks to Ross!

Tiny hard at work backing up with Ubuntu Netbook remix installed

Tiny hard at work backing up with Ubuntu Netbook remix installed

Written by Duncan Golicher

September 10, 2008 at 4:29 pm

Posted in Linux

Tagged with , , , ,

El uso racional del Internet

with one comment

Ecosur esta preocupado para asegurar que los recursos institucionales de conectividad al internet estan usado estrictamente para el trabajo institucional. Ver el circular al final de este mensaje.

El abuso del internet en instituciones academicos es un hecho triste. El ciberespacio ya es una selva salvaje. Pero la censura institucional no es una respuesta factible, aun si quisiéramos tenerlo (¡y cuanto me molesta ver los estudiantes chateando!). Ocupa demasiado de uno de los recursos institucionales mas limitado que Ecosur tiene. Me refiero a la capacidad técnica en el área de informática.  Esta recurso debe estar dedicado siempre al servicio de la meta institucional principal, lo cual es la investigación científica.

El problema es que el momento que alguien trata de bloquear un sitio que merece ser bloqueado, se encuentra que por error esta tambien evitando la entrada en otro sitio inocuo. Por ejemplo el año pasado los estudiantes  no podían bajar los paquetes del software estadistica (R) que uso en mi curso (por bloqueo del la extensión *.zip). Resultado – una perdida de tiempo y frustración por los estudiantes que usaron Windows.

Entonces, si Ecosur opta por la ruta de control se requiere emplear alguien 24/7 simplemente para configurar y re-configurar constantemente los filtros y responder a las demandas. Ademas como puede un investigador saber si realmente quiere desbloquear un sitio si no puede ni verlo?

Fomentar una cultura de responsabilidad en el uso es una solución mucho mas barrato y practico. Sobre virus, spyware, troyanos etc la solución es ser responsable y cambiarte a una plataforma libre de tales problemas. La logica seria fomentar el uso de Linux o Mac dado de que ambos plataformas son seguros y no causan problemas para terceros.

La anchura de banda no debe ser un problema mayor.  La infraestructura en el sur de Mexico es sorprendemente bueno. Usuarios domesticos  en San Cristóbal cuentan con velocidades de conexión muy por encima del promedio en las areas rurales del Reino Unido. Entonces si se puede simplemente ampliar la conexión al mismo nivel que los usuarios domesticos habriamos anchura de banda de sobra.

Este se puede lograr negociando con Telmex. La situación actual de falta de internet en nuestas oficinas es incomprensible y no muestra capacidad ni de Ecosur ni Telmex.  Hace dos años Ecosur contaba con un servicio de vanguardia que fue mucho mejor que los usuarios domésticos y incluso mejor que el servicio en la mayor parte del Reino Unido.  Sentia orgulloso de Ecosur. Tenia >60kbs en mi oficina cuando en casa tenia menos de 12kbs por dialup. Ahora tengo entre 1-10kbs en el trabajo y 250 en casa. Ecosur tiene que volver ya a la vanguardia donde se colocaba hace un par de años o perder para siempre la competitividad en la investigación contemporaneo.

###############

Atendiendo a las inquietudes de la comunidad de ECOSUR, relacionadas con la disminución de la velocidad en los enlaces institucionales de telecomunicación que han afectado en particular a la unidad San Cristóbal y que tienen un impacto en la navegación por internet así como en la calidad del servicio de telefonía privada entre Unidades, en el Comité de Informática hemos acordado activar un filtro de contenido como alternativa de solución a los problemas mencionados. Medida que ya se viene aplicando en algunas unidades de ECOSUR.

Este filtrado de contenido limitará el acceso a sitios de internet que no se consideran necesarios para las labores institucionales y que, además, consumen un alto ancho de banda, tales como sitios de entretenimiento, transmisión de video (streming), música, radio, descarga de software pirata y programas para hackeo, entre otros. A continuación se presenta un listado del tipo de sitios de internet que serán filtrados a partir de esta fecha.

aggressive Violence (promoting) onlinegames Online gaming
beerliquorinfo Information on beer or liquor phishing Phishing and fraud
beerliquorsale Promotion of beer or liquor phishing Phishing and fraud
chat Chat rooms porn Pornography
dialers Dialers used for pornography or trojans proxy Proxies to bypass content filters
drugs Drug-related resources radio Non-news related radio and television
gambling Gambling spyware Spyware
games Games virusinfected Virus distributors
hacking Hacking information warez Pirate software
onlineauctions Online auctions

Si alguna persona por razones justificadas de trabajo, requiere entrar a un sitio de internet que se encuentre bloqueado, deberá solicitar al Departamento de Informática en su Unidad, el desbloqueo del mismo, el cual podrá ser temporal o permanente, según el caso. Igualmente, cuando alguien considere que un determinado sitio debería ser bloqueado, deberá solicitarlo al Departamento de Informática y el caso será presentado a consideración del Comité de Informática.

Esta medida y la administración del ancho de banda permitirán eliminar el tráfico no deseado y al mismo tiempo optimizar el uso de este recurso institucional, mejorando las tasas de transferencia y, por tanto, la calidad de los servicios de telecomunicaciones en ECOSUR.

####################################3

Written by Duncan Golicher

September 10, 2008 at 2:58 pm

Posted in Ecosur, Linux

Tagged with , ,

Eco-informática: Nuevas herramientas de informática en manos de los investigadores

leave a comment »

Documento disponible en PDF aqui( ecoinformatica)

Progreso en las ciencias naturales y sociales depende críticamente en la capacidad de grupos de investigación de generar, conjuntar, sistematizar y analizar grandes cantidades de información. Datos fragmentados y desorganizados solamente pueden contestar preguntas limitadas. En la última década el internet ha revolucionado el modelo científico, facilitando el trabajo en conjunto de grupos formados de individuos distribuidos en distintas instituciones. Ejemplos de colaboraciones exitosas varían en escala entre iniciativas para secuenciar genomas [14] hasta proyectos de tésis con miembros del comité en diversas instituciones. Sin embargo, el conocimiento y uso de las herramientas informáticas no es consistente entre instituciones y líneas de investigación. La diferencia entre ellos en el acceso, conocimiento y habilidad en el uso de la tecnología abre lo que se ha llamado la división digital [15]. Institutos e investigadores que no aprovechan plenamente de la nueva tecnología sufren una reducción en su competitividad, reflejada en el número de publicaciones a nivel internacional.

La situación actual en Ecosur

Hay tres rubros en el uso de herramientas informáticas relevantes al trabajo en Ecosur. Bioinformática, Geoinformática y Servicios Bibliotecarios generales. Desde hace mas de un década Ecosur ha contado con un departamento de servicio en Geoinfomática en la forma del LAIGE. Todavía no se ha desarrollado formalmente un área de Bioinformática en la institución, aunque varios investigadores usan herramientas relacionadas al nivel de sus proyectos. La biblioteca (SIBE) ha mostrado un avance muy sólido proporcionando un rango amplio de nuevos servicios digitales a los investigadores. El uso del equipo de video-conferencia ha facilitado la comunicación entre unidades.

Entonces, es claro que Ecosur ha registrado avances continuos en el uso de herramientas informáticas. Sin embargo hay indicaciones preocupantes que este proceso ha sido mas lento que en otras instituciones. La cultura asociada con la rigidez de las reglas administrativas de una dependencia federal no siempre ha fomentado la adopción temprano de innovaciones tecnológicas. Múltiples investigadores han expresado su preocupación que la velocidad relativa de cambio se ha deteriorado rápidamente en los últimos dos años. Este proceso esta evidenciado por una creciente diferencia entre el nivel de sofisticación en el uso de herramientas informáticas por parte de organizaciones no gubernamentales locales y escuelas y lo que se registra en Ecosur. Esta contrasta con la expectativa general que una institución del tamaño de Ecosur cuenta con ventajas sustantivas en términos de recursos.

La tendencia al nivel global

Al nivel global, desde 2006, se ha registrado un incremento muy rápido en el uso de comunicación directa de voz y video por internet (Skype, Messenger, Ekiga etc), la producción y almacenamiento de fotos y vídeos digitales (You Tube, FlickR etc) y el uso de herramientas de análisis y plataformas de software libre (Linux, Apache, MySQL, PHP). La misma tecnología que proporciona plataformas para usos recreativos proporciona nuevas herramientas para la investigación, muchas veces a cero o bajo costo. Programas como GRASS, R y PostGIS son herramientas de investigación y análisis muy comparables en poder al software comercial ([8]). Imágenes de satélite de alta resolución están disponibles gratis en Google Earth. La construcción de un Wiki o Weblog puede aprovechar de software libre como WordPress. MediaWiki, Drupal o Joomla, Estos avances representan múltiples oportunidades nuevas no solamente para la divulgación de la información generada por proyectos de investigación, pero también para la actividad de investigación misma. En las universidades y centros de investigación Europeos el desarrollo de herramientas informáticas están siempre estrechamente integrados en la investigación. En contraste el departamento de informática de Ecosur ha concentrado su atención en el mantenimiento de la infraestructura de los servicios de comunicación. Esta actividad ha absorbido recursos sin generar productos de investigación tangibles. Hasta la fecha hay pocos ejemplos de colaboración técnica entre programadores del departamento de informática e investigadores. El departamento de informática no emplea personal con conocimiento técnico orientado hacia la investigación y no se ha realizado un análisis a fondo de las necesidades actuales de investigadores en términos de herramientas informáticas.

El concepto de Ecoinformática

La palabra que mejor describe las nuevas tendencias globales en el campo relevante a las actividades de investigadores de Ecosur es “Ecoinformática”. Se define como una nueva ciencia de la información en Ecología y ciencias ambientales con la meta de desarrollar y aplicar formas innovadoras para compartir y analizar información relevante a la conservación y manejo de sistemas ecológicos[16]. En el contexto de Ecosur se puede interpretar la Ecoinformática como la integración de bioinformática, geoinformática y la ciencia de la comunicación dentro de un marco consistente. Hay ejemplos del uso de herramientas de ecoinformática en diversos campos de investigación involucrando monitoreo, captura y almacenamiento de datos [2] [10][11][9]). El futuro de Ecoinformática esta estrechamente vinculado por el movimiento hacia la red semántica. Ecoinformática tiene que ser dinámica y con una visión a futuro.

La gran meta de las herramientas siendo desarrolladas y divulgadas para la web semántica es la integración de todo tipo de información en una forma consistente. Este objetivo complementa el enfoque interdisciplinario de Ecosur. Por ejemplo, un trabajo de tesis de un estudiante puede generar múltiples productos digitales. Estos productos incluyen vídeos y grabaciones de entrevistas, fotos digitales y datos de inventarios de la vegetación. En este momento el único producto entregado es la tesis. Esta queda en papel o pdf y la información interno es poco accesible. Un estudio que sigue los pasos en la misma zona o del mismo tema podría beneficiarse mas de la información y datos originales que la información parcial condensada y plasmada en el documento formal. Por ejemplo fotos y videos correctamente tomados y georefenciados están jugando un papel cada vez mas importante en la investigación ecológica ([1][3][2][12][13]). Software puede extraer información en una forma automatizada de colecciones de imágenes. Para lograr la meta de compartir diversas fuentes de información en una forma accesible se requiere conocimiento técnico a varios niveles. Los datos cuantitativos de estudiantes típicamente no cumplen con la normatividad para un base de datos relacional [6]. Fotos y videos están tomados sin georeferencias ni metadatos [5]. Estudiantes e investigadores pueden ignorar estándares internacionales. Aunque superficialmente el almacenamiento de información parece una actividad rutinaria, en realidad el manejo eficiente de archivos digitales requiere conocimiento sofisticado de programación (ej [4]). La existencia de un grupo de programadores con una preparación actualizada puede inyectar un nuevo dinamismo y nivel de eficiencia al nivel institucional.

El futuro

Este año se ha empezado la tarea de integrar la información geográfica con las colectas biológicas en una estructura uniforme proporcionado por una base de datos geográficamente explicita ([7]). Esta iniciativa aprovecha del nuevo poder y facilidad de uso de software libre. La institución se beneficiaría de una extensión de este proceso para asegurar la incorporación de múltiples fuentes de información en una estructura bien planeada y accesible tanto adentro como afuera de Ecosur. Este proceso actualmente esta limitado por la capacidad técnica institucional y la estructura y orientación del departamento de informática hacia el servicio de la administración. Se propone entonces una re-estructuración de los departamentos de servicio para favorecer la integración de la informática en la investigación.

Múltiples elementos deben estar contemplados antes de empezar este proceso. No se considera dentro del alcance de este documento proponer los detalles técnicos de tal reestructuración. Sin embargo se visualizan cambios estructurales en el LAIGE, las colecciones biológicas, la biblioteca y el departamento de informática para unificar esfuerzos y facilitar el intercambio de información y capacidad técnica. También sería necesario la contratación de personal adicional con conocimiento técnico actualizado bajo la dirección de personal académica con preparación formal en el área de informática.

Una visión de la estructura y actividades de un departamento de Ecoinformática

El concepto de ecoinfomática debe estar visto no como un paraguas a nivel administrativo pero como una realidad funcional estrechamente integrada con la investigación. Por ejemplo no deben existir servidores separados para la biblioteca, Laige, colecciones biológicas y paginas web. Toda la información en Ecosur debe estar mantenida en una sola estructura con la capacidad de almacenar terrabytes de información. Hace dos años el concepto sería ambicioso. Hoy en día el costo de espacio de almacenamiento es mínimo. La arquitectura para trabajar a esta escala esta establecida. Dado de que las características del servidor(es) proporciona la funcionalidad del sistema entero su configuración sería un trabajo vital para asegurar la plataforma sólida para todas las otras actividades de Ecoinformática. Es natural que el sistema estaría basado en Linux. Entonces hay la necesidad de contratar una persona con conocimiento técnico avanzado y amplia experiencia en la configuración y mantenimiento de servidores Linux. El experto puede configurar y mantener un rango de servicios usando el software libre integrado en los servidores de Linux (Firewall, servidor de email, paginas web, ftp, ssh, PHP, MySQL, PostGIS, mapserver etc). El costo de pagar por los servicios de un profesional con experiencia previamente comprobado en una institución de investigación de prestigio internacional estaría ampliamente recompensado con la reducción en los gastos actuales en licencias de software, especialmente porque la configuración de software propietario en uso actual ha causado problemas adicionales (especialmente Lotus Domino). Para seguridad y velocidad de acceso se montará servidores espejos (copias idénticas) en cada unidad.

La persona contratada de mantener el sistema naturalmente proporcionará capacitación a todo el grupo. Este representará un recurso humano importante. El aumento en la capacidad tecnológica local actúa para estimular el desarrollo regional. Ecosur puede ofrecer cursos sobre la configuración y uso de software libre para reducir el gasto de ONGs, escuelas e instituciones gubernamentales.

El mantenimiento de la conectividad física y redes de telecomunicación no debe estar a cargo del grupo de ecoinformática. Sería mejor tener un contrato transparente con un proveedor externo de servicios. Para asegurar que el servicio sea proporcionado a un costo competitivo hay que aprovechar al máximo el poder de negociación de una institución con el tamaño y prestigio de Ecosur. Los términos del contrato tienen que estar publicados bajo la ley de transparencia. Se puede pasar la responsabilidad de contratar y negociar los términos del servicio al personal administrativo. El futuro de la conectividad de las redes institucionales es en el uso de tecnología inalámbrica, la cual esta bajando en costo. Entonces sería necesario analizar el uso de la tecnología periódicamente para asegurar su actualización.

El trabajo principal de ecoinformática no sería simplemente la recompilación y mantenimiento de bases de datos. Mas bien sus actividades estarían unificadas alrededor del servidor donde se guarda y maneja la información.

  1. Grupo de servicios bibliotecarios. Este grupo aprovechará al máximo la experiencia exitosa previa del personal de SIBE. Se contempla una área activa de actualización en el uso de nuevas herramientas de acceso a la información usando extensiones del concepto de búsqueda de texto completo, traducciones automatizadas, material fotográfico, documentos históricos, bases de datos estadísticas etc.
  2. Grupo de Geoinformática. Este grupo extenderá el trabajo cartográfico del LAIGE hacia nuevos productos en línea. Se contempla la ampliación de herramientas como bases de datos espacialmente explicitas (por ejemplo PostGIS) y servidores de mapas. Se aprovecharán nuevas herramientas como Google Maps. La producción de herramientas novedosas, adaptados a las necesidades regionales, requiere conocimiento de programación en idiomas como SQL, Java y PHP.
  3. Grupo de Bioinformática. Este grupo sería responsable de mejorar las bases de datos de colecciones y potencialmente empezar de integrar mas información genética. Su trabajo estaría estrechamente vinculado con el grupo de Geoinformática dado de que preguntas ecológicas tratan de la abundancia y distribución de especies. Se buscarán formas innovadoras de presentar la información taxonómica en forma de claves interactivas y búsquedas de imágenes escaneadas y fotos en el campo por características morfológicas.
  4. Grupo de simulación y modelación. Dado la necesidad de emplear programadores de bases de datos sería natural integrar la actividad de modelación ecológica dentro del concepto de Ecoinformática. Investigadores con necesidades de programadores especializados para sus lineas podrían colaborar directamente con este grupo.
  5. Grupo de estadística y sistematización de datos. Este grupo colaborará con todos los otros grupos, pero también ofrecerá un servicio a los investigadores en el uso de bases de datos, asegurando que no se siga la tendencia actual de mantener datos en formas “Ad hoc” en violación de normas internacionales (por ejemplo hojas de cálculo de Excel). El grupo dará cursos en el uso de herramientas como ODBC y estadística avanzada. Mantendrá bases de datos sustantivos que requieren conocimiento avanzado en su manejo, como por ejemplo datos climatológicos de la zona.
  6. Grupo de comunicaciones y multi media. Este grupo investigará el uso de medios de comunicación dinámicos y visuales como la fotografía y video. Se proporcionará ayuda en la configuración y uso de herramientas de comunicación como video conferencias personales para actividades de investigación.

Una visión del uso de las herramientas de Ecoinformática

En 2010 un investigador joven en Sud Africa esta interesado en el efecto del cambio climático en el bosque seco de la depresión central de Chiapas. Ha leído un informe de un proyecto en la zona (Reforlan) y quiere investigar con mas detalle por su cuenta. Tiene un par de días para formular una hipótesis para plantar un proyecto nuevo. Su primera pregunta es “¿cual ha sido la tendencia en el clima en los últimos 50 años en la zona?”. Entra en el sistema de Ecoinformática de Ecosur. A través de un mapa interactivo consigue los datos históricos del clima en la zona y los análisis usando software estadístico integrado al sistema. Se notan tendencias ambiguas que podrían ser artefactos. Entonces busca publicaciones sobre la calidad de datos climáticos en Chiapas. Encuentra que efectivamente los datos oficiales pueden tener sesgos y errores y la tendencia a largo plazo todavía esta oculta dentro de una variabilidad asociada con el efecto del Niño. Luego se le ocurre que la vegetación misma puede mostrar la tendencia mejor. Busca todas las colectas de árboles de la zona y grafíca la proporción de colectas de especies caducifolias contra el tiempo. Tampoco encuentra una tendencia clara. Además el uso del bosque y la perturbación antropogénica podría influir mas que el cambio climático. Entonces el investigador visualiza los mapas de cambio en la cubertura boscosa en la zona. Hay poca evidencia de cambios recientes. Se cruza con mapas de incendios, pero se encuentra que los incendios son mas bien quemas de pastizales. Empieza a formular nuevas hipótesis sobre la historia del uso en la zona. Busca fotografías del bosque y paisaje en un mapa interactivo, corriendo un “tour” virtual de la zona. Se nota una dominancia de especies dispersadas por ganado. ¿Cuando empezó la ganadería en la zona?” Busca documentos históricos sobre el uso del suelo en el siglo XIX. Había un uso extensivo de los terrenos establecido ya en 1858. Pero ¿cuales han sido las tendencias después de la Revolución Mexicana? Encuentra una tesis escrita sobre el tema recientemente, pero no puede leerla en Español. Usa el servicio de traducción automatizado para extraer la información esencial del documento. Luego encuentra que el estudiante de maestría había entrevistado algunos habitantes mas viejos de la zona. Baja los videos, con sus subtítulos en Inglés (no perfectamente traducidos dado de que la transcripción fue automatizada, pero suficientemente bien para entender), y pasa un rato fascinado con los cuentos emocionantes del tiempo de los Mapaches. Luego se vuelve a concentrar en la tarea. Busca información sobre la dinámica de la vegetación bajo disturbio. Encuentra un modelo de simulación interactivo en el sitio y lo corre con diferentes escenarios. Finalmente decide sobre su estudio. “Calibración de modelos succesionales espacialmente explícitos usando datos históricos”. Baja las capas geográficas relevantes a su estudio a su laptop y produce mapas y figuras para respaldar su propuesta. Busca las direcciones actuales del estudiante y del investigador responsable para el modelo y les invita a participar en su proyecto. Los llama por video conferencia en línea para discutir la colaboración.

Referencias

[1] R. M. Bekker, E. van der Maarel, H. Bruelheide, and K. Woods. Long-term datasets: From descriptive to predictive data using ecoinformatics. Journal of Vegetation Science, 18(4):458–462, 2007.

[2] J. W. Brunt, P. McCartney, K. Baker, and S. G. Stafford. The future of ecoinformatics in long term ecological research. 6th World Multiconference on Systemics, Cybernetics and Informatics, Vol Vii, Proceedings, pages 367–372, 2002.

[3] M. A. Crimmins and T. M. Crimmins. Monitoring plant phenology using digital repeat photography. Environmental Management, 41(6):949–958, 2008.

[4] G. B. Curry and R. C. H. Connor. Automated extraction of data from text using an xml parser: An earth science example using fossil descriptions. Geosphere, 4:159–169, 2008.

[5] Duncan Golicher. Como georeferenciar fotos. http://duncanjg.wordpress.com/2008/08/31/como-georeferenciar-fotos-con-precision-sin-costo-ni-esfuerzo/.

[6] Duncan Golicher. Mantenimiento de datos. http://duncanjg.wordpress.com/2008/02/13/mantenimiento-de-datos/.

[7] Duncan Golicher. http://duncanjg.wordpress.com/2008/04/29/presentacion-de-postgis-en-ecosur/, 2008.

[8] Duncan J Golicher and Luis Cayuela. A methodology for flexible species distribution modelling within an open source framework: Technical report presented to the third international workshop on species distribution modelling: San cristobal de las casas, chiapas, mexico. Technical report, El Colegio de La Frontera Sur, Chiapas, Mexico, 2007.

[9] S. Kraines, R. Batres, M. Koyama, D. Wallace, and H. Komiyama. Internet-based integrated environmental assessment – using ontologies to share computational models. Journal of Industrial Ecology, 9(3):31–50, 2005.

[10] P. Mika, T. Elfring, and P. Groenewegen. Application of semantic technology for social network analysis in the sciences. Scientometrics, 68(1):3–27, 2006.

[11] J. D. Olden, N. L. Poff, and B. P. Bledsoe. Incorporating ecological knowledge into ecoinformatics: An example of modeling hierarchically structured aquatic communities with neural networks. Ecological Informatics, 1(1):33–42, 2006.

[12] V. Reif and R. Tornberg. Using time-lapse digital video recording for a nesting study of birds of prey. European Journal of Wildlife Research, 52(4):251–258, 2006.

[13] A. D. Richardson, J. P. Jenkins, B. H. Braswell, D. Y. Hollinger, S. V. Ollinger, and M. L. Smith. Use of digital webcam images to track spring green-up in a deciduous broadleaf forest. Oecologia, 152(2):323–334, 2007.

[14] M. Ridley. Won for all: How the drosophila genome was sequenced. Nature, 441(7090):153–153, 2006.

[15] Lisa Servon. Bridging the digital divide: Technology, community, and public policy. Malden, MA: Blackwell.

[16] Wikipedia. Ecoinformatics. http://en.wikipedia.org/wiki/Ecoinformatics, 2008.

Written by Duncan Golicher

September 10, 2008 at 11:55 am

Corral de Piedra: Urbanización de las afueras de San Cristóbal

leave a comment »

Este mañana probe el sistema de “geotagging” tomando fotos de las casas a lo largo del camino a Ecosur. Funciona muy bien, aunque se perdio en señal a veces debido a los arboles en el camino.

El archivo esta disponible aqui.  Hay unos desplazamientos menores pero muestra mas o menos la situación actual de urbaización en la zona. (quita el .doc y abrelo en Google Earth)

corraldepiedrakmz

Aqui hay otro, fotos tomado por Mickey el domingo 7 sep.

corraldepiedra2kmz

Written by Duncan Golicher

September 4, 2008 at 7:13 pm

Follow

Get every new post delivered to your Inbox.