«

»

Dic
28

R, la herramienta de software más completa para el estudio de la agrobiodiversidad

Las lista creciente de aplicaciones y el inmenso potencial del software R en el estudio de la agrobiodiversidad ha dejado de ser un tema de artículos científicos y lo podemos considerar una realidad en la práctica.

R es un software de uso gratuito (GNU), para el análisis estadístico y gráfico el cual provee una amplia gama de técnicas y que se desarrolla a través de paquetes que aportan algunos de sus usuarios para uso de todos. No se trata de una herramienta muy novedosa para quienes frecuentemente analizan datos provenientes de caracterización de germoplasma (¿o si?) . Lo que sí es reciente es la utilización de R en otros ámbitos relacionados con los recursos fitogenéticos, además del análisis de datos de caracterización en donde R esta permitiendo realizar aproximaciones antes impensables.

El logo de R

Hace ya unos tres años que he empezado a trabajar esta poderosa, y por qué no decirlo, a veces un poco compleja herramienta. Fue cuando ante la necesidad de realizar numerosos simulacros de selección de entradas (remuestreos) para conformar colecciones núcleo (nucleares) ecogeográficas, me vi en la necesidad de aprender a usar R, por varias razones. Los programas estadísticos de entonces que yo usaba eran de pago y, o no tenían la capacidad de trabajar la cantidad de datos de mi estudio,  o no permitían remuestreos, o no incluían los análisis multivariados que precisaba.  Ante el panorama de utilizar cuatro o cinco programas diferentes cuyos sus productos (archivos/formatos) no eran siempre compatibles entre sí (lo cual implicaba procesos adicionales de transformación de formatos), y aun así no tener garantía de éxito, me decidí por «iniciarme» en R, aconsejado por amigos del mundo de la ecología (donde R ya es una «institución»).

Es importante señalar que el inicio es un camino lleno de piedrecitas, porque aunque es un programa muy flexible, se debe programar lo que uno quiere que haga R (usando comandos, funciones, creando objetos, etc.) y por ello no tiene pestañas ni menús (aunque existe una opción de uso mediante menús y pestañas, pero de poco alcance). Aprender el lenguaje de R y sus trucos básicos es la parte inicial, y la más complicada.  A partir de allí, las complicaciones derivarán mas de lo complejo del análisis que de lo complejo que pueda ser R. Sin embargo, y a pesar de que R no tiene servicio técnico, existe una comunidad de usuarios alrededor del mundo que puede echar una mano a través de los múltiples foros y listas de correos electrónicos. Son estas mismas comunidades las que desarrollan desinteresadamente las nuevas aplicaciones en R, las cuales vamos a llamar «funciones». Sólo un punto negativo: casi todo es en inglés, incluyendo foros y listas de email. Pero vamos a resaltar lo positivo, empecemos por un buen material en español: si alguien esta interesado en iniciarse en R, les recomiendo el blog de Luis Cayuela (Profesor de la Universidad Rey Juan Carlos) y particularmente los documentos/capítulos de un curso de análisis de datos ecológicos en R, descargables en pdf, los cuales incluyen el uso inicial de R y algunas de las principales aplicaciones en estadística. Como base estos documentos son una buena guía.

Lo cierto es que en los últimos dos o tres años y gracias al esfuerzo de personas como Robert Hijmans (uno de los responsables del avance de DIVA-GIS) o Jacob van Etten, entre otros, muchas de las aplicaciones SIG en conservación y uso de la agrobiodiversidad que varios hemos venido desarrollando en los últimos años, se están haciendo posibles en R. Algunas de esas aplicaciones requerían costosos programas de pago (ArcGIS, por ejemplo), los cuales serían evitables de ahora en adelante con el uso de R y sus funciones SIG, con la ventaja adicional de que tendremos «todo en uno» (todas las funciones necesarias en una sola herramienta, incluyendo además de SIG, sofisticados análisis estadísticos, algoritmos de modelación y gráficas versátiles y potentes). Sencillamente maravilloso!.

Esto es un proceso y llevará más tiempo para que todo funcione perfecto y tengamos a nuestra disposición todo lo necesario. Hay que pensar que la comunidad que desarrolla los paquetes de funciones de R (entre ellas las de SIG), no cobran por ello, así que ante las dificultades, paciencia. Lo importante es reconocer que este será el camino. Por su costo cero, es lo más apropiado para las condiciones de países en desarrollo, como América Latina, por ejemplo. La limitante para su difusión entre los programas nacionales para la conservación de recursos fitogenéticos de Latinoamérica, de momento, sería la formación y el entrenamiento de personal. Es probable que enseñar el uso de R básico y sus componentes SIG entre el personal técnico de programas nacionales pueda resultar casi imposible en la actualidad debido a limitantes económicos y de disponibilidad de tiempo (tanto de potenciales profesores como de los alumnos/técnicos). Sin embargo podemos pensar en llegar a estos programas nacionales con herramientas listas para usar, basadas en R, pero donde los usuarios (técnicos de los programas) no tengan que saber usar R para realizar los análisis. En ello trabajamos!.

2 comentarios

  1. Fredy Sandoval escribió:

    hola,
    Actualmente estoy trabajando en un proyecto referente a Agrobiodiversidad y estamos en el punto de la realización del análisis estadístico con todas las bases de datos pero no sabemos cómo realizarlo. Ustedes me pueden colaborar dándome una guía de orientación sobre la ruta que se debe seguir, para sacarle mayor provecho al programa R.

    gracias

    1. Mauricio Parra Quijano escribió:

      Nos tendría que describir más acerca del tipo de análisis estadístico que pretende realizar.

Deja un comentario

Tu email nunca se publicará.

Puedes utilizar las siguientes etiquetas y atributos HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>


*