Uso de grandes modelos lingüísticos para la investigación

¿Cuánto tiempo le llevaría leer 10.000 mil artículos científicos? Incluso si se consiguieran 10 al día, esto llevaría casi tres años, incluidos los fines de semana. Existen enormes cantidades de datos agrícolas y climáticos sin explotar a los que Finres accede y pone a disposición de sus socios. Algunos de los últimos avances en Inteligencia Artificial (IA), en concreto los Modelos de Lenguaje Amplio (LLM), hacen posible beneficiarse de esta investigación producida previamente.

Las ventajas no se limitan a la rapidez. Cada vez son más las personas que utilizan LLM como ChatGPT, Gemini, Perplexity y otros, para obtener resultados rápidos y aparentemente resultados correctos. Los LLM también se utilizan más y más en la investigación científica. Los mismos algoritmos que responden a preguntas aparentemente aleatorias a partir de modelos entrenados en terabytes de material fuente, pueden perfeccionarse y orientarse al conjunto de la literatura científica para sintetizar grandes cantidades de información, extraer patrones y extraer ideas. Aunque alguien se dedicara a leer los 10.000 artículos sobre un tema concreto, no sería capaz de recordar y sintetizar todos esos artículos: Los LLM sí. 

Por este motivo, finres ha estado utilizando LLM como parte de nuestra investigación y desarrollo para reforzar nuestro trabajo de apoyo a la agricultura para adaptarse al cambio climático. En este blog, destacamos dos proyectos de investigación en curso que utilizan LLM y ofrecemos tres lecciones emergentes para otros investigadores que buscan beneficiarse de estas poderosas herramientas de IA. 

 

Uso de los LLM para identificar las prácticas agrícolas más eficaces para resistir al cambio climático

Técnica agrícola de sombreado utilizada en un campo de patatas

Nuestra agrónoma, la Dra. Mathilde Duvallet, dirige un proyecto que utiliza un potente LLM (ChatGPT-4o) para analizar el efecto de distintas medidas que pueden utilizar los agricultores para adaptarse a un clima cambiante. Estas prácticas incluyen nuevas metodologías o tecnologías complementarias que los agricultores pueden utilizar si se enfrentan a condiciones climáticas más difíciles. Por ejemplo, tipos de sombreado para protegerse de las temperaturas más altas, microcaptación de agua para combatir las condiciones de sequía o diferentes sistemas de drenaje para hacer frente a la saturación por exceso de lluvia. El efecto de estas distintas medidas varía según el cultivo, las condiciones microclimáticas, los parámetros del suelo y otras variables.

Mathilde utilizó ChatGPT-4o para cribar y encontrar los estudios más relevantes realizados de una lista inicial de 10.000. Se han clasificado más de 1.500 trabajos por ubicación geográfica, tipo de suelo, cultivo y tecnología de adaptación al clima estudiada. Esta clasificación inicial del LLM nos permitió priorizar los artículos por tipo de adaptación al clima, clima o tipo de suelo, antes de que nuestro equipo de investigadores analizara e integrara los resultados de la investigación en nuestro trabajo.

 

Análisis de la investigación en ciencias del comportamiento con LLM

En otro proyecto, nuestro científico de datos, el Dr. Dan Xie, utilizó un LLM para realizar un metaanálisis cualitativo de las barreras a las que se enfrentan los agricultores y que inhiben la adopción de nuevas prácticas agrícolas. ChatGPT-4o se utilizó de nuevo para filtrar y seleccionar artículos académicos relevantes. Las pruebas de validación demostraron que ChatGPT-4o lograba resultados coherentes con los de los investigadores humanos el 94% de las veces. El LLM analizó el contenido de los artículos y utilizó métodos estadísticos como la agrupación Sentence-BERT para desarrollar 12 categorías de barreras, que incluían elementos como factores de comportamiento, influencias económicas y apoyo político. 

Dan utilizó un LLM para analizar más de 670 estudios distintos, que abarcaban a más de 14.603 agricultores de 33 países. De este modo, pudimos detectar patrones en función de la ubicación, la demografía y otras variables, como el tipo de explotación. Otras evaluaciones estadísticas, denominadas análisis de co-ocurrencia, también identificaron interacciones entre barreras de distintos grupos. Al ser capaces de analizar con más eficacia tanta investigación, podemos diseñar mejor las aplicaciones y orientar la información para ayudar a los agricultores a adaptarse al cambio climático. 

 

Reducir las "alucinaciones" y otros riesgos de la IA para la Agricultura

Como en cualquier investigación que utilice herramientas innovadoras, existen riesgos. El LLM podría "alucinar", es decir, crear información que parezca coherente y correcta pero que no se haya extraído de ningún dato preciso preexistente. Para mitigar este riesgo, se pueden ajustar parámetros en la codificación del algoritmo para controlar la aleatoriedad y la cantidad de datos que utiliza el modelo para encontrar la respuesta correcta. El valor óptimo de estos parámetros puede ser elegido por el investigador tras realizar pruebas con los resultados de la muestra para evaluar la exactitud de la información proporcionada. 

Otro riesgo es que el LLM sea incoherente, es decir, que dé una respuesta diferente a pesar de que se le formule la misma pregunta, o "indicación". Esto puede ocurrir cuando la respuesta se basa en información matizada que requiere una interpretación subjetiva. Las pruebas de validación pueden utilizarse de nuevo para evaluar la probabilidad de incoherencia antes de emprender un análisis a gran escala, pero al igual que ocurre con los juicios a los que se enfrentan los investigadores humanos, parte de este riesgo será inevitable. 

 

¿Cuáles son las lecciones clave para otros investigadores a la hora de utilizar los LLM? 

Estos enfoques ayudan a minimizar la ambigüedad y maximizar la calidad del resultado recibido. 

  1. Sea preciso y estratégico con las indicaciones: La elaboración de instrucciones claras y específicas es esencial para obtener resultados precisos. Cuanto más precisa sea la instrucción, más eficazmente podrá centrarse el LLM en los datos pertinentes. Por ejemplo, en lugar de formular una pregunta general como "¿Qué influye en las decisiones de los agricultores?", utilice instrucciones detalladas como "Identifique los factores que influyen en la adopción de prácticas agrícolas por parte de los agricultores". 
  2. Utilizar varias preguntas o pasos para obtener la información necesaria: Reducir progresivamente el ámbito de la investigación en lugar de hacer preguntas abiertas que podrían llevar al modelo a alucinar Por ejemplo, al evaluar qué cultivo se estudia en alguna investigación, primero preguntamos al modelo si el artículo se centra en la agricultura, a continuación preguntamos si se estudia algún cultivo en el artículo, antes de preguntar finalmente qué cultivo se estudia.
  3. Implantar procesos de verificación sólidos: Para garantizar la fiabilidad de los datos generados por LLM, es importante verificar los resultados con estándares revisados por humanos para evitar ruidos y sesgos en los resultados generados por LLM. Las comprobaciones periódicas de validación generan confianza en los resultados y ayudan a mantener el rigor científico.
  4. Utiliza los LLM para la escalabilidad, pero reconoce sus límites. Los LLM son inestimables para manejar rápidamente grandes conjuntos de datos, pero no sirven para todas las tareas. Aunque procesan con eficacia grandes volúmenes de información, la interpretación de los matices puede requerir la supervisión humana. Combinar los puntos fuertes de la escalabilidad de los LLM con la experiencia humana garantiza resultados de investigación más precisos y significativos. 

 

¿Y ahora qué? El futuro de la IA en la investigación agrícola

El futuro de la IA en la investigación agrícola

Nos tomamos muy en serio la eficacia y las consecuencias éticas del uso de la IA en nuestro trabajo. Unas pruebas rigurosas de la metodología y los resultados garantizan que comprendemos y confiamos en thl trabajo realizado, finres ya utiliza otra forma de IA, el aprendizaje automático, en sus cálculos relacionados con el cambio climático y el impacto hiperlocal en productos agrícolas específicos. Pero con los nuevos modelos de LLM que se desarrollan y publican periódicamente, hay aún más posibilidades de descubrir mayores conocimientos para apoyar el futuro de la agricultura.

Los LLM híbridos con capacidades multimodales permitirán a los investigadores combinar texto, imágenes y otros formatos de datos, enriqueciendo el proceso de análisis, como la integración de datos visuales de imágenes de satélite con análisis textuales para mejorar la comprensión de las prácticas agrícolas. Por su parte, la integración de datos en tiempo real en los LLM permitirá actualizaciones continuas, garantizando que los resultados de la investigación sigan siendo oportunos y pertinentes. A medida que madura esta innovadora área de investigación, se están creando LLM específicos de cada campo para adaptarlos a áreas de interés concretas, lo que a su vez puede impulsar aplicaciones desarrolladas para salvar la distancia entre los últimos avances científicos y su aplicación práctica.

 

Si desea más información sobre cómo Finres utiliza la IA para desarrollar aplicaciones que contribuyan a la resiliencia del sector agrícola, le rogamos se dirija a ponerse en contacto o pruebe la versión gratuita de AgHorizon. AgHorizon utiliza información derivada de investigaciones basadas en IA para ofrecer datos específicos de los cultivos para la toma de decisiones para el lugar concreto que solicite.

 

Entradas recientes

Cinco ideas de cinco años de uso de la IA y la ciencia para que la agricultura sea más resistente frente a los trastornos mundiales.

Este mes, finres ha celebrado su quinto cumpleaños: cinco años utilizando los últimos avances científicos y de inteligencia artificial para salvar el déficit de financiación y hacer que la agricultura sea más resistente a los crecientes des[...]
Seguir leyendo

3 conclusiones de la COP29 sobre adaptación y agricultura

La COP29 hace hincapié en la urgencia de aumentar las inversiones del sector privado en adaptación, especialmente para la agricultura. A medida que se intensifican los riesgos climáticos, la hoja de ruta hacia la COP30 se centrará en soluciones viables para[...]
Seguir leyendo

La nueva normalidad: La agricultura francesa en una era de extremos climáticos

Un nuevo análisis de finres destaca la magnitud de la devastación causada por la estación agrícola húmeda de 2024, el aumento de la frecuencia de tales extremos climáticos en un futuro próximo, pero[...].
Seguir leyendo