Utilisation de grands modèles linguistiques pour la recherche

Combien de temps vous faudrait-il pour lire 10 000 milliers d'articles scientifiques ? Même si vous parveniez à en obtenir 10 par jour, cela prendrait près de trois ans, week-ends compris ( !). Les données agricoles et climatiques contiennent d'énormes quantités d'informations inexploitées auxquelles finres a accès et qu'elle met à la disposition de ses partenaires. Certains des derniers développements en matière d'intelligence artificielle (IA), à savoir les grands modèles de langage (LLM), permettent de tirer parti de ces recherches antérieures.

Les avantages ne se limitent pas à la rapidité. De plus en plus de personnes utilisent des LLM tels que ChatGPT, Gemini, Perplexity et d'autres, afin d'obtenir rapidement des réponses à leurs questions. apparemment des résultats corrects. Les LLM sont également utilisés plus et plus dans la recherche scientifique. Les mêmes algorithmes qui répondent à des questions apparemment aléatoires en s'appuyant sur des modèles entraînés sur des téraoctets de matériel source, peuvent être affinés et ciblés sur l'ensemble de la littérature scientifique afin de synthétiser de grandes quantités d'informations, d'en tirer des modèles et d'en extraire des enseignements. Même si quelqu'un se consacrait à la lecture des 10 000 articles sur un sujet particulier, il ne serait pas capable de se souvenir de tous ces articles et d'en faire la synthèse : Les LLM, eux, le peuvent. 

C'est pourquoi finres a utilisé les LLM dans le cadre de sa recherche et de son développement afin de renforcer son travail de soutien à l'agriculture pour qu'elle s'adapte au changement climatique. Dans ce blog, nous mettons en lumière deux projets de recherche en cours utilisant les LLM et proposons trois leçons émergentes pour d'autres chercheurs cherchant à bénéficier de ces puissants outils d'IA. 

 

Utiliser les MAIT pour identifier les pratiques agricoles les plus efficaces pour résister au changement climatique

Technique agricole d'ombrage utilisée dans un champ de pommes de terre

Notre agronome Dr. Mathilde Duvallet dirige un projet utilisant un puissant LLM (ChatGPT-4o) pour analyser l'effet de différentes mesures pouvant être utilisées par les agriculteurs pour s'adapter à un climat changeant. Ces pratiques comprennent de nouvelles méthodologies ou des technologies complémentaires que les agriculteurs peuvent utiliser s'ils sont confrontés à des conditions météorologiques plus difficiles. Par exemple, des types d'ombrage pour se protéger des températures plus élevées, la récolte de micro-eau pour lutter contre les conditions de sécheresse, ou différents systèmes de drainage pour lutter contre la saturation due à des pluies trop abondantes. L'effet de ces différentes mesures varie en fonction de la culture, des conditions microclimatiques, des paramètres du sol et d'autres variables.

Mathilde a utilisé ChatGPT-4o pour sélectionner et trouver les études les plus pertinentes parmi une liste initiale de 10 000. Plus de 1500 articles ont été classés par localisation géographique, type de sol, culture et technologie d'adaptation au climat étudiée. Cette première classification du LLM nous a permis de hiérarchiser les articles par type d'adaptation climatique, par climat ou par type de sol, avant que notre équipe de chercheurs n'analyse et n'intègre les résultats de la recherche dans notre travail.

 

Analyser la recherche en sciences du comportement avec les LLMs

Dans un autre projet, notre Data Scientist Dr. Dan Xie, a utilisé un LLM pour mener une méta-analyse qualitative des obstacles rencontrés par les agriculteurs qui inhibent l'adoption de nouvelles pratiques agricoles. ChatGPT-4o a de nouveau été utilisé pour filtrer et sélectionner les articles académiques pertinents. Les tests de validation ont montré que ChatGPT-4o obtenait des résultats conformes à ceux des chercheurs humains dans 94% des cas. Le LLM a analysé le contenu des articles et a utilisé des méthodes statistiques telles que le regroupement Sentence-BERT pour développer 12 catégories d'obstacles, y compris des éléments tels que les facteurs comportementaux, les influences économiques et le soutien politique. 

Dan a utilisé un LLM pour analyser plus de 670 études distinctes, couvrant plus de 14 603 agriculteurs dans 33 pays. Cela nous a permis de mettre en évidence des schémas en fonction du lieu, de la démographie et d'autres variables telles que le type d'exploitation agricole. D'autres évaluations statistiques, appelées analyses de cooccurrence, ont également permis d'identifier les interactions entre les obstacles dans différents groupes. En étant en mesure d'analyser plus efficacement autant de recherches, nous pouvons mieux concevoir les applications et cibler les informations pour aider les agriculteurs à s'adapter au changement climatique. 

 

Réduire les "hallucinations" et autres risques de l'IA pour l'agriculture

Comme pour toute recherche utilisant des outils innovants, il existe des risques. Le LLM pourrait "halluciner", c'est-à-dire créer des informations qui semblent cohérentes et correctes mais qui ne sont pas tirées de données préexistantes précises. Pour atténuer ce risque, des paramètres peuvent être ajustés dans le codage de l'algorithme afin de contrôler le caractère aléatoire et la quantité de données que le modèle utilise pour trouver la bonne réponse. La valeur optimale de ces paramètres peut être choisie par le chercheur à la suite de tests sur les résultats de l'échantillon afin d'évaluer l'exactitude des informations fournies. 

Un autre risque est que le MLD soit incohérent, c'est-à-dire qu'il donne une réponse différente alors qu'on lui pose la même question, ou qu'on le "sollicite". Cela peut se produire lorsque la réponse est basée sur des informations nuancées qui nécessitent une interprétation subjective. Les tests de validation peuvent à nouveau être utilisés pour évaluer la probabilité d'incohérence avant d'entreprendre une analyse à grande échelle, mais comme pour les jugements auxquels sont confrontés les chercheurs humains, une partie de ce risque sera inévitable. 

 

Quels sont les principaux enseignements que les autres chercheurs peuvent tirer de l'utilisation de l'apprentissage tout au long de la vie ? 

Ces approches permettent de minimiser l'ambiguïté et de maximiser la qualité des résultats obtenus. 

  1. Soyez précis et stratégique avec les messages-guides : Il est essentiel de formuler des questions claires et spécifiques pour obtenir des résultats précis. Plus l'invite est précise, plus le LLM peut se concentrer sur les données pertinentes. Par exemple, au lieu de poser une question générale telle que "Qu'est-ce qui influence les décisions des agriculteurs ?", utilisez des instructions détaillées telles que "Identifiez les facteurs qui influencent l'adoption de pratiques agricoles par les agriculteurs." 
  2. Utiliser plusieurs questions ou étapes pour obtenir les informations nécessaires: Par exemple, pour déterminer quelle culture est étudiée dans une recherche, nous avons d'abord demandé au modèle si l'article était axé sur l'agriculture, puis si une culture était étudiée dans l'article, avant de demander quelle culture était étudiée.
  3. Mettre en œuvre des processus de vérification solides : Pour garantir la fiabilité des données générées par le LLM, il est important de vérifier les résultats par rapport à des normes évaluées par l'homme afin d'éviter le bruit et les biais dans les résultats générés par le LLM. Des contrôles de validation réguliers renforcent la confiance dans les résultats et contribuent à maintenir la rigueur scientifique.
  4. Utiliser les LLM pour l'extensibilité, mais reconnaître leurs limites. Les LLM sont inestimables pour traiter rapidement de grands ensembles de données, mais ils ne conviennent pas à toutes les tâches. Bien qu'ils traitent efficacement de grands volumes d'informations, une interprétation nuancée peut toujours nécessiter une supervision humaine. La combinaison des forces de l'évolutivité des LLM et de l'expertise humaine garantit des résultats de recherche plus précis et plus significatifs. 

 

Quelle est la prochaine étape ? L'avenir de l'IA dans la recherche agricole

L'avenir de l'IA dans la recherche agricole

Nous prenons au sérieux l'efficacité et les conséquences éthiques de l'utilisation de l'IA dans notre travail. Des tests rigoureux de la méthodologie et des résultats nous permettent de comprendre et d'avoir confiance dans les éléments suivants thGrâce au travail réalisé, finres utilise déjà une autre forme d'IA, l'apprentissage automatique, dans ses calculs relatifs au changement climatique et à l'impact hyperlocal sur des produits agricoles spécifiques. Mais comme de nouveaux modèles de LLM sont régulièrement mis au point et diffusés, il est encore possible de découvrir de meilleures informations pour soutenir l'avenir de l'agriculture.

Les LLM hybrides dotés de capacités multimodales permettront aux chercheurs de combiner du texte, des images et d'autres formats de données, ce qui enrichira le processus d'analyse, comme l'intégration de données visuelles provenant d'images satellitaires avec une analyse textuelle pour améliorer les connaissances sur les pratiques agricoles. L'intégration de données en temps réel dans les LLM permettra des mises à jour continues, garantissant ainsi que les résultats de la recherche restent d'actualité et pertinents. À mesure que ce domaine de recherche novateur gagne en maturité, des LLM spécifiques sont construits pour s'adapter à des domaines d'intérêt particuliers, qui peuvent à leur tour alimenter des applications développées pour combler le fossé entre la science la plus récente et sa mise en œuvre pratique.

 

Pour en savoir plus sur la manière dont finres utilise l'IA pour développer des applications destinées à soutenir la résilience du secteur agricole, veuillez cliquer ici. prendre contact ou essayez la version gratuite de AgHorizon. AgHorizon utilise les résultats de la recherche fondée sur l'intelligence artificielle pour fournir des informations sur l'état de l'environnement. données de qualité décisionnelle, spécifiques aux cultures pour l'emplacement spécifique que vous demandez.

 

Posts récents

Cinq idées tirées de cinq années d'utilisation de l'IA et de la science pour rendre l'agriculture plus résiliente face aux désordres mondiaux.

Ce mois-ci, finres a fêté son cinquième anniversaire : cinq ans d'utilisation des dernières technologies de l'information et de la science pour combler le déficit de financement et rendre l'agriculture plus résistante aux désordres mondiaux croissants. [...]
Lire la suite

3 enseignements de la COP29 sur l'adaptation et l'agriculture

La COP29 souligne l'urgence d'augmenter les investissements du secteur privé dans l'adaptation, en particulier pour l'agriculture. Alors que les risques climatiques s'intensifient, la feuille de route pour la COP30 se concentrera sur les solutions [...]
Lire la suite

La nouvelle normalité : l'agriculture française à l'ère des extrêmes climatiques

Une nouvelle analyse de Finres met en évidence l'ampleur des dégâts causés par la saison agricole humide de 2024, la fréquence accrue de ces extrêmes climatiques dans un avenir proche, mais aussi la nécessité d'une meilleure gestion de l'eau.
Lire la suite