mai 30, 2023

7seizh

Dernières nouvelles et nouvelles du monde de 7 Seizh sur les affaires, les sports et la culture. Nouvelles vidéo. Nouvelles des États-Unis, d'Europe, d'Asie-Pacifique, d'Afrique, du Moyen-Orient, d'Amérique.

Une nouvelle recherche offre à l’intelligence artificielle un moyen de répondre aux questions au moyen d’une méta-inférence sur plusieurs chaînes de pensée

Source : https://arxiv.org/abs/2304.13007

Une invite CoT utilise une explication par étapes pour guider un grand modèle de langage afin de développer une réponse. Il a été démontré que la stimulation CoT augmente considérablement la productivité dans les activités à forte intensité de réflexion. La technique d’auto-cohérence (SC) augmente la précision en échantillonnant plusieurs chaînes de pensée et en renvoyant la sortie majoritaire.

Des gains d’efficacité résultent de SC, mais la méthode présente des inconvénients. La première est qu’il est impossible d’obtenir un consensus lorsqu’il existe de nombreux résultats concevables car chaque chaîne de pensée peut aboutir à un résultat différent. Deuxièmement, ignorer le processus de réflexion qui a conduit au résultat peut conduire à manquer un détail important.

Dans leur article « Multi-threaded Reasoning », des chercheurs de l’Université de Tel Aviv, de l’Institut Allen pour l’intelligence artificielle et de l’Université Bar-Ilan présentent une méthode appelée MCR, dans laquelle ils canalisent un grand modèle de langage (LLM) dans un méta-esprit à travers de nombreux fils de pensée. et générer une réponse et une explication concluantes. Les chaînes logiques données ne sont pas utilisées dans leurs prédictions (comme elles le sont dans SC) mais plutôt pour combiner des données de différentes chaînes. Alors que les deux approches reposent sur l’élaboration d’un ensemble de chaînes de pensée possibles, SC propose la réponse la plus courante obtenue à travers ces chaînes :  » Non  » (boîte grise, en bas à droite). Inversement, MCR agrège les résultats intermédiaires de chaque série (carrés bleus, en haut à gauche) dans un contexte unique qui est ensuite transmis au modèle de méta-raisonneur avec la requête d’origine. La méta-logique est un LLM distinct qui est invité à méta-raisonner sur plusieurs lignes de raisonnement différentes avant de proposer une solution et une justification concluantes.

Le noyau du MCR se compose de trois parties. La pensée en chaîne est créée en combinant un modèle de décomposition et un récupérateur. Après avoir fusionné ces chaînes, un contexte multi-chaînes est généré et introduit dans la méta-logique.

READ  Les planètes rocheuses « Super Terre » pourraient avoir de meilleures défenses pour la vie que ne le disent les scientifiques

L’équipe teste le MCR sur plusieurs ensembles de données QA multiphases difficiles dans un scénario de champ ouvert. Ils classent les problèmes comme implicites ou explicites. Ils utilisent SC et les versions de Self-Ask et CoT avec récupération comme points de référence pour les comparaisons avec le MCR. En utilisant le même nombre de chaînes de raisonnement, les résultats révèlent que le MCR surpasse systématiquement toutes les autres lignes de base. Ils évaluent la valeur MCR en évaluant et en mesurant soigneusement la qualité des interprétations qu’elle génère. Selon les résultats, le MCR peut fournir des explications rationnelles pour plus de 82 % des situations.


scanner le Document de recherche Et lien github. N’oubliez pas de rejoindre 20k + ML Sub RedditEt canal de discordeEt Et Courriel, où nous partageons les dernières nouvelles sur la recherche en IA, des projets d’IA sympas, et plus encore. Si vous avez des questions concernant l’article ci-dessus ou si nous avons oublié quelque chose, n’hésitez pas à nous envoyer un e-mail à [email protected]

🚀 Découvrez les outils d’IA de 100 dans le club d’outils d’IA

Tanushree Shenwai est consultant stagiaire chez MarktechPost. Elle poursuit actuellement son baccalauréat en technologie de l’Indian Institute of Technology (IIT), Bhubaneswar. Elle est passionnée par la science des données et a un vif intérêt pour le champ d’application de l’intelligence artificielle dans divers domaines. Elle est passionnée par l’exploration des nouveaux développements technologiques et de leurs applications dans le monde réel.