VentureBeat présente : AI Unleashed : un événement exécutif exclusif pour les leaders des données d’entreprise. Réseautez et apprenez avec vos pairs du secteur. Apprendre encore plus
Microsoft a rejoint la course aux frameworks d’applications Large Language Model (LLM) avec sa bibliothèque Python open source, Génération automatique.
Comme décrit par Microsoft, AutoGen est « un cadre permettant de simplifier l’orchestration, l’optimisation et l’automatisation des flux de travail LLM ». Le concept fondamental derrière AutoGen est la création d’« agents », qui sont des modules de programmation basés sur des LLM tels que GPT-4. Ces agents interagissent entre eux via des messages en langage naturel pour effectuer diverses tâches.
Les agents peuvent être personnalisés et améliorés à l’aide de techniques d’ingénierie rapides et d’outils externes qui leur permettent de récupérer des informations ou d’exécuter du code. Avec AutoGen, les développeurs peuvent créer un écosystème d’agents spécialisés dans différentes tâches et collaborer les uns avec les autres.
Une vue simplifiée de l’écosystème d’agents consiste à visualiser chaque agent comme une seule session ChatGPT avec ses propres instructions système uniques. Par exemple, un agent pourrait être chargé d’agir en tant qu’assistant de programmation générant du code Python en fonction des demandes des utilisateurs. Un autre agent peut être un réviseur de code qui prend des extraits de code Python et résout les problèmes avec eux. La réponse du premier agent peut ensuite être transmise en entrée au deuxième agent. Certains de ces agents peuvent également avoir accès à des outils externes, qui sont l’équivalent des plugins ChatGPT comme Code Interpreter ou Wolfram Alpha.
Source des images : Blogue Microsoft
AutoGen fournit les outils nécessaires pour créer ces agents et leur permettre d’interagir automatiquement.
Les applications multi-agents peuvent être entièrement autonomes ou modérées via des « agents proxy humains », qui permettent aux utilisateurs d’intervenir dans la conversation entre les agents IA, agissant comme une autre voix pour assurer la surveillance et le contrôle de leur processus. En un sens, l’utilisateur humain se transforme en chef d’équipe qui supervise une équipe composée de plusieurs IA.
Les agents humains sont utiles pour les applications dans lesquelles la structure d’agent doit prendre des décisions sensibles et exiger une confirmation de l’utilisateur, comme effectuer des achats ou envoyer des e-mails.
Ils peuvent également permettre aux utilisateurs d’aider les agents à maintenir le cap lorsqu’ils commencent à prendre la mauvaise direction. Par exemple, l’utilisateur peut partir d’une idée initiale d’application et l’affiner progressivement et ajouter ou modifier des fonctionnalités au fur et à mesure qu’il commence à écrire du code avec l’aide d’agents.
L’architecture modulaire d’AutoGen permet aux développeurs de créer des composants réutilisables à usage général qui peuvent être assemblés pour créer rapidement des applications personnalisées.
Plusieurs agents AutoGen peuvent collaborer pour effectuer des tâches complexes. Par exemple, un agent humain peut avoir besoin d’aide pour écrire du code pour une tâche spécifique.
Un agent assistant de codage peut générer et renvoyer du code, que l’agent utilisateur IA peut ensuite vérifier à l’aide d’un module d’exécution de code. Ensemble, les deux agents IA peuvent alors dépanner le code et produire une version exécutable finale, l’utilisateur humain pouvant s’arrêter ou fournir des commentaires à tout moment.
Cette approche collaborative peut conduire à des gains d’efficacité significatifs. Selon Microsoft, AutoGen peut accélérer l’encodage jusqu’à quatre fois.
AutoGen prend également en charge des scénarios et des architectures plus complexes, tels que la disposition hiérarchique des agents LLM. Par exemple, un agent de gestion de discussion de groupe pourrait modérer les conversations entre plusieurs utilisateurs humains et agents LLM et diffuser des messages entre eux en fonction d’un ensemble de règles.
Un domaine compétitif
Le domaine des frameworks d’applications LLM se développe rapidement et Microsoft AutoGen est en concurrence avec de nombreux autres concurrents. LangChaîne est un cadre permettant de créer différents types d’applications LLM, des chatbots aux résumateurs de texte et agents. LamaIndex propose des outils avancés pour connecter LLM à des sources de données externes telles que des documents et des bases de données.
Les bibliothèques aiment ça GPT automatique, MétaGPTET BébéAGI ils sont spécifiquement axés sur les agents LLM et les applications multi-agents. ChatDev utilise des agents LLM pour émuler toute une équipe de développement logiciel. Et le visage qui embrasse Agents transformateurs La bibliothèque permet aux développeurs de créer des applications conversationnelles qui connectent LLM à des outils externes.
Les agents LLM constituent un domaine brûlant de recherche et de développement, avec des prototypes déjà créés pour des tâches allant du développement de produits aux fonctions exécutives, en passant par les achats et les études de marché. Des études ont également démontré comment les agents LLM peuvent être utilisés pour simuler le comportement d’une population de masse ou créer des personnages réalistes non jouables dans des jeux. Cependant, une grande partie de ce travail reste une preuve de concept et n’est pas encore prête à être produite en raison de défis tels que les hallucinations et le comportement imprévisible des agents LLM.
Malgré ces défis, l’avenir des applications LLM s’annonce prometteur, avec des agents appelés à jouer un rôle important. Les grandes entreprises technologiques parient déjà gros sur le fait que les copilotes d’IA deviendront un élément important des futures applications et systèmes d’exploitation. Et les cadres d’agents LLM permettront aux entreprises de créer leurs propres copilotes personnalisés. L’entrée de Microsoft dans ce domaine avec AutoGen témoigne de l’intensification de la concurrence autour des agents LLM et de leur potentiel futur.
La mission de VentureBeat il doit s’agir d’un marché numérique où les décideurs techniques peuvent obtenir des informations sur les technologies commerciales transformatrices et effectuer des transactions. Découvrez nos Briefings.