Le PDG actuel de Y Combinator, Garry Tan, a open source sur GitHub un système de connaissances d’agents IA nommé GBrain, afin que les assistants IA puissent accumuler une mémoire à long terme durable. Ce n’est pas une preuve de concept : c’est un outil de productivité qu’utilise Tan au quotidien — il a, via l’agent OpenClaw, accumulé plus de 10 000 fichiers Markdown, couvrant toutes les personnes, toutes les entreprises et tous les concepts avec lesquels il a interagi.
Pourquoi le PDG de YC veut écrire lui-même un outil de gestion des connaissances
L’idée centrale de Garry Tan est la suivante : les agents IA actuels repartent à zéro à chaque conversation, ne se souviennent pas de qui vous êtes, ne savent pas ce que vous faites et ne comprennent pas votre contexte. Le problème que GBrain cherche à résoudre consiste à faire en sorte que l’agent devienne plus intelligent à chaque conversation, et non pas à chaque fois comme lors de la toute première rencontre.
La logique de fonctionnement suit une boucle continue « lecture → réponse → écriture » : lorsque l’agent reçoit un message, il détecte d’abord les entités qu’il implique (noms de personnes, entreprises, concepts), puis interroge les connaissances pertinentes déjà présentes dans GBrain, répond ensuite en tenant compte du contexte complet, et enfin écrit les nouvelles informations apprises au cours de la conversation dans la base de connaissances. Chaque interaction s’ajoute aux précédentes, avec un effet d’accumulation qui grandit avec le temps.
Architecture des connaissances : compiler la vérité avec une ligne de temps
Le format de stockage des connaissances de GBrain est assez unique. Chaque entité (personne, entreprise, concept) dispose d’une page dédiée, composée de deux parties :
« Vérité compilée » (Compiled Truth) : c’est votre meilleure compréhension actuelle de cette entité, qui se réécrit au fil de l’apparition de nouveaux éléments probants. « Ligne de temps » (Timeline) : en revanche, il s’agit d’un enregistrement d’éléments probants en annexe uniquement, ajoutés sans modification — il consigne chaque rencontre, chaque source d’information et chaque horodatage.
Cette conception rend les connaissances traçables : vous ne savez pas seulement ce que c’est, mais aussi quand et d’où vous l’avez appris.
Sources de données : réunions, Email, Twitter, appels téléphoniques — importés automatiquement
GBrain propose plusieurs façons d’intégration automatisée, pour que les connaissances affluent automatiquement dans le système :
Intégration de la source Fonctionnalité Gmail Convertit automatiquement le contenu des emails en pages d’entités Google Calendar Transforme les agendas quotidiens en pages de connaissances consultables Twitter / X Suivi des lignes de temps, des mentions et des suppressions Appels vocaux Transcription en pages de connaissances via Twilio + OpenAI Realtime Comptes rendus de réunion Circleback Les transcriptions mot à mot sont automatiquement converties en pages de cerveaux
Architecture technique : construire une base de connaissances complète en 30 minutes
GBrain utilise par défaut PGLite — une base de données Postgres 17.5 embarquée qui s’exécute via WebAssembly — sans besoin du tout de déployer un serveur de base de données, et qui peut démarrer en deux secondes. La recherche utilise un mode hybride, combinant une recherche sémantique par vecteurs (OpenAI embeddings) et une recherche par mots-clés, puis fusionnant les deux types de résultats grâce à une fusion par rang réciproque (Reciprocal Rank Fusion).
Le système prend en charge trois modes d’utilisation : un outil en ligne de commande (CLI), un serveur MCP (qui peut s’intégrer directement à des outils comme Claude Code, Cursor, etc.), et une bibliothèque de fonctions TypeScript pour que les développeurs puissent l’intégrer. En mode serveur MCP, il propose 30 outils, dont la lecture et l’écriture des pages, la recherche, la navigation dans les graphes de connaissances et l’import de fichiers, etc.
La signification pour l’écosystème des agents IA
L’apparition de GBrain répond à un problème central du domaine des agents IA : la mémoire. Bien que les outils IA dominants (Claude, ChatGPT) incluent une mémoire de base, ils se limitent le plus souvent au niveau des préférences de conversation. GBrain propose une vision plus ambitieuse : permettre aux agents de disposer d’une « connaissance du monde » structurée, plutôt que de simplement se souvenir de ce que vous préférez utiliser en chinois traditionnel.
Dans ses documents, Garry Tan distingue spécialement trois couches de mémoire : la « connaissance du monde » gérée par GBrain (personnes, entreprises, réunions, concepts), l’« état d’opération » propre à l’agent (préférences, prise de décision, modes de comportement) et le « contexte de la conversation » en temps réel. Il estime que, lors de chaque exécution, les agents IA doivent vérifier ces trois couches en même temps, afin de fournir un service réellement personnalisé.
Ce système est issu de l’un des investisseurs en capital-risque les plus influents de la Silicon Valley : chaque jour, il l’utilise pour gérer ses interactions avec des centaines de fondateurs et d’investisseurs. Lorsque le PDG de YC considère que les agents IA ont besoin d’une telle infrastructure de connaissances, c’est en soi un signal qui mérite d’être pris en compte.
Cet article « Le PDG de YC Garry Tan open source un système de mémoire IA GBrain : pour que les assistants IA deviennent plus intelligents à chaque conversation » est paru pour la première fois sur Chaîne News ABMedia.