IA 2026 06 18 | News Makertronic

Vercel publie `eve`, un framework open-source pour les agents IA durables

Date : 28/01/2026
Catégorie : Agent IA / Framework
Résumé technique : Framework Apache-2.0 conçu pour construire, exécuter et mettre à l'échelle des agents backend de manière durable. Approche filesystem-first : un agent est un répertoire de fichiers où chaque dossier/mappe une capacité (agent.ts, instructions.md, tools/, skills/, connections/, channels/, schedules/). Intègre nativement le checkpointing d'état, le sandboxing du code généré, les validations humain-IA, les connexions sécurisées (MCP/OpenAPI), le multi-canaux et le tracing OpenTelemetry. Déjà utilisé en production par Vercel pour plus de 100 agents internes.
Pourquoi c’est intéressant : Élimine la complexité infrastructurelle habituelle des agents (gestion de state, retry, isolation, auth, déploiement). Permet aux développeurs de se concentrer exclusivement sur la logique métier et les prompts. Le déploiement local vers la production est transparent (vercel deploy) sans modification du code.
Angle possible pour une vidéo YouTube : "J'ai testé eve de Vercel : Fini le code spaghetti pour vos agents IA ?" ou "Déployer un agent IA complexe en 3 fichiers : tuto eve"
Source originale : Vercel Engineering Blog
URL directe :

Date : 27/01/2026
Catégorie : Nouveau modèle / Hardware & Agent IA
Résumé technique : Présentation de la plateforme Rubin (premier design extrême à 6 puces, 50 petaflops NVFP4, co-design intégral CPU/GPU/Réseau/Stockage) réduisant le coût d'inférence des tokens d'un facteur 10. Annonce simultanée d'Alpamayo, portfolio open-source de modèles VLA (Vision-Language-Action) avec raisonnement pour l'autonomie de niveau 4, incluant des blueprints de simulation et des datasets. Intégration imminente sur Mercedes-Benz CLA et écosystème de robots physiques (Isaac Sim, partenaires industriels).
Pourquoi c’est intéressant : Baisse drastique du coût compute grâce à l'optimisation système-level. Alpamayo open-source démocratisera la R&D en véhicules autonomes et robotique. Marque un pivot stratégique vers l'IA incarnée, l'edge computing et les agents personnels décentralisés (DGX Spark).
Angle possible pour une vidéo YouTube : "CES 2026 : Jensen Huang a changé les règles du jeu avec Rubin et l'IA physique" ou "Voici comment NVIDIA veut autonomiser toutes les voitures avec Alpamayo"
Source originale : NVIDIA AI Blog / CES 2026 Press Kit
URL directe :

Date : 28/01/2026
Catégorie : Nouvelle méthode / Standardisation
Résumé technique : Spécification open de Google Cloud formalisant le pattern LLM-wiki. Basé sur des fichiers Markdown + YAML frontmatter, sans SDK, runtime ni registre propriétaire. Permet aux agents de lire, mettre à jour et naviguer dans des bases de connaissances structurées (schémas, métriques, runbooks, APIs) de manière interopérable. Résout le problème des silos de contexte fragmenté en créant un graphe de connaissances portable et versionnable (Git-native).
Pourquoi c’est intéressant : Offre une alternative structurée et légère au RAG classique pour la gestion de connaissances internes et métier. Compatible avec tout framework agent, élimine la réécriture de connecteurs pour chaque outil. Idéal pour les data teams, la doc technique et l'exchange cross-organisationnel.
Angle possible pour une vidéo YouTube : "Ok, le RAG est mort ? Voici pourquoi Google pousse OKF pour les agents IA" ou "Comment structurer les connaissances de votre entreprise pour l'IA en 2026"
Source originale : Google Cloud Blog
URL directe :

Date : 27/01/2026
Catégorie : Benchmark / Évaluation IA
Résumé technique : Benchmark de 750 tâches expertes rédigées par 173 scientifiques, couvrant 7 workflows et domaines biologiques. Abandonne les QCM pour un système de rubriques granulaires (19 020 critères atomiques) permettant la notation partielle. Teste la gestion d'artefacts réels (PDF, séquences, figures, structures chimiques) et le raisonnement scientifique multi-étapes. GPT-Rosalind atteint 36,1% de taux de passage, avec des baisses significatives sur les tâches nécessitant des artefacts ou une optimisation de conception.
Pourquoi c’est intéressant : Passe de l'évaluation factuelle à l'évaluation du raisonnement scientifique réel et de la prise de décision sous incertitude. Outil crucial pour les développeurs et la pharma pour mesurer objectivement la fiabilité des agents en R&D. Met en lumière les goulets d'étranglement actuels (interprétation d'artefacts, raisonnement itératif, exactitude des outputs).
Angle possible pour une vidéo YouTube : "Les LLM vont-ils vraiment remplacer les chercheurs ? Le test brutal de LifeSciBench répond" ou "Pourquoi même GPT-Rosalind échoue à 64% en biologie"
Source originale : OpenAI Research / arXiv
URL directe :

Date : 28/01/2026
Catégorie : Automatisation / Conseil d'usage
Résumé technique : Guide pratique sur l'exploitation des fonctionnalités de planification intégrées à Gemini (Google One AI Premium), Grok (Tasks & DeepSearch) et ChatGPT Plus. Permet de configurer des requêtes récurrentes (scrutation de blogs, réseaux sociaux, veille concurrentielle, repérage de hooks/viralité) avec notifications, synthèses structurées et affinages itératifs. Fonctionne sans code, sans outil tiers, en s'appuyant sur les moteurs de recherche et web-browsing natifs des assistants.
Pourquoi c’est intéressant : Gain de temps massif pour les créateurs, marketeurs et indépendants. Transforme les chatbots passifs en assistants de veille proactifs et personnalisés. Faible friction d'adoption, ROI immédiat sur la production de contenu et le benchmarking concurrentiel.
Angle possible pour une vidéo YouTube : "Je n'utilise plus Feedly : Voici comment j'automatise 100% de ma veille avec l'IA (gratuit)" ou "3 prompts pour transformer ChatGPT/Grok en assistant de veille ultra-performant"
Source originale : ActuIA / Blog Veille Digitale
URL directe :