IA 2026 06 14 | News Makertronic

NVIDIA Rubin & Alpamayo : Révolution du compute et de l'IA physique

Date : 06/01/2026
Catégorie : Infrastructure IA / Agent IA / Automatisation
Résumé technique : NVIDIA dévoile la plateforme Rubin, première architecture AI à 6 puces co-conçues de bout en bout (GPU, CPU Vera, NVLink 6, photonics, DPU), réduisant le coût de génération de tokens à ~10% de l'architecture Blackwell précédente. Parallelément, lancement d'Alpamayo, une famille de modèles VLA (Vision-Language-Action) open-source pour véhicules autonomes niveau 4, intégrant raisonnement, simulation physique et pilotage direct des commandes de conduite. 28
Pourquoi c’est intéressant : La baisse drastique du coût du compute change la donne économique pour le déploiement massif de grands modèles. Alpamayo open-source permet aux startups et chercheurs d'entraîner des agents physiques sans dépendre de fermes de serveurs propriétaires, accélérant l'innovation en robotique et mobilité autonome.
Angle possible pour une vidéo YouTube : "NVIDIA divise le coût de l'IA par 10 : La fin des GPU classiques et l'avènement de l'IA physique open-source."
Source originale : NVIDIA / CES 2026 Keynote
URL directe : 28

Date : 12/06/2026
Catégorie : LLM / Agent IA / Automatisation
Résumé technique : Moonshot AI publie Kimi K2.7-Code, un modèle MoE de 1T paramètres (32B actifs/token) optimisé pour les tâches de coding à long horizon. Poids ouverts sous licence MIT modifiée. Il gère nativement la planification multi-étapes, le debug, l'appel d'outils MCP et le refactoring de bases de code. Consomme ~30% moins de tokens de raisonnement que K2.6 et dépasse Claude Opus 4.8 sur le benchmark MCP Mark Verified. 29
Pourquoi c’est intéressant : Offre une alternative open, économique et performante aux modèles fermés pour l'automatisation du développement. La réduction des tokens de raisonnement et le contexte de 256K tokens permettent des workflows CI/CD et de review de code entièrement autonomes, hébergables en interne pour une meilleure sécurité des données.
Angle possible pour une vidéo YouTube : "Moins cher et plus rapide que Claude pour coder ? Test complet de Kimi K2.7-Code, le nouvel agent open-source des devs."
Source originale : Moonshot AI / MarkTechPost
URL directe : 29

Date : 11/06/2026
Catégorie : Agent IA / Automatisation / Outillage
Résumé technique : Application desktop (macOS/Windows) d'exécution locale pilotée par le modèle K2.6. Fonctionne via un "Agent Swarm" coordonnant jusqu'à 300 sous-agents en parallèle. Intègre WebBridge (pilote le navigateur réel avec sessions/logins actifs), un moteur cron natif pour l'orchestration de tâches planifiées, et l'accès direct au système de fichiers local. Les modifications requièrent une validation explicite ("Ask before acting"). 31
Pourquoi c’est intéressant : Contourne les limites des agents cloud (sandbox, latence, fuite de données) en agissant directement sur l'environnement de travail de l'utilisateur. Idéal pour les knowledge workers : synthèse documentaire automatique, collecte de données web planifiée, génération de rapports Excel/PPT, le tout sans dépendre d'API externes ou de serveurs tiers.
Angle possible pour une vidéo YouTube : "Fini les assistants cloud : Comment Kimi Work automatise votre PC en local (fichiers, navigateur, planning) sans fuiter vos données."
Source originale : Moonshot AI / MarkTechPost
URL directe : 31

Date : 13/06/2026
Catégorie : LLM / Méthode / Outil
Résumé technique : Zyphra release la famille Zamba2-VL (1.2B, 2.7B, 7B) basée sur un backbone hybride couplant des couches d'état Mamba2 (complexité linéaire) à des blocs Transformer partagés via LoRA. Architecture LLaVA-style avec encodeur Qwen2.5-VL. Réduit le Time-to-First-Token (TTFT) d'un ordre de grandeur grâce à un état récurrent fixe et une préremplissage non quadratique. Excellentes performances en compréhension documentaire et comptage visuel. 32
Pourquoi c’est intéressant : Résout le goulot d'étranglement de la latence des VLMs sur matériel contraint (edge, robotique mobile, assistants locaux). Le compromis SSM/Transformer permet une inférence ultra-rapide sans sacrifier la précision sur les tâches de parsing et d'extraction, rendant l'IA visuelle multi-image viable hors-cloud.
Angle possible pour une vidéo YouTube : "10x plus rapide qu'un Transformer ? Décryptage de Zamba2-VL, le modèle visuel qui révolutionne l'IA en local."
Source originale : Zyphra / MarkTechPost
URL directe : 32