NVIDIA et Microsoft ont dévoilé aujourd’hui des intégrations de produits conçues pour faire progresser le développement NVIDIA AI full-stack sur les plates-formes et applications Microsoft.
Lors de Microsoft Ignite, Microsoft a annoncé le lancement de la première version cloud privée de la série de machines virtuelles Azure ND GB200 V6, basée sur la plateforme NVIDIA Blackwell. L’Azure ND GB200 v6 sera une nouvelle série de machines virtuelles (VM) optimisées pour l’IA et combine la conception du rack NVIDIA GB200 NVL72 avec le réseau NVIDIA Quantum InfiniBand.
De plus, Microsoft a révélé qu’Azure Container Apps prend désormais en charge les GPU NVIDIA, permettant un déploiement d’IA simplifié et évolutif. De plus, la plateforme NVIDIA AI sur Azure comprend de nouveaux flux de travail de référence pour l’IA industrielle et un NVIDIA Omniverse Blueprint pour créer des visuels immersifs basés sur l’IA.
Lors d’Ignite, NVIDIA a également annoncé des modèles de petit langage multimodaux (SLM) pour les PC et postes de travail RTX AI, améliorant les interactions humaines numériques et les assistants virtuels avec un plus grand réalisme.
NVIDIA Blackwell propulse l’IA de nouvelle génération sur Microsoft Azure
La nouvelle série de machines virtuelles Azure ND GB200 V6 de Microsoft exploitera les puissantes performances des superpuces NVIDIA GB200 Grace Blackwell, associées à la mise en réseau avancée NVIDIA Quantum InfiniBand. Cette offre est optimisée pour les charges de travail d’apprentissage profond à grande échelle afin d’accélérer les percées dans le traitement du langage naturel, la vision par ordinateur et bien plus encore.
La série de machines virtuelles basée sur Blackwell complète les clusters Azure AI annoncés précédemment avec des machines virtuelles ND H200 V5, qui fournissent une mémoire à bande passante élevée accrue pour une meilleure inférence d’IA. Les machines virtuelles ND H200 V5 sont déjà utilisées par OpenAI pour améliorer ChatGPT.
Azure Container Apps permet l’inférence d’IA sans serveur avec le calcul accéléré NVIDIA
L’informatique sans serveur offre aux développeurs d’applications d’IA une agilité accrue pour déployer, faire évoluer et itérer rapidement les applications sans se soucier de l’infrastructure sous-jacente. Cela leur permet de se concentrer sur l’optimisation des modèles et l’amélioration des fonctionnalités tout en minimisant les frais opérationnels.
La plateforme de conteneurs sans serveur Azure Container Apps simplifie le déploiement et la gestion des applications basées sur des microservices en faisant abstraction de l’infrastructure sous-jacente.
Azure Container Apps prend désormais en charge les charges de travail accélérées par NVIDIA avec des GPU sans serveur, permettant aux développeurs d’utiliser la puissance du calcul accéléré pour les applications d’inférence d’IA en temps réel dans un environnement sans serveur flexible, basé sur la consommation. Cette fonctionnalité simplifie les déploiements d’IA à grande échelle tout en améliorant l’efficacité des ressources et les performances des applications sans le fardeau de la gestion de l’infrastructure.
Les GPU sans serveur permettent aux équipes de développement de se concentrer davantage sur l’innovation et moins sur la gestion de l’infrastructure. Grâce à la facturation à la seconde et aux capacités d’évolutivité jusqu’à zéro, les clients ne paient que pour le calcul qu’ils utilisent, ce qui contribue à garantir que l’utilisation des ressources est à la fois économique et efficace. NVIDIA travaille également avec Microsoft pour intégrer les microservices NVIDIA NIM aux GPU NVIDIA sans serveur dans Azure afin d’optimiser les performances du modèle d’IA.
NVIDIA dévoile des workflows de référence Omniverse pour les applications 3D avancées
NVIDIA a annoncé des flux de travail de référence qui aident les développeurs à créer des applications de simulation 3D et de jumeaux numériques sur NVIDIA Omniverse et Universal Scene Description (OpenUSD), accélérant ainsi l’IA industrielle et faisant progresser la créativité basée sur l’IA.
Un workflow de référence pour la surveillance 3D à distance des opérations industrielles sera bientôt disponible pour permettre aux développeurs de connecter des modèles 3D physiquement précis de systèmes industriels aux données en temps réel d’Azure IoT Operations et de Power BI.
Ces deux services Microsoft s’intègrent aux applications basées sur NVIDIA Omniverse et OpenUSD pour fournir des solutions pour les cas d’utilisation de l’IoT industriel. Cela aide les équipes d’opérations à distance à accélérer la prise de décision et à optimiser les processus dans les installations de production.
Le modèle Omniverse pour une IA générative visuelle précise permet aux développeurs de créer des applications qui permettent aux équipes non techniques de générer des visuels améliorés par l’IA tout en préservant les actifs de la marque. Le plan prend en charge des modèles tels que SDXL et Shutterstock Generative 3D pour rationaliser la création d’images générées par l’IA pour la marque.
Des groupes créatifs de premier plan, notamment Accenture Song, Collective, GRIP, Monks et WPP, ont adopté ce plan NVIDIA Omniverse pour personnaliser et personnaliser les images sur tous les marchés.
Accélérer la génération AI pour Windows avec les PC RTX AI
La collaboration de NVIDIA avec Microsoft s’étend jusqu’à apporter des capacités d’IA aux appareils informatiques personnels.
Lors d’Ignite, NVIDIA a annoncé son nouveau SLM multimodal, NVIDIA Nemovision-4B Instruct, pour comprendre l’imagerie visuelle dans le monde réel et à l’écran. Il arrivera bientôt sur les PC et les postes de travail RTX AI et ouvrira la voie à des interactions humaines numériques plus sophistiquées et plus réalistes.
De plus, les mises à jour de NVIDIA TensorRT Model Optimizer (ModelOpt) offrent aux développeurs Windows un moyen d’optimiser un modèle pour le déploiement d’ONNX Runtime. TensorRT ModelOpt permet aux développeurs de créer des modèles d’IA pour PC qui sont plus rapides et plus précis lorsqu’ils sont accélérés par les GPU RTX. Cela permet aux grands modèles de s’adapter aux contraintes des environnements PC, tout en facilitant le déploiement pour les développeurs dans l’écosystème PC avec les environnements d’exécution ONNX.
Les PC et postes de travail compatibles RTX AI offrent des outils de productivité améliorés, des applications créatives et des expériences immersives alimentées par le traitement local de l’IA.
Collaboration full-stack pour le développement de l’IA
Le vaste écosystème de partenaires et de développeurs de NVIDIA apporte une multitude d’options d’IA et de calcul haute performance à la plateforme Azure.
SoftServe, un fournisseur mondial de conseils informatiques et de services numériques, a annoncé aujourd’hui la disponibilité de SoftServe Gen AI Industrial Assistant, basé sur NVIDIA AI Blueprint pour l’extraction de données PDF multimodales, sur la place de marché Azure. L’assistant relève les défis critiques du secteur manufacturier en utilisant l’IA pour améliorer la maintenance des équipements et améliorer la productivité des travailleurs.
Lors du salon Ignite, AT&T présentera comment elle utilise NVIDIA AI et Azure pour améliorer l’efficacité opérationnelle, augmenter la productivité des employés et stimuler la croissance de l’entreprise grâce à la génération augmentée par récupération et aux assistants et agents autonomes.
Apprenez-en davantage sur la collaboration et les sessions entre NVIDIA et Microsoft sur Ignite.
Voir avis concernant les informations sur les produits logiciels.