Les entreprises recherchent des ressources informatiques de plus en plus puissantes pour prendre en charge leurs charges de travail d’IA et accélérer le traitement des données. L’efficacité gagnée peut se traduire par de meilleurs retours sur investissement dans la formation et le réglage fin de l’IA, ainsi que par une expérience utilisateur améliorée pour l’inférence de l’IA.
Lors de la conférence Oracle CloudWorld d’aujourd’hui, Oracle Cloud Infrastructure (OCI) a annoncé le premier supercluster OCI zettascale, accéléré par la plateforme NVIDIA Blackwell, pour aider les entreprises à former et à déployer des modèles d’IA de nouvelle génération en utilisant plus de 100 000 GPU de dernière génération de NVIDIA.
Les superclusters OCI permettent aux clients de choisir parmi une large gamme de GPU NVIDIA et de les déployer n’importe où : sur site, dans le cloud public et dans le cloud souverain. Prévus pour être disponibles au premier semestre de l’année prochaine, les systèmes basés sur Blackwell peuvent évoluer jusqu’à 131 072 GPU Blackwell avec des cartes réseau NVIDIA ConnectX-7 pour le réseau RoCEv2 ou NVIDIA Quantum-2 InfiniBand pour fournir un incroyable 2,4 zettaflops de calcul d’IA de pointe au nuage. (Lisez le communiqué de presse pour en savoir plus sur les supergrappes OCI.)
Lors du salon, Oracle a également présenté en avant-première les instances nues NVIDIA GB200 NVL72 refroidies par liquide pour aider à alimenter les applications d’IA générative. Les instances sont capables d’effectuer un entraînement à grande échelle avec Quantum-2 InfiniBand et d’inférer en temps réel des modèles comportant des milliards de paramètres au sein du domaine NVIDIA NVLink étendu à 72 GPU, qui peut agir comme un GPU unique et massif.
Cette année, OCI proposera NVIDIA HGX H200, connectant huit GPU NVIDIA H200 Tensor Core dans une seule instance nue via NVLink et NVLink Switch, et évoluant jusqu’à 65 536 GPU H200 avec des cartes réseau NVIDIA ConnectX-7 sur un réseau de cluster RoCEv2. L’instance est disponible à la commande pour les clients souhaitant fournir une inférence en temps réel à grande échelle et accélérer leurs charges de travail de formation. (Lisez un blog sur les superclusters OCI avec les GPU NVIDIA B200, GB200 et H200.)
OCI a également annoncé la disponibilité générale des instances accélérées par GPU NVIDIA L40S pour les charges de travail d’IA de milieu de gamme, NVIDIA Omniverse et la visualisation. (Lisez un blog sur les superclusters OCI avec les GPU NVIDIA L40S.)
Pour les solutions à nœud unique ou multi-rack, les offres Edge d’Oracle fournissent une IA évolutive en périphérie accélérée par les GPU NVIDIA, même dans des emplacements déconnectés et distants. Par exemple, les déploiements à plus petite échelle avec le Roving Edge Device v2 d’Oracle prendront désormais en charge jusqu’à trois GPU NVIDIA L4 Tensor Core.
Les entreprises utilisent les superclusters OCI alimentés par NVIDIA pour stimuler l’innovation en matière d’IA. La startup du modèle de base Reka, par exemple, utilise les clusters pour développer des modèles d’IA multimodaux avancés afin de développer des agents d’entreprise.
« Les modèles d’IA multimodaux de Reka, construits avec les technologies OCI et NVIDIA, permettent aux agents d’entreprise de nouvelle génération capables de lire, voir, entendre et parler de donner un sens à notre monde complexe », a déclaré Dani Yogatama, cofondateur et PDG de Reka. « Grâce à l’infrastructure accélérée par GPU NVIDIA, nous pouvons gérer facilement des modèles très volumineux et des contextes étendus, tout en permettant une formation dense et clairsemée pour évoluer efficacement au niveau du cluster. »
Accélération des charges de travail de base de données Oracle d’IA générative
Oracle Autonomous Database bénéficie de la prise en charge du GPU NVIDIA pour les notebooks Oracle Machine Learning afin de permettre aux clients d’accélérer leurs charges de travail de traitement de données sur Oracle Autonomous Database.
Chez Oracle CloudWorld, NVIDIA et Oracle s’associent pour démontrer trois capacités qui montrent comment la plate-forme de calcul accélérée NVIDIA pourrait être utilisée aujourd’hui ou à l’avenir pour accélérer les composants clés des pipelines de génération augmentée par récupération d’IA générative.
Le premier montrera comment les GPU NVIDIA peuvent être utilisés pour accélérer les intégrations vectorielles en masse directement à partir d’Oracle Autonomous Database Serverless afin de rapprocher efficacement les données d’entreprise de l’IA. Ces vecteurs peuvent être recherchés à l’aide de la recherche de vecteurs AI d’Oracle Database 23ai.
La deuxième démonstration présentera un prototype de validation de principe qui utilise les GPU NVIDIA, NVIDIA RAPIDS cuVS et un cadre de déchargement développé par Oracle pour accélérer la génération d’index de graphiques vectoriels, ce qui réduit considérablement le temps nécessaire à la création d’index pour des recherches vectorielles efficaces.
La troisième démonstration illustre comment NVIDIA NIM, un ensemble de microservices d’inférence faciles à utiliser, peut améliorer les performances de l’IA générative pour les cas d’utilisation de génération et de traduction de texte sur une gamme de tailles de modèles et de niveaux de concurrence.
Ensemble, ces nouvelles fonctionnalités et démonstrations d’Oracle Database mettent en évidence la manière dont les GPU NVIDIA peuvent être utilisés pour aider les entreprises à apporter l’IA générative à leurs données structurées et non structurées hébergées ou gérées par une base de données Oracle.
IA souveraine dans le monde
NVIDIA et Oracle collaborent pour fournir une infrastructure d’IA souveraine dans le monde entier, contribuant ainsi à répondre aux besoins de résidence des données des gouvernements et des entreprises.
La startup brésilienne Wide Labs a formé et déployé Amazonia IA, l’un des premiers grands modèles linguistiques pour le portugais brésilien, en utilisant les GPU NVIDIA H100 Tensor Core et le framework NVIDIA NeMo dans les centres de données brésiliens d’OCI pour garantir la souveraineté des données.
“Le développement d’un LLM souverain nous permet d’offrir aux clients un service qui traite leurs données à l’intérieur des frontières brésiliennes, donnant à l’Amazonie une position unique sur le marché”, a déclaré Nelson Leoni, PDG de Wide Labs. “Grâce au framework NVIDIA NeMo, nous avons formé avec succès Amazônia IA.”
Au Japon, Nomura Research Institute, l’un des principaux fournisseurs mondiaux de services de conseil et de solutions système, utilise l’infrastructure Alloy d’OCI avec les GPU NVIDIA pour améliorer sa plateforme d’IA financière avec des LLM fonctionnant conformément aux réglementations financières et aux exigences de souveraineté des données.
La société de communication et de collaboration Zoom utilisera des GPU NVIDIA dans les centres de données d’OCI en Arabie Saoudite pour contribuer à la conformité aux exigences locales en matière de données.
Et la société de modélisation géospatiale RSS-Hydro démontre comment sa plate-forme de cartographie des inondations, construite sur la plate-forme NVIDIA Omniverse et alimentée par des GPU L40S sur OCI, peut utiliser des jumeaux numériques pour simuler les impacts des inondations dans la région japonaise de Kumamoto, contribuant ainsi à atténuer l’impact du changement climatique.
Ces clients font partie des nombreux pays et organisations qui créent et déploient des applications d’IA nationales optimisées par NVIDIA et OCI, favorisant la résilience économique grâce à une infrastructure d’IA souveraine.
IA prête pour l’entreprise avec NVIDIA et Oracle
Les entreprises peuvent accélérer l’automatisation des tâches sur OCI en déployant des logiciels NVIDIA tels que les microservices NIM et NVIDIA cuOpt avec les solutions cloud évolutives d’OCI. Ces solutions permettent aux entreprises d’adopter rapidement l’IA générative et de créer des flux de travail agentiques pour des tâches complexes telles que la génération de code et l’optimisation des itinéraires.
NVIDIA cuOpt, NIM, RAPIDS et bien d’autres sont inclus dans la plateforme logicielle NVIDIA AI Enterprise, disponible sur Oracle Cloud Marketplace.
En savoir plus sur Oracle CloudWorld
Rejoignez NVIDIA à Oracle CloudWorld 2024 pour découvrir comment la collaboration des entreprises apporte l’IA et le traitement accéléré des données aux organisations du monde entier.
Inscrivez-vous à l’événement pour regarder des sessions, voir des démos et rejoignez Oracle et NVIDIA pour le discours d’ouverture de la solution, « Débloquez les performances de l’IA avec la plate-forme informatique accélérée de NVIDIA » (SOL3866), le mercredi 11 septembre à Las Vegas.