NVIDIA lance des microservices NIM pour l’IA générative au Japon et à Taiwan

Les nations du monde entier recherchent une IA souveraine pour produire une intelligence artificielle en utilisant leurs propres infrastructures informatiques, données, main-d’œuvre et réseaux d’entreprise afin de garantir que les systèmes d’IA s’alignent sur les valeurs, les lois et les intérêts locaux.

Pour soutenir ces efforts, NVIDIA a annoncé aujourd’hui la disponibilité de quatre nouveaux microservices NVIDIA NIM qui permettent aux développeurs de créer et de déployer plus facilement des applications d’IA générative hautes performances.

Les microservices prennent en charge des modèles communautaires populaires adaptés pour répondre aux besoins régionaux. Ils améliorent les interactions des utilisateurs grâce à une compréhension précise et des réponses améliorées basées sur les langues locales et le patrimoine culturel.

Dans la seule région Asie-Pacifique, les revenus des logiciels d’IA générative devraient atteindre 48 milliards de dollars d’ici 2030, contre 5 milliards de dollars cette année, selon ABI Research.

Llama-3-Swallow-70B, formé sur des données japonaises, et Llama-3-Taiwan-70B, formé sur des données mandarin, sont des modèles linguistiques régionaux qui permettent une compréhension plus approfondie des lois, réglementations et autres coutumes locales.

La famille de modèles RakutenAI 7B, construite sur Mistral-7B, a été formée sur des ensembles de données anglais et japonais et est disponible sous la forme de deux microservices NIM différents pour Chat et Instruct. Les modèles de base et d’instruction de Rakuten ont obtenu les meilleurs scores parmi les grands modèles de langage japonais ouverts, obtenant le score moyen le plus élevé dans le benchmark LM Evaluation Harness réalisé de janvier à mars 2024.

La formation d’un grand modèle linguistique (LLM) sur les langues régionales améliore l’efficacité de ses résultats en garantissant une communication plus précise et nuancée, car il comprend et reflète mieux les subtilités culturelles et linguistiques.

Les modèles offrent des performances de pointe pour la compréhension du japonais et du mandarin, les tâches juridiques régionales, la réponse aux questions, ainsi que la traduction et le résumé linguistiques par rapport aux LLM de base comme Llama 3.

Des pays du monde entier – de Singapour, des Émirats arabes unis, de la Corée du Sud et de la Suède à la France, l’Italie et l’Inde – investissent dans une infrastructure souveraine d’IA.

Les nouveaux microservices NIM permettent aux entreprises, aux agences gouvernementales et aux universités d’héberger des LLM natifs dans leurs propres environnements, permettant ainsi aux développeurs de créer des copilotes, des chatbots et des assistants IA avancés.

Développement d’applications avec des microservices NIM d’IA souverains

Les développeurs peuvent facilement déployer les modèles d’IA souverains, regroupés sous forme de microservices NIM, en production tout en améliorant les performances.

Les microservices, disponibles avec NVIDIA AI Enterprise, sont optimisés pour l’inférence avec la bibliothèque open source NVIDIA TensorRT-LLM.

Les microservices NIM pour Llama 3 70B – qui ont été utilisés comme modèle de base pour les nouveaux microservices NIM Llama-3-Swallow-70B et Llama-3-Taiwan-70B – peuvent fournir un débit jusqu’à 5 fois supérieur. Cela réduit le coût total de fonctionnement des modèles en production et offre de meilleures expériences utilisateur en diminuant la latence.

Les nouveaux microservices NIM sont disponibles aujourd’hui sous forme d’interfaces de programmation d’applications (API) hébergées.

Exploiter NVIDIA NIM pour des résultats d’IA générative plus rapides et plus précis

Les microservices NIM accélèrent les déploiements, améliorent les performances globales et fournissent la sécurité nécessaire aux organisations de tous les secteurs mondiaux, notamment la santé, la finance, la fabrication, l’éducation et le droit.

L’Institut de technologie de Tokyo a affiné Llama-3-Swallow 70B à l’aide de données en japonais.

« Les LLM ne sont pas des outils mécaniques offrant les mêmes avantages à tout le monde. Ce sont plutôt des outils intellectuels qui interagissent avec la culture et la créativité humaines. L’influence est mutuelle : non seulement les modèles sont affectés par les données sur lesquelles nous nous entraînons, mais aussi notre culture et les données que nous générons seront influencées par les LLM », a déclaré Rio Yokota, professeur au Global Scientific Information and Computing Center de Tokyo. Institut de Technologie. « Il est donc primordial de développer des modèles d’IA souverains qui respectent nos normes culturelles. La disponibilité de Llama-3-Swallow en tant que microservice NVIDIA NIM permettra aux développeurs d’accéder et de déployer facilement le modèle pour les applications japonaises dans divers secteurs.

Par exemple, une société japonaise d’IA, Preferred Networks, utilise ce modèle pour développer un modèle spécifique aux soins de santé, formé sur un corpus unique de données médicales japonaises, appelé Llama3-Preferred-MedSwallow-70B, qui obtient les meilleurs résultats à l’examen national japonais pour les médecins.

L’hôpital Chang Gung Memorial (CGMH), l’un des principaux hôpitaux de Taiwan, construit un service d’inférence d’IA (AIIS) sur mesure pour centraliser toutes les applications LLM au sein du système hospitalier. Grâce à Llama 3-Taiwan 70B, l’entreprise améliore l’efficacité du personnel médical de première ligne grâce à un langage médical plus nuancé que les patients peuvent comprendre.

“En fournissant des conseils instantanés et adaptés au contexte, les applications d’IA construites avec des LLM en langue locale rationalisent les flux de travail et servent d’outil d’apprentissage continu pour soutenir le développement du personnel et améliorer la qualité des soins aux patients”, a déclaré le Dr Changfu Kuo, directeur du Centre. pour l’Intelligence Artificielle en Médecine au CGMH, Branche Linko. “NVIDIA NIM simplifie le développement de ces applications, permettant un accès et un déploiement faciles de modèles formés sur les langues régionales avec une expertise minimale en ingénierie.”

Pegatron, basé à Taiwan, un fabricant d’appareils électroniques, adoptera le microservice Llama 3-Taiwan 70B NIM pour les applications internes et externes. Elle l’a intégré à son système d’IA agentique PEGAAi pour automatiser les processus, améliorant ainsi l’efficacité de la fabrication et des opérations.

Llama-3-Taiwan 70B NIM est également utilisé par le fabricant pétrochimique mondial Chang Chun Group, le leader mondial des cartes de circuits imprimés Unimicron, la société de médias axée sur la technologie TechOrange, la société de services contractuels en ligne LegalSign.ai et la startup d’IA générative APMIC. Ces entreprises collaborent également sur le modèle ouvert.

Création de modèles d’entreprise personnalisés avec NVIDIA AI Foundry

Même si les modèles d’IA régionaux peuvent fournir des réponses culturellement nuancées et localisées, les entreprises doivent encore les affiner en fonction de leurs processus métier et de leur expertise dans le domaine.

NVIDIA AI Foundry est une plate-forme et un service qui incluent des modèles de base populaires, NVIDIA NeMo pour un réglage précis et une capacité dédiée sur NVIDIA DGX Cloud pour fournir aux développeurs une solution complète pour créer un modèle de base personnalisé présenté sous forme de microservice NIM.

De plus, les développeurs utilisant NVIDIA AI Foundry ont accès à la plate-forme logicielle NVIDIA AI Enterprise, qui offre sécurité, stabilité et prise en charge des déploiements de production.

NVIDIA AI Foundry offre aux développeurs les outils nécessaires pour créer et déployer plus rapidement et plus facilement leurs propres microservices NIM personnalisés en langage régional pour alimenter les applications d’IA, garantissant ainsi des résultats culturellement et linguistiquement appropriés pour leurs utilisateurs.

More Info

Greatly hearted has who believe. Drift allow green son walls years for blush. Sir margaret drawings repeated recurred exercise.

You have been successfully Subscribed! Ops! Something went wrong, please try again.

Quick Links

Services

About Me

Projects

Contact

Address

+1-(360) 416-7563

Phone Number

FelicitymcDowell@mail.com

Email Address

© 2024 Created with Royal Elementor Addons