Model Garden propose des modèles ouverts et des modèles partenaires à déployer vous-même que vous pouvez déployer et diffuser sur Vertex AI. Ces modèles sont différents des offres de modèles en tant que service (MaaS), qui sont sans serveur et ne nécessitent aucun déploiement manuel.
Lorsque vous déployez des modèles vous-même, vous le faites de manière sécurisée dans votre projet Google Cloud et votre réseau VPC.
Modèles ouverts à déployer soi-même
Les modèles ouverts fournissent des capacités pré-entrainées pour diverses tâches d'IA, y compris les modèles Gemini qui excellent dans le traitement multimodal. Un modèle ouvert est disponible gratuitement. Vous êtes libre de publier ses résultats, et il peut être utilisé n'importe où, à condition de respecter les conditions de licence. Vertex AI propose des modèles ouverts (également appelés poids ouverts) et Open Source.
Lorsque vous utilisez un modèle ouvert avec Vertex AI, vous utilisez Vertex AI pour votre infrastructure. Vous pouvez également utiliser des modèles ouverts avec d'autres produits d'infrastructure, tels que PyTorch ou Jax.
Modèles à pondération ouverte
De nombreux modèles ouverts sont considérés comme des grands modèles de langage (LLM) à poids ouvert. Les modèles ouverts offrent plus de transparence que les modèles qui ne sont pas à pondération ouverte. Les pondérations d'un modèle sont les valeurs numériques stockées dans l'architecture de réseau de neurones du modèle, qui représentent les relations et modèles appris à partir des données sur lesquelles un modèle est entraîné. Les paramètres pré-entraînés, ou pondérations, des modèles à pondération ouverte sont publiés. Vous pouvez utiliser un modèle à pondération ouverte pour l'inférence et le réglage, tandis que des détails tels que l'ensemble de données d'origine, l'architecture du modèle et le code d'entraînement ne sont pas fournis.
Modèles Open Source
Les modèles ouverts sont différents des modèles d'IA Open Source. Bien que les modèles ouverts exposent souvent les pondérations et la représentation numérique de base des modèles appris, ils ne fournissent pas nécessairement le code source complet ni les détails de l'entraînement. Fournir des pondérations offre un niveau de transparence du modèle d'IA, ce qui vous permet de comprendre ses capacités sans avoir à le créer vous-même.
Modèles de partenaires à déployer soi-même
Model Garden vous aide à acheter et à gérer des licences de modèles auprès de partenaires qui proposent des modèles propriétaires en tant qu'option de déploiement automatique. Une fois que vous avez acheté l'accès à un modèle sur Cloud Marketplace, vous pouvez choisir de le déployer sur du matériel à la demande ou d'utiliser vos réservations Compute Engine et vos remises sur engagement d'utilisation pour répondre à vos exigences budgétaires. L'utilisation du modèle et l'infrastructure Vertex AI que vous utilisez vous sont facturées.
Pour demander l'utilisation d'un modèle partenaire à déployer vous-même, recherchez le modèle approprié dans la console Model Garden, cliquez sur Contacter le service commercial, puis remplissez le formulaire, ce qui déclenche le contact avec un Google Cloud représentant commercial.
Pour en savoir plus sur le déploiement et l'utilisation de modèles partenaires, consultez Déployer un modèle partenaire et envoyer des requêtes de prédiction.
Remarques
Tenez compte des limitations suivantes lorsque vous utilisez des modèles partenaires à déployer vous-même:
- Contrairement aux modèles ouverts, vous ne pouvez pas exporter de pondérations.
- Si vous avez configuré VPC Service Controls pour votre projet, vous ne pouvez pas importer de modèles, ce qui vous empêche de déployer des modèles partenaires.
- Pour les points de terminaison, seul le type point de terminaison public partagé est accepté.
En savoir plus sur les modèles auto-déployés dans Vertex AI
- Pour en savoir plus sur Model Garden, consultez la page Présentation de Model Garden.
- Pour en savoir plus sur le déploiement de modèles, consultez Utiliser des modèles dans Model Garden.
- Utiliser les modèles ouverts Gemma
- Utiliser les modèles ouverts Llama
- Utiliser les modèles ouverts Hugging Face