Ollama 0.133 - Enfin une gestion en parallèle des LLMs

Publié initialement à : Ollama 0.133 – Enfin une gestion en parallèle des LLMs

Ollama 0.133 introduit des fonctionnalités expérimentales de parallélisme pour optimiser les applications IA. Grâce aux variables d’environnement OLLAMA_NUM_PARALLEL et OLLAMA_MAX_LOADED_MODELS, les développeurs peuvent gérer plusieurs modèles et requêtes simultanément. De nouveaux modèles IA sont aussi supportés.