IA Limos/Isima✯
Point d'accès✯
- URL: https://ia.limos.fr
Services✯
- Chat - Chat avec les modèles de langage
- RAG - Retrieval-Augmented Generation pour interroger vos documents
- API - Accès programmatique aux modèles de langage
Models actuels✯
dev-model: Orienté vers les tâches de développement et pour l'agentic
general: Modèle généraliste pour les tâches de chat classiques avec raisonnement
general_nothink: Variante de general sans capacités de raisonnement
| Model | Tokens | Params | Active | Aliases | Capacités |
|---|---|---|---|---|---|
| MiniMax-M2.7 | 196608 | 230B | 10B | dev-model | Chat, Agentic |
| Mistral-Small4 | 262144 | 119B | 6.5B | general, general_nothink | Chat, Agentic, VL (img) |
| bge-m3 | 8192 | 1B | embedding | Embedding |
Hardware✯
- 4x H100 (90GB RAM chacune) = 360GB total
- 1x H200 (140GB RAM)
Changelogs✯
v1 (20/04/2026)✯
- Changements d'URLs
- Reset de OpenWebUI
- Reset de toutes les clés LiteLLM
- Ouverture aux enseignants/chercheurs
- Déploiement de Ragondin (rag.ia.limos.fr)
- Re déploiement des différents services
v0.5 (13/04/2026)✯
- Mise a jour vers Minimax M2.7
- Mise en place de Proxy pour Searxng
v0.4 (31/03/2026)✯
- Les call API passent désormais par LiteLLM
- Connexion a OpenWebUI avec le SSO
- Gestion des tokens depuis https://keymgr.limos.fr
- Mistral Small4 remplace Qwen3.5
- Ajout d'un alias general-nothink qui désactive le raisonnement
- Model d'embedding BAAI/bge-m3
Modifier l'API_URL dans vos configs par https://litellm.limos.fr/v1
Le token se gènère sur https://keymgr.limos.fr
v0.3 (25/02/2026)✯
- Changement des models : MiniMax (dev) et Qwen3.5 (generaliste)
- Qwen3.5 supporte le VL nativement (image, vidéo, audio, screenshot)
- Export des métriques des VLLm via Prometheus
- Graphiques d'utilisation des ressources dans Grafana
v0.2 (12/02/2026)✯
- Changement des models : DevStral remplacé par GLM-4.7
- Ajout d'une CLI pour piloter les modèles
- Gestion des clés API via LiteLLM
v0.1 (06/01/2026)✯
- Mise à disposition d'OpenWebUI utilisant LiteLLM
- Recherche web via SearxNG (auto-hébergé, service séparé)
- Génération de clés API via OpenWebUI
- Models disponibles : DevStral-123b, gpt-oss-120b