2024-2026
KARL
Chatbot RAG d'intelligence cloud en production chez Orange Business. Intégration multi-LLM locale (Llama 3.3 70B, DeepSeek R1, QwQ 32B) via vLLM sur GPU H100 NVL et L40S, orchestration LangChain + ChromaDB. Conçu pour des réponses auditables, pas pour la démo.
LangChain · ChromaDB · vLLM · H100 NVL · Llama 3.3 70B · DeepSeek R1 · RAG · Python