Catálogo de modelos
Catálogo de modelos open source
Filtra modelos abiertos por tamaño, memoria y licencia — desplegamos cualquiera de forma privada, en tu hardware.
| Modelo | Parámetros | VRAM mín. | Licencia | Ideal para |
|---|---|---|---|---|
| Phi-3.5 mini | 3.8B | 4 GB | MIT | Edge & on-device |
| Mistral 7B | 7B | 6 GB | Apache 2.0 | Fast assistants |
| Llama 3.1 8B | 8B | 8 GB | Llama 3.1 | Copilots & chat |
| Qwen 2.5 7B | 7B | 8 GB | Apache 2.0 | Multilingual chat |
| Gemma 2 9B | 9B | 10 GB | Gemma | Lightweight tasks |
| Gemma 2 27B | 27B | 20 GB | Gemma | Balanced quality |
| Qwen 2.5 32B | 32B | 24 GB | Apache 2.0 | Reasoning & analysis |
| Mixtral 8x7B | 47B MoE | 24 GB | Apache 2.0 | Throughput & RAG |
| Llama 3.3 70B | 70B | 40 GB | Llama 3.3 | High-quality reasoning |
| Qwen 2.5 72B | 72B | 40 GB | Qwen | Complex tasks |
| Mixtral 8x22B | 141B MoE | 80 GB | Apache 2.0 | Enterprise workloads |
| Llama 3.1 405B | 405B | Multi-GPU | Llama 3.1 | Maximum quality |
| DeepSeek R1 | 671B MoE | Multi-GPU | MIT | Frontier reasoning |
| Falcon 180B | 180B | Multi-GPU | Falcon | Large-scale serving |
Ningún modelo coincide con el filtro.
VRAM mínima orientativa para inferencia cuantizada; dimensionamos el hardware exacto según el caso de uso.