Catálogo de modelos open source

Catálogo de modelos

Filtra modelos abiertos por tamaño, memoria y licencia — desplegamos cualquiera de forma privada, en tu hardware.

Modelo	Parámetros	VRAM mín.	Licencia	Ideal para
Phi-3.5 mini	3.8B	4 GB	MIT	Edge & on-device
Mistral 7B	7B	6 GB	Apache 2.0	Fast assistants
Llama 3.1 8B	8B	8 GB	Llama 3.1	Copilots & chat
Qwen 2.5 7B	7B	8 GB	Apache 2.0	Multilingual chat
Gemma 2 9B	9B	10 GB	Gemma	Lightweight tasks
Gemma 2 27B	27B	20 GB	Gemma	Balanced quality
Qwen 2.5 32B	32B	24 GB	Apache 2.0	Reasoning & analysis
Mixtral 8x7B	47B MoE	24 GB	Apache 2.0	Throughput & RAG
Llama 3.3 70B	70B	40 GB	Llama 3.3	High-quality reasoning
Qwen 2.5 72B	72B	40 GB	Qwen	Complex tasks
Mixtral 8x22B	141B MoE	80 GB	Apache 2.0	Enterprise workloads
Llama 3.1 405B	405B	Multi-GPU	Llama 3.1	Maximum quality
DeepSeek R1	671B MoE	Multi-GPU	MIT	Frontier reasoning
Falcon 180B	180B	Multi-GPU	Falcon	Large-scale serving

VRAM mínima orientativa para inferencia cuantizada; dimensionamos el hardware exacto según el caso de uso.