🚀 Seletor de Modelos LLM por Hardware

Selecione seu hardware e descubra quais LLMs cabem na sua VRAM.

🎯 Selecione seu Hardware:

Ollama

LM Studio

HuggingFace

🎮 Selecione um hardware acima para ver os modelos compatíveis

📊 Legenda de Quantizações e Capacidades

FP16: Precisão total

Q8_0: Alta qualidade (~50% memória)

Q6_K: Boa qualidade (~40% memória)

Q5_K_M: Qualidade equilibrada (~35% memória)

Q4_K_M: Popular, boa compressão (~25% memória)

Q3_K_M: Compacto (~20% memória)

⚡ Capacidades Especiais dos Modelos:

👁️ VISION Análise de imagens, OCR, visão computacional

🛠️ TOOLS Function calling, APIs, automação de tarefas

🧠 REASONING Raciocínio complexo, matemática, lógica step-by-step

💡 Nota: Apple Silicon (M4/M5) usa memória unificada e tem excelente performance mesmo com quantizações menores. GPUs NVIDIA RTX, AMD Radeon e Intel Arc usam VRAM dedicada. ~10% da VRAM é reservada para KV cache e overhead do sistema.