🚀 Seletor de Modelos LLM por Hardware
Selecione seu hardware e descubra quais LLMs cabem na sua VRAM.
🖥️ Tipo de Hardware:
🎮 Refinar por Família
🎯 Selecione seu Hardware:
Ollama
LM Studio
HuggingFace
🤖 Filtrar por Família de Modelo LLM:
⚡ Filtrar por Capacidades Especiais:
🎮 Selecione um hardware acima para ver os modelos compatíveis
📊 Legenda de Quantizações e Capacidades
FP16: Precisão total
Q8_0: Alta qualidade (~50% memória)
Q6_K: Boa qualidade (~40% memória)
Q5_K_M: Qualidade equilibrada (~35% memória)
Q4_K_M: Popular, boa compressão (~25% memória)
Q3_K_M: Compacto (~20% memória)
⚡ Capacidades Especiais dos Modelos:
👁️ VISION Análise de imagens, OCR, visão computacional
🛠️ TOOLS Function calling, APIs, automação de tarefas
🧠 REASONING Raciocínio complexo, matemática, lógica step-by-step
💡 Nota: Apple Silicon (M4/M5) usa memória unificada e tem excelente performance mesmo com quantizações menores. GPUs NVIDIA RTX, AMD Radeon e Intel Arc usam VRAM dedicada. ~10% da VRAM é reservada para KV cache e overhead do sistema.