⚠️ Os pesos refletem a importancia relativa de cada parametro para inferencia de LLMs. Ajuste conforme seu caso de uso. A soma total deve ser 1.00 para resultados corretos.
Os pesos determinam a importância de cada parâmetro no cálculo do Índice de Performance.
RAM (Wram): Memória disponível para carregar o modelo.
Bandwidth (Wbw): Velocidade de transferência de dados.
GPU (Wgpu): Paralelismo para inferência.
CPU (Wcpu): Processamento e tokenização.
Neural Engine (Wne): Aceleração dedicada de IA.