¿Alguien tiene una buena fuente de inferencia local de vanguardia en LLM que no sea en sí misma una basura o que intenta ahorrar un poco más?