¿Alguien tiene una buena fuente sobre el estado del arte en la inferencia local de LLM que no sea un desastre o personas pobres tratando de ahorrar centavos?