Hat jemand eine gute Quelle für den Stand der Technik bei der lokalen Inferenz von LLM, die nicht selbst schlampig oder arm ist und versucht, jeden Cent zu sparen?