Hezký pokles z @philipkiely a @Basetenco. 📗 Inference Engineering mapuje stack moderní AI inference — runtime, infrastrukturu a nástroje — a zabývá se praktickými detaily servisu LLM na NVIDIA GPU pomocí TensorRT LLM a Dynamo. NEROZUMÍM — STOJÍ ZA PŘEČTENÍ. 👇