oLLM:一個輕量級的 Python 庫,用於基於 transformers 的 LLM 推理 🔥 在消費級硬體上運行 qwen3-next-80B、GPT-OSS、Llama3。Anuar 的精彩工作!