オープンLoRAこそがスケールが実用的な場面です。 推論需要が加速する中で、1つのGPUで1,000+のLoRAアダプターを処理でき、推論あたりのエネルギーコストを99%以上削減できます。 そうすればモデル切り替えが安価かつ迅速になります。