パーソナライズされたAIを提供することがインフラの悪夢ではなくなりました。 OpenLoRAは、アダプタをメモリに永久に保持するのではなく、リクエストごとにロードします。 1つのGPUは1000+の動作を何の苦労もなく提供できます。