Шлейка дозволяє пройти набагато далі просто йоло, але продуктивність можна значно покращити за допомогою трохи профілювання. Що ж використовує контекст? Що займає простір, подивіться на сліди. що накопичується в пам'яті. Що таке помилка і кидання помилок. Що займає надто багато часу (у 300 разів задовго)(бо завантаження відбувається у FP32 замість FP16 і перемикається в системну пам'ять).
Які схильності цієї моделі? Що можна побудувати в навколишньому середовищі, щоб покращити можливості на основі цих схильностей? Як можна покращити довготривалу послідовність, пам'ять
48