- 一般化は単なるアルゴリズムです。 - (フィードバック)トランスフォーマーはGDを通じて任意のアルゴリズムを学習できます。 主な質問:どのトレーニングデータについてですか? 私の考えでは、適切に選ばれた問題に対して強化学習(RL)でトランスフォーマーを訓練すると、一般化能力が現れ、大幅に向上するでしょう。