RL aracı kullanımı (Anthropic), RL düşüncesinden (OpenAI) daha değerli çıktı.