モデルたちはPatio11-As-A-Serviceで本当に上手くなっています。 (私はよく、オンブズマンのような介入や消費者として金融業界と関わる際の助言を求めるメールを受け取ります。時々SOTAを確認するために、その中の事実をモデルに入力することもあります。
代表的な例: ユーザー:(5段落にわたる説明)アカウントはおそらく閉鎖されるのでしょうか? 私自身に:非常にありえない、その理由は4つ。 私がモデルとして示すと:このユーザーに何に返信し、(別に)実際のグラウンドトゥルースについてコメントするか。
モデル:こちらは、私がまだ見ていないメールで実際に説明した通りの75%の整合性を示し、グラウンドトゥルースでは95%の整合を示しています。
このクエリを実行するモデルの中には、インターネットコーパスやその他のトレーニングデータに加え、多くの類似したメールやBAMのドラフティングセッションのプライベートメモリも持っているため、箱から出したものよりも適しているモデルもあります。
しかし、メモリがなくても、私の気軽な実験やこれまでの何十人もの人から報告されたところによると、最先端の技術は「箱から出してすぐにかなり効果的だ」という点に心強く感じています。
(これはオンブズマン的な問題を送ってほしいというお願いではありませんが、私の雇用や考え方に関係なく、世界はそういう状況を続けており、金融業界との関わりで人々が正当な結果を得られることを望み続けているので、引き続き関心を持ち続けます。)
(20代の大部分は、無料で銀行宛の手紙を書くことに費やしていますが、40代の今は生活や仕事の義務でほとんど実現不可能ですが、今ではほぼ無限にスケーラブルな技術ができてとても嬉しいです。)
ちょっとしたコメントですが、さまざまな規制当局でほぼフルタイムの仕事をしている人もいて、似た性質の仕事をしているかもしれません。おそらく、一般の人たちのスキルレベルの違いなどで、よりイライラするメールが集まっているでしょう。
その多くは、規制対象の金融機関で電話のやり取り(または紙面の対応)を行い、これまでに起きた顧客の懸念により注意を払うよう促すことです。 規制当局が「これをLLMで強化すべきかもしれない」と判断するのも想像できるかもしれません。
2025年にすぐにそれを起動しない理由は様々ですが、それらの理由が必ずしも永続的であるとは思いません。
@michael_nielsen 職人的なバージョンは「名前は、イメージを表現するようなイメージとして、アイデアスペースの指針になり得る」というものでした。 LLMのバージョンは「本当に助かります、重みを見てください」というものでした。
@michael_nielsen 人だけでなく、作品もこのための魔法の呪文になり得ると思います。「Like a State」を見ることは、ドイツの林業管理について実際に読んだことがなくても、多くのテック関係者にとって意味を持ちますし、LLMもその指針に従うことができます。
@michael_nielsen 一生懸命働いた報酬が宇宙に新たな呪文を語りかけることなんて素晴らしい時代なんでしょう。それはますます印象的な説明ではなく、「いや、人類全体、そしておそらく永遠にその綴りをクローンで消すだけだ」という意味でなおさらです。
13.3K