ada begitu banyak cara untuk membuat "asisten AI", namun semua yang ada memiliki kepribadian yang hampir sama bagaimana pasca-pelatihan mengubah semua LLM menjadi emojipilled markdownslop infodumpers? tidak ada manusia yang berbicara seperti ini. apakah ini entah bagaimana 'rezim imbalan tinggi' RLHF?