DApp Store | Hub Web3 pour les événements et les jeux

Rubriques tendance

Les co-fondateurs de @flappyairplanes qualifient le paradigme actuel de RL pour l'entraînement des modèles de "brouillon environnemental." Ils expliquent : "Les paradigmes de renforcement d'aujourd'hui sont choquante inefficaces. Vous n'obtenez pas vraiment beaucoup de généralisation entre les tâches, vous enseignez un modèle à travers un type d'apprentissage et ensuite vous lui enseignez le suivant. C'est un peu comme un jeu de tape-taupe. Nous regardons cela et pensons que c'est un peu fou. Le prochain paradigme de l'IA ne sera pas un brouillon environnemental." "L'intelligence au niveau humain n'est pas le plafond, c'est simplement le sol de ce qui est possible. Si vous pouvez entraîner des modèles avec beaucoup moins de données et peut-être plus de calcul de manière très différente, que va-t-il se passer ? Nous ne savons en fait pas. Mais je pense qu'ils seront différents et étranges et qu'ils auront des capacités intéressantes que nous trouverons vraiment précieuses à utiliser."

Meilleurs

Classement

Favoris