Ce document de Stanford remet en question l'une des excuses préférées de la finance : « les données sont trop bruyantes. » Depuis des décennies, les quants soutiennent que les prix bruts sont inutiles sans des indicateurs élaborés en plus. Cet article pose une question plus claire. Et si le signal était déjà là, et que nous le regardions simplement de la mauvaise manière ? L'auteur construit un modèle qui prédit les mouvements haussiers par rapport aux mouvements baissiers des actions du S&P 500 en utilisant uniquement des données de prix brutes. Pas d'indicateurs. Pas de bibliothèques de facteurs. Juste des OHLCV quotidiens plus des prix ajustés qui reflètent explicitement les dividendes et les fractionnements. Le truc n'est pas d'avoir plus de données. C'est la représentation. Au lieu de traiter les séries temporelles comme des séquences, l'article traite les fenêtres de prix roulantes comme des objets spatiaux. Chaque fenêtre devient une matrice structurée, plus proche d'une image que d'un graphique. Cela permet aux filtres convolutionnels de détecter des motifs locaux comme des changements de momentum, des regroupements de volatilité et des ruptures structurelles dues à des actions d'entreprise. Cela emprunte l'intuition à la vision par ordinateur, et non à l'économétrie classique. Le jeu de données s'étend sur jusqu'à vingt ans par action avec des prix de qualité institutionnelle. Dix canaux alimentent le modèle, et des fenêtres glissantes créent des échantillons d'entraînement denses sans astuces synthétiques. La normalisation maintient tout invariant d'échelle à travers les caractéristiques. Architecturalement, c'est un CNN 1D profond. Les premières couches se concentrent sur la structure à court terme. Les couches plus profondes captent des tendances plus longues. Comparé aux modèles récurrents, le CNN gère les pics de volatilité et les sauts provoqués par des événements avec plus de stabilité. La tâche est simple mais stricte : prédire la direction, pas les rendements, sur des horizons allant de quelques jours à un mois. L'entraînement est soigneusement ajusté, et la convergence semble propre plutôt que suspecte. Les résultats sont ce qui rend les gens mal à l'aise. Plusieurs actions de grande capitalisation atteignent des précisions de validation dans les hautes 80 et les basses 90. JP Morgan atteint environ 91 pour cent sur des horizons plus longs. Les courbes suggèrent un véritable apprentissage, pas un surajustement rapide. L'auteur reste prudent. Cela ne modélise pas les coûts, l'exécution ou le glissement. Mais cela montre quelque chose d'important. Les modèles profonds peuvent internaliser les mécanismes du marché directement à partir de tenseurs de prix bruts, y compris les distorsions que la plupart des pipelines lissent. L'implication plus large est profonde. L'ingénierie des caractéristiques peut avoir moins d'importance que la manière dont vous encadrez les données. En choisissant le bon biais inductif, le modèle apprend la structure que les humains essaient généralement de coder à la main. Traiter les séries temporelles financières comme des objets semblables à des images n'est pas un gimmick. C'est une alternative sérieuse à des décennies d'hypothèses élaborées à la main, et cela remet en question l'idée que les marchés sont illisibles sans une intervention humaine lourde. ...