Эта статья Стэнфордского университета ставит под сомнение одно из любимых оправданий финансов: «данные слишком шумные». На протяжении десятилетий квантовые аналитики утверждали, что сырые цены бесполезны без ручных индикаторов, наложенных сверху. Эта статья задает более чистый вопрос. Что если сигнал уже существует, и мы просто смотрели на него неправильно? Автор создает модель, которая предсказывает бычьи и медвежьи движения акций S&P 500, используя только сырые данные о ценах. Никаких индикаторов. Никаких библиотек факторов. Только ежедневные OHLCV и скорректированные цены, которые явно отражают дивиденды и сплиты. Фокус не в большем количестве данных. А в представлении. Вместо того чтобы рассматривать временные ряды как последовательности, статья рассматривает скользящие ценовые окна как пространственные объекты. Каждое окно становится структурированной матрицей, ближе к изображению, чем к графику. Это позволяет свёрточным фильтрам обнаруживать локальные паттерны, такие как изменения импульса, кластеризация волатильности и структурные разрывы из-за корпоративных действий. Это заимствует интуицию из компьютерного зрения, а не классической эконометрики. Набор данных охватывает до двадцати лет для каждой акции с ценами институционального уровня. Десять каналов подают данные в модель, а скользящие окна создают плотные обучающие выборки без синтетических уловок. Нормализация сохраняет все в масштабно-инвариантном состоянии по всем признакам. Архитектурно это глубокая 1D CNN. Ранние слои сосредоточены на краткосрочной структуре. Более глубокие слои улавливают более длинные тренды. По сравнению с рекуррентными моделями, CNN справляется с всплесками волатильности и скачками, вызванными событиями, с большей стабильностью. Задача проста, но строгая: предсказать направление, а не доходность, на горизонтах от нескольких дней до месяца. Обучение настроено тщательно, и сходимость выглядит чистой, а не подозрительной. Результаты вызывают дискомфорт у людей. Несколько акций крупных компаний достигли точности валидации в высоких 80-х и низких 90-х. JP Morgan достигает около 91 процента на более длинных горизонтах. Кривые предполагают реальное обучение, а не быстрое переобучение. Автор остается осторожным. Это не моделирует затраты, исполнение или проскальзывание. Но это показывает нечто важное. Глубокие модели могут интернализировать механизмы рынка непосредственно из сырых ценовых тензоров, включая искажения, которые большинство конвейеров сглаживают. Более широкое значение проникает глубоко. Инженерия признаков может иметь меньшее значение, чем то, как вы формулируете данные. Выбирая правильный индуктивный уклон, модель учится структуре, которую люди обычно пытаются закодировать вручную. Рассмотрение финансовых временных рядов как объектов, похожих на изображения, не является трюком. Это серьезная альтернатива десятилетиям ручных предположений и ставит под сомнение идею о том, что рынки нечитаемы без значительного человеческого вмешательства. ...