福岛的录像(1986年)展示了一个识别手写数字的卷积神经网络(CNN)[3],比LeCun的录像(1989年)早了三年。 CNN时间线摘自[5]: ★ 1969年:福岛邦彦发表了修正线性单元或ReLU [1],现在广泛应用于CNN中。 ★ 1979年:福岛发表了基本的CNN架构,包括卷积层和下采样层 [2]。他称之为neocognitron。它是通过无监督学习规则进行训练的。计算成本比1989年贵100倍,比今天贵10亿倍。 ★ 1986年:福岛关于识别手写数字的录像 [3]。 ★ 1988年:张伟等人首次训练了“现代”二维CNN,采用反向传播,并将其应用于字符识别 [4]。计算成本约为今天的1000万倍。 ★ 1989年及以后:其他人的后续工作 [5]。 参考文献(更多见[5]) [1] K. Fukushima (1969)。通过多层网络的模拟阈值元件进行视觉特征提取。IEEE系统科学与控制论学报。5 (4):322-333。这项工作引入了修正线性单元或ReLU,现在广泛应用于CNN和其他神经网络。 [2] K. Fukushima (1979)。一种不受位置偏移影响的模式识别机制的神经网络模型——Neocognitron。IECE学报,J62-A卷,第10期,658-665页,1979年。第一种深度卷积神经网络架构,具有交替的卷积层和下采样层。用日语撰写。英文版:1980年。 [3] 由福岛邦彦、宫家佐和和伊藤智(NHK科学与技术研究所)制作的电影,1986年。YouTube: [4] W. Zhang, J. Tanida, K. Itoh, Y. Ichioka。平移不变模式识别神经网络及其光学架构。日本应用物理学会年会论文集,1988年。第一种“现代”反向传播训练的二维CNN,应用于字符识别。 [5] J. Schmidhuber(AI博客,2025年)。谁发明了卷积神经网络?