要完美理解一個現象,就是要完美壓縮它,擁有一個無法再簡化的模型。 如果一個深度學習模型需要數百萬個參數來建模某個可以用三項微分方程描述的事物,那麼它並沒有真正理解它,只是簡單地緩存了數據。