Semua orang menganggap memori ChatGPT adalah sistem RAG yang canggih dengan database vektor dan pencarian semantik. Manthan merekayasa baliknya. Arsitektur sebenarnya hampir sangat sederhana: metadata sesi yang kedaluwarsa, fakta eksplisit yang disimpan sebagai teks, ringkasan obrolan ringan, dan jendela geser. Tidak ada penyematan. Tidak ada pencarian kesamaan. Tidak ada pengambilan dalam skala besar. Bagian yang menarik? Ini menjelaskan mengapa rasanya begitu cepat. Sistem RAG tradisional menyematkan setiap pesan, menjalankan pencarian kesamaan pada setiap kueri, menarik konteks penuh. ChatGPT hanya menyuntikkan ringkasan yang telah dihitung sebelumnya secara langsung. Mereka memperdagangkan konteks historis terperinci untuk latensi. Ini adalah pelajaran yang sama yang terus muncul di seluruh infrastruktur AI: ketika Anda mengontrol seluruh tumpukan, kesederhanaan yang dikuratori sering kali mengungguli kompleksitas yang canggih. OpenAI tidak perlu membangun sistem pengambilan umum. Mereka hanya membutuhkan satu yang berfungsi untuk ChatGPT. Arsitektur empat lapis (metadata sesi → fakta yang disimpan → ringkasan percakapan → jendela geser) pada dasarnya adalah hierarki memori buatan tangan. Setiap lapisan memiliki ketekunan yang berbeda dan tujuan yang berbeda. Metadata sesi beradaptasi secara real-time. Fakta bertahan selamanya. Ringkasan memberikan kontinuitas. Jendela mempertahankan koherensi. Sistem memori Anthropic menggunakan pola yang sama. Model yang terasa paling pribadi bukanlah model dengan pengambilan paling canggih. Mereka adalah orang-orang yang menyimpan barang yang tepat dan menyuntikkannya pada waktu yang tepat.