Bugünkü gönderi, çocukluk arkadaşım Andrés Silva ile bir iş birliği :-) ------- Rastgele bir noktayı birim kareye bırakırsanız, kazımlı dairenin içine düşme ihtimali yaklaşık %78,5 olur. Birini birim küpe bırakın, yazılı kürenin içinde olma ihtimali %52,4. 10. boyutta bu olasılık %0,25'e düşer. 100 boyutta ise fiilen sıfır olur. Bu, "boyutluluk laneti" - herhangi bir makine öğrenimi kursunda standart bir yöntemdir ve uzun bir matematiksel literatürün konusu. Bir kutudaki rastgele noktalar arasındaki ortalama mesafe Robbins tarafından sorguladı ve 1978'de çözüldü. Johan Philip, 3D için tam dağıtımı türetmiştir. Bu sorunlar iyi basılmıştır. Burada yapmak istediğimiz şey biraz farklı bir şey: farklı geometriler (Öklid, küre, hiperbolik), topolojiler (hiperküp vs. torus) ve boyutlar arasında mesafe histogramlarını sistematik olarak karşılaştırmak - ve ardından bu "imzaların" sinir ağlarındaki gerçek dünya gömülü uzayları hakkında ne ortaya çıkarabileceğini sormak. Temel fikir: rastgele noktalar arasındaki çift mesafelerin histogramı geometrik bir parmak izidir. Farklı alanlar farklı izler bırakır. Bunu, verilerinizin gizlice hangi geometride yaşadığını teşhis etmek için kullanabilirsiniz. Köken Hikayesi: İki Andres Coyoacán'da bir bara girer... Bu yazıdaki fikirler, ikimiz arasında yapılan bir sohbetten ortaya çıktı (evet, ikimizin adı Andrés - bienvenidos a México). Kurulum: Eğer siz ve bir arkadaşınız n-boyutlu bir hiperküpte rastgele bir yere bırakılırsanız, ortalama olarak ne kadar uzaktasınız? Daha ilginç olan, olası mesafelerin dağılımı nasıl görünüyor? "Mesele şu ki," birimizin tartışma sırasında dediği gibi, "uzayda rastgele iki noktayı tutarsanız, mesafe dağılımı nasıl görünür? Eminim bu sorunu düşündündür?" - "Evet, ve daha yüksek boyutlar hakkında da merak ettim." Cevap, 1D vaka (bir çizgi kesimi) için son derece basit çıkıyor: [0,1] üzerindeki iki tekdüze rastgele nokta arasındaki mesafe dağılımı üçgendir ve 0'da zirveye ulaşır. Çoğu çift birbirine yakındır ve tam olarak 1 aralık olma olasılığı (maksimum) tam olarak sıfırdır - bu sıfır ölçülü bir kümedir. Peki wraparound eklediğinizde ne olur? Çizgi parçası yerine daire üzerinde mi olursan? Torus Numarası: Genelliği Kaybetmeden İşte burada ilk güzel içgörülü ortaya çıkıyor. Bir çizgi parçasında [0,1], x ile y noktaları arasındaki mesafe sadece |x - y| olur. Ama bir dairede (1-torus) her iki yöne de gidebilirsiniz. "Sarılmış" mesafe min(|x - y|, 1 - |x - y|). Ana Fikir: Bir torus'ta, genellik kaybetmeden her zaman bir noktanın başlangıçta olduğunu varsayabilirsiniz. Neden? Çünkü torus homojendir - her nokta diğer tüm noktalar gibi görünür. Kenar yok, yani köşe de yok. İlk noktayı koyduğunuz her yer "aynı yer"dir. Bir torusun üzerine rastgele iki nokta bırakırsanız, uzayı zihinsel olarak her zaman çevirebilirsiniz ve bir nokta sıfırda durur. Bu, mesafelerin dağılımının sıfırdan tek bir tekdüze rastgele noktanın dağılımıyla tamamen belirlendiği anlamına gelir. 1D torus'ta (dairede), bu sarılmış koordinat [0, 0.5]'te tekdüze olur. Tüm sorun çok güzel bir şekilde etkileniyor: n-boyutlu düz bir torusda toplam mesafe şudur: D = sqrt(D_1^2 + D_2^2 + ... + D_n^2) burada her D_i, boyut i'de sarılmış koordinat mesafesidir ve [0, 0.5]'te bağımsız olarak tekdüzdür. "Yani, bileşenleri [0, 0.5] üzerinde uniform olan bir vektörün Öklid normunun dağılımına bakıyorsunuz," dedi Andrés S. konuşmamız sırasında. "Tüm bu olasılıkların yarısını ölçen bir setin olabilir..." ...