منشور اليوم هو تعاون مع صديقي منذ الطفولة أندريس سيلفا :-) ------- إذا أسقطت نقطة عشوائية في مربع وحدة، هناك فرصة حوالي 78.5٪ أن تهبط داخل الدائرة المنقوشة. إذا وضعت واحدة في مكعب وحدة، فهناك احتمال 52.4٪ أنها داخل الكرة المنقوشة. بحلول البعد 10، ينخفض هذا الاحتمالية إلى 0.25٪. عند البعد 100، يكون فعليا صفرا. هذا هو "لعنة الأبعاد" - وهو أمر معتاد في أي دورة تعلم آلة، وموضوع أدبيات رياضية طويلة. تم تحديد متوسط المسافة بين نقاط عشوائية في صندوق بواسطة روبينز وحلها في عام 1978. استنشق يوهان فيليب التوزيع الكامل للثلاثي الأبعاد. هذه المشاكل تم تجربتها جيدا. ما نريد فعله هنا هو شيء مختلف قليلا: نقارن بشكل منهجي مخططات المسافة عبر هندسات مختلفة (إقليدية، كروية، زائدية)، وطوبولوجيات (مكعب فائق مقابل طور)، والأبعاد - ثم نسأل ماذا قد تكشفه هذه "التوقيعات" عن الفضاءات المدمجة في الشبكات العصبية في العالم الحقيقي. الفكرة الأساسية: مخطط المسافات الزوجية بين النقاط العشوائية هو بصمة هندسية. المساحات المختلفة تترك علامات مختلفة. قد تتمكن من استخدام هذا لتشخيص الهندسة التي تعيش فيها بياناتك سرا. قصة الأصل: اثنان من عائلة أندريس يدخلان حانة في كويوكان... الأفكار في هذا المنشور نشأت من محادثة بيننا (نعم، كلانا اسمه أندريس - bienvenidos a México). الإعداد: إذا تم إسقاطك أنت وصديقك في مواقع عشوائية في مكعب فائق n-بعد، ما المسافة بينكما في المتوسط؟ والأكثر إثارة للاهتمام، كيف يبدو توزيع المسافات الممكنة؟ "الأمر هو،" كما قال أحدنا خلال نقاشنا، "إذا أمسكت بنقطتين عشوائيتين في الفضاء، كيف يبدو توزيع المسافة؟ أنا متأكد أنك فكرت في هذه المشكلة؟" - "نعم، وتساءلت عن الأبعاد الأعلى." يتضح أن الإجابة بسيطة جدا بالنسبة للحالة أحادية البعد (مقطع خطي): توزيع المسافات بين نقطتين عشوائيتين منتظمتين على [0,1] مثلث، ويصل إلى ذروته عند 0. معظم الأزواج متقاربة، واحتمال أن يكون الفصل بينهما بمقدار 1 بالضبط (الحد الأقصى) هو صفر تماما - إنها مجموعة ذات مقياس صفر. لكن ماذا يحدث عندما تضيف التفاف؟ عندما تكون على دائرة بدلا من مقطع خط؟ خدعة الطوروس: دون فقدان العمومية هنا تظهر أول رؤية جميلة. على مقطع خطي [0,1]، المسافة بين النقطتين x و y هي فقط |x - y|. لكن على دائرة (طورية واحدة)، يمكنك الذهاب في أي اتجاه. المسافة "الملفوفة" هي min(|x - y|, 1 - |x - y|). فكرة أساسية: على الطور، يمكنك دائما افتراض أن نقطة واحدة عند الأصل دون فقدان العمومية. لماذا؟ لأن الطور متجانس - كل نقطة تبدو مثل كل نقطة أخرى. لا توجد حواف، لذا لا توجد زوايا. كل موقع تضع فيه النقطة الأولى هو "نفس الموقع". إذا أسقطت نقطتين عشوائيتين على طور، يمكنك دائما ترجمة المسافة ذهنيا بحيث تبقى نقطة واحدة عند الصفر. هذا يعني أن توزيع المسافات يتحدد بالكامل بواسطة توزيع نقطة عشوائية منتظمة واحدة من الصفر. على الطور أحادي البعد (الدائرة)، يكون هذا الإحداثي الملفوف موحدا على [0, 0.5]. المشكلة كلها تجمع بشكل رائع: في طور مسطح ذو بعد n، المسافة الكلية هي: D = sqrt(D_1^2 + D_2^2 + ... + D_n^2) حيث كل D_i هو المسافة الإحداثية الملفوفة في البعد i، متجانسة بشكل مستقل على [0, 0.5]. "إذا أنت تنظر إلى توزيع المعيار الإقليدي لمتجه تكون مكوناته موحدة على [0، 0.5]،" أشار أندريس س. خلال حديثنا. "يمكنك أن تمتلك مجموعة من القياس نصف كل تلك الاحتمالات..." ...