Shrnutí klíčových _užitečných_ poznatků pro mechanistickou interpretabilní skupinu konkrétně: Rozdělení vzdáleností jsou levnou diagnostikou pro naučenou geometrii. Pro daný prostor reprezentace je histogram párových vzdáleností mezi náhodně vybranými body silným geometrickým otiskem. Různé geometrie – eukleidovská, kulová, hyperbolická – a různé topologie – omezené vs. periodické – vytvářejí ostře odlišná rozdělení vzdáleností, i při středních rozměrech. Tyto podpisy vznikají koncentrací míry, hraničními efekty a zakřivením a jsou odolné vůči šumu. Klíčovým návrhem je považovat vzdálené histogramy nikoli za kuriozity, ale za forenzní průzkumy toho, jakou geometrii naučená reprezentace implicitně používá. Topologie je důležitá nezávisle na zakřivení. Plochý n-torus a n-rozměrný hyperkrychle sdílejí stejnou lokální eukleidovskou geometrii, přesto se jejich rozdělení vzdáleností výrazně liší. Torus eliminuje okrajové efekty, což vede k nižší střední vzdálenosti a těsnější koncentraci (~0,289√n) než hyperkrychle (~0,408√n). Tyto rozdíly přetrvávají a s větší rozměrností se vyostřují. To ukazuje, že mnoho "vysoce dimenzionálních patologií" přisuzovaných pouze dimenzionalitě jsou ve skutečnosti artefakty okrajových podmínek – rozlišení, které je v praxi strojového strojového učení zřídka explicitně zmíněno. Nízkorozměrné anomálie odhalují geometrické mechanismy. V nízkých rozměrech odhalují rozdělení vzdáleností ne-Gaussovskou strukturu přímo spojenou s geometrií. Například 2D plochý torus vykazuje integrovatelný hrot na maximální vzdálenosti díky rohovým omezením v obaleném souřadnicovém čtverci. To rychle mizí s dimenzí, protože převládá koncentrace. Takové vlastnosti nejsou číselným šumem; jsou analytickými důsledky geometrie. Vidění (nebo nevidění) těchto artefaktů v naučených embedzech poskytuje informace o efektivní dimenzionalitě a nezávislosti struktur reprezentačních podprostorů. Aplikace interpretability: embedding space forensics. Při trénovaném modelu lze vybrat sémanticky koherentní podmnožiny embeddingů (např. geografické entity, taxonomie, emoce, časové koncepty) a vypočítat jejich histogramy vzdáleností po párech. Porovnání těchto histogramů s teoretickými predikcemi umožňuje odvozovat informace o geometrii, kterou se model naučil pro danou oblast. Kulové podpisy by naznačovaly úhlové nebo mnohorozměrné reprezentace; hyperbolické podpisy by naznačovaly hierarchickou strukturu; Eukleidovské nebo toroidální podpisy by naznačovaly ploché podobnostní prostory s hranicemi nebo bez nich. Implikace: naučená zobrazení jsou pravděpodobně hybridně-geometrická. Většina současných prací předpokládá jednu globální geometrii (typicky eukleidovskou nebo hyperbolickou). Histogramový přístup se přirozeně zobecňuje na smíšené geometrie, kde různé sémantické podprostory instancují různé zakřivení nebo topologie. To naznačuje cestu k architektonicky explicitním, geometricky uvědomělým reprezentacím, kde je geometrie návrhovým parametrem, nikoli emergentní náhodou – a kde nástroje interpretovatelnosti mohou lokalizovat, jakou strukturu se model naučil, nejen kde informace žijí. Shrnutí. Histogramy vzdálenosti jsou jednoduché, rychlé a teoreticky podložené sondy, které odhalují křivost, topologii a efektivní dimenzionalitu v naučených reprezentacích. Poskytují diagnostiku na úrovni geometrie, která doplňuje interpretabilnost na úrovni neuronů a obvodů, a navrhují konkrétní experimenty pro testování, jak modely interně organizují různé druhy znalostí. (Shrnutí od Chat 5.2)