Estudo de Verificação de Integridade dos Resultados de Inferência de IA Off-Chain por meio de Hybrid Sharding e Consenso em Blockchain @inference_labs , @nesaorg , @miranetwork À medida que modelos de inteligência artificial em grande escala são usados em diversos ambientes, está se tornando cada vez mais comum ter estruturas nas quais operações reais de inferência são realizadas fora da blockchain e apenas os resultados são verificados. O desafio mais importante nesse processo é como provar de forma confiável que os resultados de inferência de IA gerados fora da cadeia não foram manipulados e passaram por um processo consistente para a mesma entrada. A estrutura que surgiu para resolver esses problemas é o Verifiable Hybrid-Sharded Inference Protocol, ou VH-SIP, que visa verificar sistematicamente a integridade da inferência off-chain combinando elementos verificados em redes distribuídas de IA existentes e mecanismos de consenso blockchain. O ponto de partida do VH-SIP é a camada de execução de inferência. Nessa camada, a premissa padrão é executar cargas de trabalho conteinerizadas, como é usado no modelo Infernet do Ritual. Milhares de nós com diferentes características de hardware são configurados para rodar o mesmo modelo, e o determinismo da operação é mantido por meio de uma semente de número aleatório fixo utilizada no opML da ORA e no sistema de operadores reproduzíveis da Gensyn, RepOps. A estrutura de fragmentação híbrida da NESA é aplicada a isso, que divide grandes modelos de linguagem em blocos e realiza inferências dentro da faixa que cada nó pode lidar por meio da quantização dinâmica bloco a bloco. Cada nó de execução gera um recibo de prova, incluindo o valor de commit para a entrada, o hash de saída e as métricas de recursos usadas, que são compatíveis com o formato do protocolo Relay do Gensyn e são repassados para a etapa subsequente de verificação. O resultado dessa inferência vai direto para a camada de fragmentação. O núcleo da camada de fragmentação é a alocação de fragmentos baseada em VRF. Essa estrutura é baseada no mecanismo de sharding VRF discutido no Ethereum Research e elimina a previsibilidade ao usar múltiplas saídas VRF anteriores como entradas para determinar a próxima alocação do shard. A estrutura VRF baseada em BLS, implementada no Harmony, foi projetada para dificultar que certos participantes enviesem os resultados, e a operação contínua da rede é garantida sob a suposição de que nós honestos compõem a maioria. Dentro do fragmento, a unidade de trabalho é dividida usando a técnica de fragmentação independente do modelo da NESA, e os validadores também são formados em um comitê de verificação separado aplicando o princípio de fragmentação de código do PolyShard. O método de realocação baseado em previsão de carga de trabalho proposto no protocolo PSAP é responsável por coordenar a carga entre os fragmentos. Verificação e consenso são o coração do VH-SIP. Nessa camada, aplica-se uma estratégia híbrida de verificação, em vez de uma abordagem única para todos. Para inferência de alto rendimento e risco relativamente baixo, um pequeno número de validadores é selecionado aleatoriamente para realizar verificação estocástica de amostragem. Por outro lado, para resultados com grande valor econômico ou alto potencial para disputas, é realizada a verificação determinística, na qual todo o comitê repete o mesmo cálculo. Se os dois resultados entrarem em conflito, o método de delegação de intervenção e o jogo de busca dicotômica estudado em Gensyn são aplicados para restringir gradualmente o ponto onde o erro ocorreu. Esse processo é baseado no conceito de verificação otimista da ORA, que basicamente assume a legitimidade dos resultados, mas quando um desafio é levantado, um processo interativo de resolução de disputas é iniciado on-chain. Operações de ponto fixo e sistemas de operadores reproduzíveis desempenham um papel na minimização de desvios de ponto flutuante devido a diferenças de hardware. A camada de incentivo econômico é a base para fazer essa estrutura de verificação funcionar de forma realista. O slashing ocorre quando os participantes apostam em determinado material colateral e apresentam resultados claramente errados, apresentam resultados conflitantes ao mesmo tempo, ou ocultam resultados durante o processo de verificação ou apresentam provas TEE não verificáveis. Essas condições seguem o método de verificação Verde e o princípio de ancoragem on-chain. Assim como o modelo adotado pela Bittensor, ele é projetado para manter a segurança de toda a rede mesmo que haja até metade da participação maliciosa, e a vida útil econômica é estendida por meio do mecanismo de recirculação de tokens. A hierarquia de coordenação e agregação é responsável por agrupar os resultados gerados por múltiplos fragmentos em um único estado coerente. Essa camada aproveita compromissos do KZG para verificar eficientemente a integridade dos dados cross-shard e garante que os custos de verificação não aumentem linearmente por meio da codificação PolyShard. O protocolo RSTBP é usado para processar atomicamente múltiplas entradas e saídas, e os resultados da verificação estocástica são agregados de acordo com a regra da maioria. O aprendizado por reforço por restrições de segurança proposto no framework PSAP ajusta a alocação de recursos, mas o próprio processo de validação baseia-se na reprodução dos mesmos resultados com base em operações determinísticas de aprendizado de máquina. Essa estrutura também revela claramente como responder a vários cenários de ataque. A situação em que certos fragmentos são dominados é mitigada pela rotação de fragmentos baseada em VRF e estrutura ponderada por estacas, e falsos positivos causados por operações não determinísticas são gerenciados por meio de operações de ponto fixo e configurações de intervalo de tolerância estatístico. Ataques de conluio são suprimidos por cortes e estruturas de custos econômicas, e se a qualidade do modelo for degradada de forma encoberta, isso é detectado por meio de verificação de distribuição baseada em consenso. Os conceitos de Gensyn de operadores reproduzíveis, hashing localmente sensível e bandas de tolerância são as técnicas de validação utilizadas nesse processo. Em resumo, o VH-SIP propõe uma arquitetura que combina elementos verificados por sistemas de IA distribuída e verificação existentes, como Nesa, Gensyn, ORA e Bittensor, e verifica integralmente os resultados da inferência de IA realizada fora da cadeia dentro de uma estrutura de consenso blockchain. O sharding híbrido distribui eficientemente computação e verificação, enquanto consenso baseado em VRF e verificação otimista encontram um equilíbrio entre escalabilidade e segurança. Essa estrutura pode ser entendida como um caso conclusivo que atende às necessidades realistas da inferência de IA off-chain, ao mesmo tempo em que garante verificabilidade e responsabilidade econômica. $NESA $MIRA