Estudo sobre a verificação da integridade dos resultados de inferência de IA off-chain através de sharding híbrido e consenso em blockchain @inference_labs , @nesaorg , @miranetwork À medida que modelos de inteligência artificial em larga escala são utilizados em diversos ambientes, a execução real da inferência é cada vez mais realizada fora da blockchain, com apenas os resultados sendo verificados. O desafio mais importante nesse processo é como provar de forma confiável que os resultados da inferência de IA gerados off-chain não foram manipulados e que passaram por um processo consistente para a mesma entrada. A estrutura que surgiu para resolver esse problema é o Protocolo de Inferência Híbrido Verificável, ou VH-SIP, que visa combinar elementos verificados de redes de IA distribuídas existentes e mecanismos de consenso em blockchain para verificar sistematicamente a integridade da inferência off-chain. O ponto de partida do VH-SIP é a camada de execução da inferência. Nesta camada, a execução de cargas de trabalho em contêiner, como utilizado no modelo Infernet da Ritual, é a premissa básica. Milhares de nós com diferentes características de hardware são configurados para executar o mesmo modelo, mantendo a determinística da operação através de uma semente aleatória fixa utilizada no opML da ORA e o sistema de operadores reproduzíveis da Gensyn, chamado RepOps. Aqui, o framework de sharding híbrido da Nesa é aplicado para dividir grandes modelos de linguagem em vários blocos e realizar a inferência dentro do alcance que cada nó pode processar, através da quantização dinâmica em blocos. Cada nó de execução gera um recibo de prova que inclui o valor de compromisso para a entrada, o hash da saída e métricas de recursos utilizados, que é compatível com o formato do protocolo Relay da Gensyn e é então passado para a fase de verificação. Esses resultados de inferência são imediatamente transferidos para a camada de sharding. O núcleo da camada de sharding é a alocação de shards baseada em VRF. Esta estrutura é baseada no mecanismo de sharding VRF discutido na pesquisa do Ethereum e utiliza as saídas de VRF anteriores como entrada para determinar a alocação do próximo shard, eliminando a previsibilidade. A estrutura VRF baseada em BLS implementada na Harmony é projetada para dificultar que participantes específicos viésem os resultados, garantindo a operação contínua da rede sob a suposição de que nós honestos constituem a maioria. Dentro do shard, técnicas de sharding independentes do modelo da Nesa são utilizadas para dividir as unidades de trabalho, e os validadores também são compostos por um comitê de verificação separado, aplicando os princípios de sharding de código do PolyShard. O método de realocação baseado em previsão de carga de trabalho apresentado no protocolo PSAP desempenha o papel de ajustar a carga entre os shards. A verificação e o consenso formam o núcleo do VH-SIP. Nesta camada, uma estratégia de verificação híbrida é aplicada, em vez de um único método. Para inferências com alta taxa de processamento e risco relativamente baixo, um pequeno número de validadores é selecionado aleatoriamente para realizar a verificação por amostragem probabilística. Por outro lado, para resultados de alto valor econômico ou com alta probabilidade de disputa, uma verificação determinística é realizada, onde todo o comitê reexecuta a mesma operação. Se os dois resultados entrarem em conflito, métodos de delegação de mediação e jogos de busca binária, como estudados na Gensyn, são aplicados para restringir gradualmente o ponto de erro. Este processo é baseado no conceito de verificação otimista da ORA, assumindo fundamentalmente a legitimidade dos resultados, mas iniciando um procedimento interativo de resolução de disputas na blockchain quando um desafio é levantado. Operações de ponto fixo e um sistema de operadores reproduzíveis minimizam as variações de ponto flutuante causadas por diferenças de hardware. A camada de incentivos econômicos é a base que torna essa estrutura de verificação operacionalmente viável. Os participantes apostam uma certa garantia e, se apresentarem resultados claramente errôneos ou apresentarem saídas conflitantes simultaneamente, ou ocultarem resultados durante o processo de verificação ou apresentarem provas TEE não verificáveis, ocorrerá slashing. Essas condições seguem o método de verificação Verde e os princípios de ancoragem on-chain. Assim como o modelo adotado no Bittensor, mesmo com até metade do stake malicioso, a segurança da rede como um todo é mantida, e a vida econômica é prolongada através de um mecanismo de recirculação de tokens. A camada de coordenação e agregação é responsável por agrupar os resultados gerados em vários shards em um único estado coerente. Nesta camada, compromissos KZG são utilizados para verificar eficientemente a integridade dos dados cross-shard, e a codificação PolyShard é aplicada para garantir que os custos de verificação não aumentem linearmente. O protocolo RSTBP é utilizado para processar múltiplas entradas e saídas de forma atômica, e os resultados de verificação probabilística são agregados de acordo com a regra da maioria. O aprendizado por reforço com restrições de segurança proposto no framework PSAP ajusta a alocação de recursos, mas o próprio processo de verificação é baseado em operações de aprendizado de máquina determinísticas, presumindo a reprodução dos mesmos resultados. Essa estrutura também revela claramente as abordagens para diferentes cenários de ataque. A situação em que um shard específico é dominado é mitigada pela rotação de shards baseada em VRF e pela estrutura de ponderação de stake, enquanto falsos positivos devido a operações não determinísticas são gerenciados através de operações de ponto fixo e definição de intervalos de tolerância estatística. Ataques de collusion são inibidos através de slashing e estruturas de custo econômico, e se a qualidade do modelo for secretamente degradada, isso é detectado através de validação de distribuição baseada em consenso. Os conceitos de operadores reproduzíveis, hashing sensível localmente e intervalos de tolerância apresentados na Gensyn são técnicas de verificação realmente utilizadas nesse processo. Em resumo, o VH-SIP apresenta uma arquitetura que combina elementos verificados de sistemas de IA distribuídos e de verificação existentes, como Nesa, Gensyn, ORA e Bittensor, para verificar de forma íntegra os resultados da inferência de IA realizados off-chain dentro da estrutura de consenso da blockchain. O sharding híbrido distribui eficientemente a computação e a verificação, enquanto o consenso baseado em VRF e a verificação otimista mantêm um equilíbrio entre escalabilidade e segurança. Esta estrutura pode ser entendida como um caso organizado que atende à demanda prática da inferência de IA off-chain, garantindo simultaneamente a verificabilidade e a responsabilidade econômica. $NESA $MIRA