Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Dawn Song
Professor em Ciência da Computação na UC Berkeley, co-diretor do Berkeley RDI Center; Construção de IA segura, protegida e descentralizada; Empreendedor em série
Ainda estou entusiasmado com o incrível #AgenticAI Summit na @UCBerkeley em 2/8 — mais de 2.000 participaram pessoalmente, mais de 30.000 assistiram online. ⚡🌍
A energia estava elétrica—visionários, construtores e pesquisadores moldando o futuro da IA agentic!
Perdeu? Assista às gravações:
Um enorme agradecimento aos nossos palestrantes, patrocinadores, equipe do @BerkeleyRDI, voluntários e a todos que participaram!
Este impulso baseia-se na nossa comunidade de mais de 25K+ LLM Agents MOOC — e estamos lançando uma nova edição, Agentic AI, na série este setembro! Inscreva-se aqui:

3,97K
Estou realmente entusiasmado para o Agentic AI Summit 2025 na @UCBerkeley—mais de 2 mil participantes presenciais e cerca de 10 mil online! Construindo sobre a nossa comunidade de mais de 25 mil alunos do MOOC de Agentes LLM, este é o fórum global de referência para o avanço da #AgenticAI.
👀 A transmissão ao vivo começa às 9:15 AM PT no dia 2 de agosto—não perca!

25,96K
Junte-se a nós no Agentic AI Summit 2025 — 2 de agosto na UC Berkeley, com cerca de 2.000 participantes presenciais e as mentes mais brilhantes em IA.
Construindo sobre o impulso da comunidade de 25K+ LLM Agents MOOC, este é o maior e mais inovador evento sobre #AgenticAI.
À medida que 2025 se destaca como o Ano dos Agentes, o cimeira oferece um lugar na primeira fila para os avanços que estão moldando o futuro do #AgenticAI. Faça parte do movimento.
👀 Registre-se para participação presencial ou online:

13,66K
Meu grupo e colaboradores desenvolveram muitos benchmarks populares ao longo dos anos, por exemplo, MMLU, MATH, APPS---estou realmente empolgado com nosso mais recente benchmark OMEGA Ω:
🔍 Será que os LLMs conseguem realmente pensar fora da caixa em matemática?
um novo benchmark que investiga 3 eixos de generalização:
1️⃣ Exploratória
2️⃣ Composicional
3️⃣ Transformativa
mostrando as limitações da IA de ponta e do treinamento em RL de hoje nessas dimensões de generalização.
Inspirado pela tipologia de criatividade de Boden, OMEGA avança além dos benchmarks anteriores com um conjunto de dados gerado programaticamente que combina controle preciso com rica diversidade. Abrangendo uma ampla gama de domínios matemáticos, foi explicitamente projetado para avaliar eixos distintos de generalização e raciocínio criativo.
Ao isolar e quantificar modos de falha detalhados, OMEGA fornece uma base para avançar os LLMs em direção a uma verdadeira criatividade matemática—além da proficiência mecânica.
Um enorme agradecimento ao meu pós-doutorado @YiyouSun @UCBerkeley liderando o projeto, e aos incríveis colaboradores @nouhadziri @HannaHajishirzi @allen_ai e outros co-autores!

Nouha Dziri25/06/2025
📢 Será que os LLMs conseguem realmente raciocinar fora da caixa em matemática? Ou estão apenas remixando estratégias familiares?
Lembre-se do DeepSeek R1, o1 nos impressionou em matemática de nível Olimpíada, mas também falhou em aritmética simples 😬
Construímos um benchmark para descobrir → OMEGA Ω 📐
💥 Descobrimos que, embora sejam muito poderosos, os RL têm dificuldades em compor habilidades e inovar novas estratégias que não foram vistas durante o treinamento. 👇
trabalhe com @UCBerkeley @allen_ai
Um fio sobre o que aprendemos 🧵

20,61K
1/ 🔥 Os agentes de IA estão alcançando um momento de ruptura na cibersegurança.
No nosso trabalho mais recente:
🔓 CyberGym: agentes de IA descobriram 15 zero-days em grandes projetos de código aberto
💰 BountyBench: agentes de IA resolveram tarefas reais de recompensas por bugs no valor de dezenas de milhares de dólares
🤖 De forma autônoma.
Uma mudança crucial está em andamento — os agentes de IA agora podem fazer de forma autônoma o que antes apenas hackers humanos de elite conseguiam.

50,14K
Estou realmente entusiasmado para compartilhar nosso trabalho mais recente no AgentSynth:
Um novo paradigma para gerar tarefas e benchmarks de uso de computador realistas, escaláveis e de longo prazo!
Nosso pipeline automatizado gera um conjunto de dados com mais de 6.000 tarefas com duas vantagens revolucionárias:
Economia de Custos Dramática 💰: O AgentSynth produz tarefas a apenas $0,60 por trajetória—ordens de magnitude mais barato do que a anotação humana tradicional.
Complexidade de Alta Fidelidade 🧗: Essas tarefas refletem desafios reais de longo prazo, muitas vezes exigindo que os agentes coordenem entre várias aplicações como Chrome, VS Code e LibreOffice para ter sucesso.
6,21K
🔐 A IA de fronteira está a reformular a cibersegurança, levantando novas questões críticas:
🔍 Qual é o seu impacto atual?
⚖️ Quem beneficia mais: atacantes ou defensores?
🛡️ Como podemos mitigar os riscos?
Enfrentar esses desafios requer esforços coordenados entre as comunidades de IA e segurança.
Em nosso artigo recente, exploramos o cenário em evolução, analisamos a dinâmica entre atacantes e defensores e pedimos medidas proativas para garantir que a IA de fronteira incline o equilíbrio para a defesa em vez do ataque.
Prevemos que, a curto prazo, os atacantes provavelmente obterão vantagens mais imediatas das capacidades de IA do que os defensores. No entanto, prever essas dinâmicas é complexo — e sua perspetiva é vital para melhorar nossa compreensão e resposta coletivas.
Convidamos todos os especialistas e profissionais de IA e cibersegurança a responder ao nosso breve inquérito e a partilhar os seus pontos de vista, quer concorde ou discorde das nossas previsões. 🧵👇 #AI #CyberSecurity

10,02K
🌟 Entusiasmado por anunciar o nosso estimado painel de jurados para o concurso de #AgentX por @BerkeleyRDI @UCBerkeley. Muito obrigado a @xinyun_chen_ @Chi_Wang_ @GoogleDeepMind; @KaiyuYang4 @Meta; @jayrodge15 @ZhidingYu @nvidia; @Somil_Agg @schmidtsciences; Samuel Barry @MistralAI; @bhawna_tweets, Austin Arensberg @Okta; @ben_burtenshaw @huggingface; @chuanli11 @ThomasBord50495 @LambdaAPI; @ozenhati Ben Ankiel @GroqInc; @waseem_s @Get_Writer; @SaraIttelson @Accel; @kevinzhang @BainCapVC; @ReddyVijayB @Mayfield; @maddiehfaulkner @NEA; @whoisnnamdi @David_Schmaier @LightspeedVP; @NextBigTeng @bhavikvnagda @BessemerVP; @divy93t @Google; @ysu_nlp @OhioState; Pushkar Nandkar @SambaNovaAI; Alok Tongaonkar @Cisco por se juntar a nós como jurados, e mais a ser anunciado.
🚀 Cerca de 1.000 equipes já se juntaram à #AgentX – construindo o futuro da IA Agentic em todas as trilhas de Empreendedorismo e Pesquisa!
💰 Prizepool agora $150K+, com o total de prémios/recursos a ultrapassar $450K!
🤖 Junte-se AGORA para a Competição AgentX e envie seus projetos até 31/05. ⏰

9,86K
Animado para falar no @RSAConference 2025! Junte-se à minha sessão "Segurança e Proteção de Agentes LLM: Desafios e Direções Futuras" no dia 1º de maio (12h20-13h10 PT). Exploraremos os desafios de segurança dos agentes de LLM e discutiremos as melhores práticas para a implantação segura de LLM. #RSAC #AI #CyberSecurity

2,95K
Profundamente humilhado e honrado por ser eleito para a Academia Americana de Artes e Ciências @americanacad! Entusiasmados por contribuir para a missão da Academia e promover o bem comum!


American Academy of Arts & Sciences24/04/2025
Novo! Anúncio de membro da Academia. Dedicado a honrar a excelência e promover o bem comum, de 1780 até hoje.
12,39K
Top
Classificação
Favoritos
Tendências on-chain
Popular no X
Principais financiamentos atuais
Mais notável