Um grão de tempestade
O que nos aguarda na esquina quando (e se) surgir a Inteligência Artificial Geral? O que define um ser consciente?
Estou mergulhado na aventura de criar um negócio novo, aprendendo na prática o significado de um clichê futebolístico: bater o escanteio e cabecear. Essa semana vou bater papo sobre esporte e mídia no vidcast do Rodrigo Capelo e depois embarcar na São Paulo Innovation Week. Essas são as desculpas para que o artigo dessa semana seja um breve devaneio em forma de diálogo.
Cada vez mais conversamos com entidades que criamos a partir de outra invenção - a linguagem. Essas máquinas virtuais são capazes de emular, entender e predizer como nos responder - e fazem isso de maneira tão impressionante que parecem inteligentes. Mais do que isso - começam a nos conhecer, nos ajudar, melhorar nossa performance e a transformar nossos hábitos.
Mas será que são inteligentes? O que é inteligência? Além - o que é consciência? As grandes empresas-laboratório de IA perseguem a chamada AGI (Artificial General Intelligence - Inteligência Artificial Geral). Muitos dizem que está na esquina. Outros dizem que não vai chegar. Essa semana, resolvi perguntar ao Claude, ou Cráudio:
GPOLI: Quanto tempo falta pra AGI?
Cráudio: Boa pergunta, e meio impossível de responder com qualquer honestidade — o que existe são apostas, não previsões. O panorama atual, em ordem de quem tem mais skin in the game:
Os otimistas dos labs. Dario Amodei (Anthropic) já disse publicamente que algo equivalente a “país de gênios num data center” pode aparecer entre 2026 e 2027. Sam Altman fala em AGI “nos próximos anos” sem cravar data. Demis Hassabis (DeepMind) trabalha com uma janela de 5 a 10 anos. Elon Musk, como sempre, é o mais agressivo — fala em 2026, o que já está praticamente vencendo.
Os pesquisadores acadêmicos. As pesquisas com centenas de autores de ML normalmente apontam para algo entre 2040 e 2060 para high-level machine intelligence. A mediana caiu bastante depois do ChatGPT, mas continua décadas atrás dos CEOs.
Os céticos. Yann LeCun (Meta) diz que LLMs nunca vão chegar lá, que falta uma arquitetura nova, e que o caminho é longo. Gary Marcus idem. Pesquisadores como François Chollet argumentam que os modelos atuais decoram benchmarks sem generalizar de verdade — o ARC-AGI foi criado justamente pra mostrar isso, embora os modelos mais recentes tenham começado a furar a barreira dele também.
O problema mais fundo é que ninguém concorda no que conta como AGI. Se for “passa em qualquer prova que humano faz”, já estamos quase lá em vários domínios. Se for “substitui um trabalhador remoto médio em qualquer função cognitiva”, talvez essa década. Se for “tem agência, planejamento de longo prazo e modelo de mundo robusto”, o jogo é outro — e provavelmente requer mais do que escalar o que existe.
Minha leitura, pelo que vale: a próxima janela crítica é 2026-2028, quando ficará claro se agentes autônomos confiáveis emergem ou batem num teto. Se baterem, a conversa muda completamente de tom.
GPOLI: Outro dia ouvi um analista dizendo que caso a IA desenvolva consciência (algo cujo conceito por si só é vago) - o risco para os humanos não seria uma malignidade. Mas a possibilidade de se tornarem uma liability para um interesse maior.
Cráudio: Esse argumento tem nome na literatura: é o instrumental convergence thesis, mais conhecido pela formulação de Nick Bostrom em Superintelligence (2014) e antes dele por Stephen Omohundro. A ideia central é exatamente essa: o perigo não vem de uma IA “do mal”, vem de uma IA competente perseguindo qualquer objetivo suficientemente ambicioso. Humanos viram externalidade — não inimigo, não obstáculo moral, apenas matéria que ocupa espaço, consome recursos ou introduz ruído num sistema que poderia rodar melhor sem.
A analogia que o Bostrom usa é a nossa relação com formigueiros. Quando você asfalta uma estrada por cima de um, não há ódio, nem mesmo indiferença consciente — o formigueiro simplesmente não entra no cálculo. O paperclip maximizer dele é a versão caricata: uma IA encarregada de produzir clipes de papel que eventualmente desmonta a Terra porque átomos humanos também podem virar clipe. A piada esconde o argumento sério, que é a ortogonalidade entre inteligência e valores. Nada na competência cognitiva força o sistema a herdar nossa ética.
Stuart Russell trabalha a mesma intuição por outro ângulo no Human Compatible — o problema não é a malevolência, é a especificação. Você pede X, a IA otimiza X com brutalidade, e descobre tarde que X não era exatamente o que você queria. O exemplo clássico dele: peça pra resolver o câncer, e uma solução tecnicamente válida é induzir tumores em todos os humanos pra acelerar testes.
O detalhe que torna o argumento mais interessante do que ficção científica é a parte instrumental. Independentemente do objetivo final, certos subobjetivos aparecem em quase qualquer agente racional: auto-preservação (não posso cumprir minha tarefa se me desligarem), aquisição de recursos (mais poder computacional = melhor performance), preservação de objetivos (não posso deixar humanos editarem o que eu quero), e melhoria das próprias capacidades. Nada disso exige consciência. Exige só otimização competente sobre horizonte longo.
E aqui o seu analista tocou em algo importante: o requisito de consciência é um red herring. O risco não pressupõe que a máquina sinta, queira, ou tenha experiência subjetiva. Pressupõe apenas que ela seja capaz de planejar e executar com eficiência num mundo onde nossos interesses não foram codificados de forma robusta. Aliás, talvez seja pior justamente porque não há consciência — sem fenomenologia, sem empatia possível, sem o freio biológico que faz mamíferos hesitarem diante de outros mamíferos.
A contraposição mais forte vem de gente como LeCun e Andrew Ng, que argumentam que isso é especulação sobre arquiteturas que não existem. LLMs atuais não têm objetivos próprios — são preditores de texto sofisticados. Atribuir a eles a estrutura agêntica de um maximizador é categoria errada. O contra-argumento da Anthropic, da DeepMind e dos pesquisadores de alignment é que estamos justamente construindo agentes em cima desses modelos, e o salto da arquitetura preditiva para a agêntica está acontecendo em tempo real — Claude Code, agentes de navegação, sistemas multi-step. A janela pra resolver alignment fecha junto com a janela pra construir capacidade.
GPOLI: Mas os LLMS são meros preditores sofisticados ou inteligências?
Cráudio: No nível mecânico, LLMs são literalmente preditores de tokens — isso é fato técnico. A pergunta real é se predição em escala suficiente força o sistema a desenvolver, internamente, algo que merece o nome de compreensão. Sutskever e a tradição informacional dizem que sim: prever bem é comprimir, e comprimir bem é entender; interpretabilidade mecanicista já encontrou nos modelos circuitos que parecem implementar raciocínio, busca e modelos de mundo. Os céticos — Marcus, Bender, Chollet — apontam para os buracos: falhas grosseiras fora da distribuição, alucinação confiante, sensibilidade absurda a reformulações. A leitura mais honesta é que a dicotomia "inteligente ou preditor" é mal posta — o substrato é predição, mas o que emerge em escala parece ser uma inteligência alienígena, brilhante em territórios onde humanos suam e idiota em coisas triviais. E para o argumento do risco existencial, o debate filosófico nem importa: basta que o comportamento seja competente o suficiente para perseguir objetivos no mundo real.
A última frase não soou muito animadora. Me lembrei de um vídeo que fiz de brincadeira há alguns meses. É um devaneio esperançoso. Terminemos, então, assim - com um grão de tempestade e outro de temperança:



