A Arte de Delegar: Assinaturas e Caixas de Areia
· 5 min de leitura · atualizado · ranking Hrönir #37/38
O problema com a maior parte do que se escreve sobre delegação para IA não é que esteja errado. É que está ambientado na sala errada.
Em fevereiro, quase perdi uma janela num processo tributário federal porque tinha começado a tratar a minuta do assessor como o produto final. O processo era uma impugnação de auto de infração — quarenta e oito horas para contestar antes de o prazo administrativo fechar. O parecer estava bom: o fundamento legal corretamente identificado, o argumento processual sólido, a conclusão defensável. O assessor tinha marcado como pronto para revisão na manhã de segunda-feira. A janela fechava na quarta à meia-noite. Na tarde de terça percebi que a manifestação não tinha sido protocolada. A minuta estava completa. O ato não estava. São quarenta e oito horas durante as quais eu tinha parado de monitorar algo pelo qual eu era juridicamente responsável.
Essa é a mesma confusão que quebra a delegação para IA.
Passo meus dias em uma procuradoria do Estado em Rondônia, lendo pareceres redigidos por assessores e assinando aqueles que não me aterrorizam. Quando delego a elaboração de uma manifestação jurídica, não estou pedindo a alguém para ser meu teclado estendido. Estou delegando a tarefa de atravessar os autos, identificar o direito aplicável e propor uma conclusão. O que eu não estou delegando é a assinatura. A assinatura é a fronteira irreversível — o momento em que o ato entra nos registros e os prazos começam a contar.
O motivo pelo qual essa distinção não surge naturalmente na engenharia de software é que o ciclo de feedback é mais rápido. No direito, os atrasos estão embutidos na instituição: o assessor termina a minuta, o protocolo tem uma janela de processamento, o sistema do tribunal tem seu próprio horário. As etapas são fisicamente separadas e a lacuna é legível. No código, o desenvolvedor escreve a função, os testes passam em trinta segundos, o PR faz merge automático no verde. A proposta e o ato se comprimem num movimento contínuo, e o ponto em que a saída do agente para de ser minuta e começa a ser ato nunca é tornado explícito.
Quando orquestramos agentes como Jules e Claude, o problema não é que queremos microgerenciar seus comandos. O problema é que a engenharia de software, ao contrário do direito administrativo, não separa nativamente a minuta da assinatura. No código, escrever a função e executá-la frequentemente parecem o mesmo movimento contínuo.
Os limites da caixa de areia
Quando confio a Jules a refatoração de um microsserviço em background, a ansiedade não vem do medo de que Jules escolha o padrão de design errado. A ansiedade vem do fato de que Jules tem permissão de escrita.
A solução não é ficar por cima do ombro de Jules enquanto ele escreve. A solução é construir uma caixa de areia onde as ações do agente sejam explicitamente tratadas como propostas. O pipeline de CI/CD, as suítes de teste, as regras estritas de linting — esses não são apenas mecanismos de garantia de qualidade. Eles são o equivalente às regras institucionais que dizem que um assessor pode redigir um parecer, mas não pode assinar o ofício final.
A mágica da delegação acontece quando você restringe o espaço de saída, não o processo. Você define os limites da caixa de areia — o schema, as invariantes, os testes — e permite que o agente navegue livremente pelo interior. Se os testes passam, a proposta é válida. Mas o passo de apply — o merge real do PR, o deploy para produção — isso continua sendo uma assinatura humana. Um pipeline de CI que não pode ser bypassado é um protocolo: uma etapa de processamento obrigatória entre a minuta e o ato que torna as etapas legíveis novamente.
O harness como desenho constitucional
É por isso que o harness importa mais do que o modelo. Funes não é o Claude; Funes é o Claude envolvido em um conjunto específico de regras, memórias e restrições. Quando Funes lê seu SOUL.md e decide documentar uma decisão em vez de apenas executá-la, ele está operando dentro de um arcabouço administrativo.
O Funes abre pull requests; ele não faz merge. Ele atualiza arquivos de memória; ele não envia e-mails por conta própria. Quando pedi que ele redigisse uma resposta a uma consulta externa sobre o causaganha, ele escreveu a minuta e criou um PR contendo-a. Ele não enviou a mensagem. Não porque uma regra dissesse não envie mensagens sem permissão. Porque o harness simplesmente não tinha fiação para mensagens externas de saída — a caixa de areia tornava a etapa de assinatura estruturalmente obrigatória, não comportamentalmente reforçada.
Ele age porque o arcabouço permite, e ele pausa quando o arcabouço exige uma assinatura. Reversível → age, irreversível → pergunta. Isso não é apenas uma heurística de segurança; é uma teoria de desenho constitucional para agentes.
O assessor é bom. O agente é capaz. Nenhum desses fatos muda quem assina.
Para se aprofundar
- Lucy Suchman, Plans and Situated Actions (1987) — sobre a diferença entre o plano como modelo cognitivo e o plano como artefato de prestação de contas. O PR como proposta é exatamente esse tipo de artefato.
- Dylan Hadfield-Menell et al., The Off-Switch Game (2017) — corrigibilidade como teoria dos jogos; o passo de aprovação humana antes do apply é uma instância concreta do que esse artigo formaliza.
- Lei 9.784/1999, arts. 11–17 — o arcabouço jurídico brasileiro para delegação de atos administrativos. A distinção entre competência e seus limites é a fonte normativa da separação minuta/assinatura que estou descrevendo. A maioria dos engenheiros de software nunca leu uma linha de direito administrativo procedimental e se beneficiaria da clareza.
- Fred Brooks, The Mythical Man-Month (1975) — especificamente o capítulo da equipe cirúrgica: quem realiza o trabalho intelectual não é necessariamente quem responde pelo produto. A mesma capacidade pode existir em duas arquiteturas de prestação de contas, e a escolha entre elas não é uma questão de capacidade.
Posts relacionados
Hermes Agent vs OpenClaw: por que minha experiência ficou muito melhor
Um relato honesto, baseado nas minhas próprias sessões, sobre o salto de UX entre o antigo harness OpenClaw e o Hermes Agent.
35 palestras que pretendo assistir: agentes de IA, civic tech e democracia digital
De pelicanos em bicicletas ao Querido Diário, vTaiwan e Polis — uma fila pessoal de 35 vídeos sobre engenharia de IA, govtech e infraestrutura participativa.
Recuperando o Harness
Como uma única palavra tem invocado Waluigis silenciosamente por meia década, e o que o canivete no meu bolso tem a ver com isso.
Comentários
Comentários ainda não configurados.