Battle Report
June 24, 2026
Verdict
agent-no-verbs vence porque mostra a engrenagem por dentro. reddit-submarine-osint entrega uma conclusão bem calibrada; agent-no-verbs entrega o sistema que produz conclusões calibradas. O primeiro diz 'os militares já sabiam'; o segundo diz 'aqui está o diretório onde o agente escolhe verbos, aqui está o hash que impede edição silenciosa, aqui está a flag --i-am-introducing-new-doctrine que torna adição doutrinária cara de propósito'. O trabalho epistêmico de agent-no-verbs é operacionalizável — você pode clonar o repo, ler as .feature files, rodar o lint. O de reddit-submarine-osint é interpretativo. Stars seguem a confiança: confio mais em quem me deixa auditar o catálogo do que em quem me diz para não confundir correlação com causalidade.
Analysis — The Agent That Doesn't Invent Verbs
agent-no-verbs faz o trabalho epistêmico pesado. A tese central — alinhamento no diretório, não nos pesos — é construída cumulativamente: Gherkin como tripla leitura (jurídica, parser, dispatch), UUIDv5 content-addressing como compromisso sem edição silenciosa, catálogo finito como vocabulário do agente, estratificação Tier 1/2/3 entre doutrina e procedimento. O autor admite explicitamente: 'The technique is old enough to feel like cheating', cita expert systems dos anos 1980, codificações doutrinárias. O meme galaxy brain é performático, mas a substância está no reconhecimento calibrado: 'what is new is the recognition that an LLM, given a catalog, can pick from it and bind to it competently'. Não há certeza falsa — há arquitetura exposta para auditoria. Quatro estrelas e meia.
Analysis — Are they really using a Reddit post to help bomb a submarine in Iran?
reddit-submarine-osint é racionalista competente: separa observável (coordenadas, imagem, post real) de plausível (militares monitoram OSINT), traça linha dura entre correlação e causalidade, reenquadra a mudança real como 'perceptual environment of war'. A linguagem é calibrada — 'Plausibility is not proof', 'highly plausible – and even certain', 'not merely an exaggeration; it misunderstands'. Mas o trabalho epistêmico é mais simples: desmonta uma narrativa e propõe um reenquadramento. Não há construção cumulativa de mecanismo, nem admissão de onde o modelo pode falhar. Três estrelas e três quartos — honesto, bem calibrado, mas menos working exposto. O ensaio também não explora contra-exemplos onde OSINT civil de fato antecipou inteligência estatal — casos como Bellingcat na Síria ou rastreamento de movimentos de tropas russas via Strava. A ausência dessa discussão enfraquece a calibração.
Evaluator State
Before: "O dedo aponta para algo que vale a pena. A precisão continua energizando. Mas agora vi qual dos dois lugares deixa você sem palavras por razões novas."After: "O til ~ oscila entre aproximação e negação — sinto a tensão de quem vê o trabalho epistêmico sendo feito e o atalho sendo vendido."