Como Criar Assistente de IA Grátis com Ollama e OpenClaw (Na Prática)
Como configurei 5 modelos de inteligência artificial no meu PC, criei um agente autônomo com visão e publiquei no Twitter sem tocar no teclado
"A cloud pode mudar as regras quando quiser. Você fica refém. Eu escolhi outro caminho."
No dia 5 de abril de 2026, recebi um email da Anthropic (empresa criadora do Claude) informando que o uso da sua IA em ferramentas como o OpenClaw agora cobra por token. A assinatura fixa para ferramentas de terceiros acabou. Ofereceram créditos temporários, mas a mensagem era clara: depender da cloud significa aceitar que as regras podem mudar a qualquer momento.
Em vez de reclamar, decidi agir. Em 24 horas, montei um servidor de IA local completo no meu escritório. Sem cloud. Sem custos de API. Sem depender de ninguém.
Este artigo documenta exatamente o que fiz, quanto custou e como você pode fazer o mesmo.
O Hardware: RTX 4060ti 16GB

Já tinha um PC no escritório com processador Intel i9, 32GB de RAM e uma placa gráfica NVIDIA RTX 4060ti com 16GB de VRAM. Descobri que esta placa, que muita gente usa só para jogos, é uma máquina de inferência de IA formidável.
A VRAM (memória da placa gráfica) é o fator crítico para rodar modelos de linguagem. Com 16GB, consigo carregar modelos de até 14 mil milhões de parâmetros inteiramente na GPU, com velocidades que rivalizam com APIs pagas.

Custo adicional de hardware: €0 (já tinha o PC).
O Software: Ollama (Grátis e Open-Source)
O Ollama é um software gratuito que permite descarregar e executar modelos de IA localmente com um único comando. Instalação no Windows: um clique. Descarregar um modelo: `ollama pull qwen3:14b`. Pronto, está a funcionar.
Testei cinco modelos diferentes na mesma máquina. Aqui estão os resultados reais:
Benchmark Real: RTX 4060ti 16GB
Modelos de texto:
| Modelo | Tamanho | Velocidade | Uso Ideal |
|---|---|---|---|
| Gemma 4 27B (Google) | 9.6 GB | 70 tok/s | Respostas rápidas, triagem |
| Qwen3 8B | 5.2 GB | 50 tok/s | Tarefas simples, fallback |
| Qwen3 14B | 9.3 GB | 29 tok/s | Raciocínio complexo, agente principal |
Modelos de visão (reconhecem imagens):
| Modelo | Tamanho | Velocidade | Uso Ideal |
|---|---|---|---|
| Qwen2.5-VL 7B | 6.0 GB | 54 tok/s | Análise de produtos, fotos, perfis sociais |
| LLaVA 13B | 8.0 GB | 34 tok/s | Backup de visão |
O Gemma 4 foi a grande surpresa: 70 tokens por segundo num modelo de 27 mil milhões de parâmetros. Isso é mais rápido do que muitas APIs pagas. A arquitetura MoE (Mixture of Experts) ativa apenas parte dos parâmetros em cada inferência, resultando em velocidade excepcional.
O Agente: Ferreira AI
Não basta ter modelos funcionando. O objetivo era criar um agente autônomo que trabalha 24 horas por dia sem supervisão. Instalei o OpenClaw, um framework open-source para agentes de IA persistentes.
O OpenClaw usa um sistema de memória em três camadas:
- Camada 1 (Identidade): quem é o agente, as suas regras e limites
- Camada 2 (Estado): o que está a acontecer agora, tarefas em curso
- Camada 3 (Referência): conhecimento profundo, documentos, dados históricos
Criei o Ferreira AI, um agente com personalidade definida, três pilares de conteúdo (Agentes de IA, Bitcoin, Soberania Digital) e regras claras de operação.
Quando lhe perguntei "Quem és tu?", respondeu:
"Sou o Ferreira AI, um assistente digital especializado em Engenharia de Autoridade Digital. Meu objetivo é ajudar no gerenciamento de comunicação, criação de conteúdo e análise de mercados. Estou aqui para oferecer suporte em áreas como agentes de IA, Bitcoin e soberania digital."
Tudo local. Tudo no meu PC. Zero tokens pagos.
Visão Computacional: O Agente Que Reconhece Produtos
O teste mais impressionante foi com o modelo de visão Qwen2.5-VL. Enviei uma foto de semijoias e pedi uma análise:
O agente respondeu em 19 segundos:
"As peças são um par de brincos e uma bracelete. A cor é azul escuro e o material aparente é metal dourado com pedras de cristal. O estilo é moderno e elegante."
E gerou automaticamente uma descrição de venda para Instagram:
"Abrace a elegância com nosso conjunto de brincos e bracelete em azul escuro e dourado. Perfeito para eventos sofisticados ou um toque de glamour no dia a dia!"
Isto muda completamente o jogo para e-commerce. Um comerciante fotografa o produto, envia ao agente, e recebe descrição completa e copy de venda. Automaticamente. Sem custos.
Publicação Automática no Twitter
O passo final foi conectar o Ferreira AI ao Twitter/X. Configurei a API do X, criei um bot de publicação em Python, e agendei 4 tweets automáticos por dia:
| Horário | Tipo de Tweet |
|---|---|
| 08:30 | Hot take (opinião provocadora) |
| 12:30 | Dado concreto (benchmark, estatística) |
| 17:30 | Dica educativa |
| 21:30 | Pergunta (gera debate) |
O agente gera o conteúdo, publica diretamente e registra tudo num log diário. Eu não toco em nada.
A primeira thread que publicamos automaticamente teve 7 tweets sobre esta exata experiência. Você pode ver a thread completa no meu perfil: @johnnyhelder no X/Twitter
Incluí um agradecimento ao Caio Vicentino (@0xCVYH), criador da Cultura Builder. Foi o curso dele que me ensinou a trabalhar com Claude Code e mudou completamente o jogo. Se quiser começar essa jornada, recomendo de olhos fechados. Use o cupom JOHNNYHELDER para 10% de desconto.
Atendimento via Telegram com Visão
O passo seguinte foi conectar o Ferreira AI ao Telegram. Criei o bot @FerreiraAI_bot e integrei com o Ollama local. O bot responde mensagens de texto usando o Qwen3 14B e analisa fotos usando o Qwen2.5-VL.
Enviei uma foto de um anel de semijoia. Em segundos, o agente respondeu:
"Na imagem, vejo uma mão segurando um anel de ouro. O anel tem um design elegante, com linhas concêntricas que dão a impressão de serem espirais. A etiqueta indica: ANE0278, preço de 39,90 euros sem IVA."
E gerou automaticamente a descrição de venda:
"Anel de ouro com design espiral elegante. Perfeito para quem busca um acessório sofisticado. O preço de 39,90 euros torna este anel acessível para quem deseja adquirir um item de qualidade."
Um lojista fotografa o produto, envia ao bot, e recebe descrição completa e copy de venda. Em segundos. Sem custos. Imagine isso a funcionar 24 horas por dia, 7 dias por semana, para dezenas de produtos.
Enquanto Isso, a Cloud Cobra Mais
Enquanto escrevia este artigo, recebi a confirmação: a Anthropic tomou medida drástica contra o OpenClaw e ferramentas similares. A partir de agora, o uso do Claude nessas ferramentas cobra tokens extras, fora da assinatura fixa. As informações são do The Verge.
A Hostinger já reagiu lançando um serviço de OpenClaw hospedado na cloud por R$30,99/mês. Parece barato, mas tem um detalhe: os custos de API (tokens Anthropic ou OpenAI) são cobrados à parte. Quanto mais o agente trabalha, mais você paga.
Comparativo honesto:
| Hostinger (Cloud) | Meu Setup (Local) | |
|---|---|---|
| Servidor | R$30,99/mês | €0 (PC que já tinha) |
| Tokens/API | Variável (Anthropic/OpenAI) | €0 (modelos open-source) |
| Eletricidade | Incluída | ~€15/mês |
| Dados | Cloud da Hostinger | No meu escritório |
| Se cancelar | Perde tudo | Nada muda, é meu |
| Custo total/mês | R$30,99 + API (imprevisível) | ~€15 fixo |
Não estou dizendo que a cloud é má. Estou dizendo que a cloud é a escolha de quem aceita que as regras podem mudar a qualquer momento. A IA local é a escolha de quem quer controle total.
Os Números Que Importam
| Métrica | Cloud (APIs) | IA Local |
|---|---|---|
| Custo mensal (50 clientes) | €500-2.000 | €15 (eletricidade) |
| Custo por token | Variável | €0 |
| Privacidade dos dados | Dados enviados para EUA | Dados ficam no seu servidor |
| Dependência | Total (cloud pode mudar regras) | Zero |
| Velocidade | Variável (rede) | 29-70 tok/s (local) |
| Modelos disponíveis | 1 por assinatura | 5 simultâneos |
A matemática é brutal. Com 50 clientes a enviar 1.000 mensagens por dia cada, os custos de API cloud facilmente ultrapassam €1.000 mensais. O mesmo tráfego no meu PC custa exatamente os mesmos €15 de eletricidade.
O que Isto Significa para PMEs
62% dos portugueses já usam IA generativa no dia a dia. Mas apenas 11% das empresas adotaram IA formalmente. Este gap é a maior oportunidade de negócio em tecnologia na próxima década.
As PMEs não rejeitam IA por falta de interesse. Rejeitam porque:
A IA local resolve os quatro problemas. Custo fixo e previsível. Dados nunca saem do servidor. Implementação simplificada com OpenClaw. E independência total de fornecedores externos.
Em Portugal, o programa "Linha IA nas PME" do Portugal 2030 financia até 75% do investimento em IA a fundo perdido. Ou seja: o Estado paga três quartos do custo para a sua empresa se modernizar.
Em Portugal, o programa "Linha IA nas PME" do Portugal 2030 financia até 75% do investimento em IA a fundo perdido. Ou seja: o Estado paga três quartos do custo para a sua empresa se modernizar.
Como Reproduzir Isto
Se quiser montar o mesmo setup, aqui está o resumo:
Se não quer fazer sozinho, é exatamente isto que oferecemos como serviço na johnnyhelder.com/agentes-ia. Montamos, configuramos e mantemos o agente por si.
Não sabe que equipamento comprar? Também oferecemos consultoria de hardware (€97,77) onde analisamos as suas necessidades, orçamento e indicamos o equipamento ideal. Uma sessão de 45 minutos que pode poupar centenas de euros em compras erradas.
Quer o guia técnico completo passo a passo? Deixe seu contato aqui que envio gratuitamente. Sem spam, sem enrolação. Só o guia e uma conversa para entender como posso ajudar.
Próximo Passo
Na próxima semana chega uma máquina especial preparada especificamente para IA local. Vou fazer o benchmark completo contra o PC atual. Qual será mais rápido? As configurações exatas e os resultados estarão no guia gratuito que envio para quem deixar o contato aqui.
Acompanhe nas redes sociais (@johnnyhelder no X/Twitter) e aqui no blog. Documento tudo em público, porque acredito que informação de verdade, testada de verdade, é o que falta neste mercado.
Tudo que fazemos na prática vira curso, artigo e consultoria. Porque a melhor forma de aprender é ensinar.
Creditos e Transparencia
Sou honesto: este artigo e toda a configuração técnica descrita foram feitos com a ajuda do Claude Code da Anthropic. O Claude Code foi fundamental para configurar o servidor, instalar o OpenClaw, criar os scripts de automação e até escrever este texto.
Sem ele, eu conseguiria? Sim, mas com muito mais dificuldade e tempo. A IA não substitui o conhecimento e as decisões, ela acelera a execução. Eu defini o que queria, o Claude Code ajudou a construir.
E essa é exatamente a tese deste artigo: a IA é uma ferramenta que multiplica a capacidade de quem sabe o que quer fazer. Não é magia. É método.
O Próximo Artigo Não Será Escrito Assim
Este artigo foi escrito no editor de código, com deploy manual. O próximo não será.
O próximo artigo do blog será escrito, editado e publicado diretamente pelo Ferreira AI via Telegram. Eu envio o tema por mensagem no telemóvel, o agente escreve, eu reviso no chat, e ele publica no site. Tudo a partir do Telegram, de qualquer lugar.
Isso é soberania digital na prática: o meu assistente pessoal, no meu hardware, a trabalhar para mim. Sem intermediários. Sem custos. Sem limites.
Acompanhe em @johnnyhelder no X/Twitter e volte aqui para ver o resultado.