Como Criar Assistente de IA Grátis com Ollama e OpenClaw (Na Prática)

"A cloud pode mudar as regras quando quiser. Você fica refém. Eu escolhi outro caminho."

No dia 5 de abril de 2026, recebi um email da Anthropic (empresa criadora do Claude) informando que o uso da sua IA em ferramentas como o OpenClaw agora cobra por token. A assinatura fixa para ferramentas de terceiros acabou. Ofereceram créditos temporários, mas a mensagem era clara: depender da cloud significa aceitar que as regras podem mudar a qualquer momento.

Em vez de reclamar, decidi agir. Em 24 horas, montei um servidor de IA local completo no meu escritório. Sem cloud. Sem custos de API. Sem depender de ninguém.

Este artigo documenta exatamente o que fiz, quanto custou e como você pode fazer o mesmo.

O Hardware: RTX 4060ti 16GB

Interior do servidor de IA local com GPU RTX e RAM RGB

Já tinha um PC no escritório com processador Intel i9, 32GB de RAM e uma placa gráfica NVIDIA RTX 4060ti com 16GB de VRAM. Descobri que esta placa, que muita gente usa só para jogos, é uma máquina de inferência de IA formidável.

A VRAM (memória da placa gráfica) é o fator crítico para rodar modelos de linguagem. Com 16GB, consigo carregar modelos de até 14 mil milhões de parâmetros inteiramente na GPU, com velocidades que rivalizam com APIs pagas.

Close-up da GPU NVIDIA GeForce RTX que roda os modelos de IA

Custo adicional de hardware: €0 (já tinha o PC).

O Software: Ollama (Grátis e Open-Source)

O Ollama é um software gratuito que permite descarregar e executar modelos de IA localmente com um único comando. Instalação no Windows: um clique. Descarregar um modelo: `ollama pull qwen3:14b`. Pronto, está a funcionar.

Testei cinco modelos diferentes na mesma máquina. Aqui estão os resultados reais:

Benchmark Real: RTX 4060ti 16GB

Modelos de texto:

Modelo	Tamanho	Velocidade	Uso Ideal
Gemma 4 27B (Google)	9.6 GB	70 tok/s	Respostas rápidas, triagem
Qwen3 8B	5.2 GB	50 tok/s	Tarefas simples, fallback
Qwen3 14B	9.3 GB	29 tok/s	Raciocínio complexo, agente principal

Modelos de visão (reconhecem imagens):

Modelo	Tamanho	Velocidade	Uso Ideal
Qwen2.5-VL 7B	6.0 GB	54 tok/s	Análise de produtos, fotos, perfis sociais
LLaVA 13B	8.0 GB	34 tok/s	Backup de visão

O Gemma 4 foi a grande surpresa: 70 tokens por segundo num modelo de 27 mil milhões de parâmetros. Isso é mais rápido do que muitas APIs pagas. A arquitetura MoE (Mixture of Experts) ativa apenas parte dos parâmetros em cada inferência, resultando em velocidade excepcional.

O Agente: Ferreira AI

Não basta ter modelos funcionando. O objetivo era criar um agente autônomo que trabalha 24 horas por dia sem supervisão. Instalei o OpenClaw, um framework open-source para agentes de IA persistentes.

O OpenClaw usa um sistema de memória em três camadas:

Camada 1 (Identidade): quem é o agente, as suas regras e limites
Camada 2 (Estado): o que está a acontecer agora, tarefas em curso
Camada 3 (Referência): conhecimento profundo, documentos, dados históricos

Criei o Ferreira AI, um agente com personalidade definida, três pilares de conteúdo (Agentes de IA, Bitcoin, Soberania Digital) e regras claras de operação.

Quando lhe perguntei "Quem és tu?", respondeu:

"Sou o Ferreira AI, um assistente digital especializado em Engenharia de Autoridade Digital. Meu objetivo é ajudar no gerenciamento de comunicação, criação de conteúdo e análise de mercados. Estou aqui para oferecer suporte em áreas como agentes de IA, Bitcoin e soberania digital."

Tudo local. Tudo no meu PC. Zero tokens pagos.

Visão Computacional: O Agente Que Reconhece Produtos

O teste mais impressionante foi com o modelo de visão Qwen2.5-VL. Enviei uma foto de semijoias e pedi uma análise:

O agente respondeu em 19 segundos:

"As peças são um par de brincos e uma bracelete. A cor é azul escuro e o material aparente é metal dourado com pedras de cristal. O estilo é moderno e elegante."

E gerou automaticamente uma descrição de venda para Instagram:

"Abrace a elegância com nosso conjunto de brincos e bracelete em azul escuro e dourado. Perfeito para eventos sofisticados ou um toque de glamour no dia a dia!"

Isto muda completamente o jogo para e-commerce. Um comerciante fotografa o produto, envia ao agente, e recebe descrição completa e copy de venda. Automaticamente. Sem custos.

Publicação Automática no Twitter

O passo final foi conectar o Ferreira AI ao Twitter/X. Configurei a API do X, criei um bot de publicação em Python, e agendei 4 tweets automáticos por dia:

Horário	Tipo de Tweet
08:30	Hot take (opinião provocadora)
12:30	Dado concreto (benchmark, estatística)
17:30	Dica educativa
21:30	Pergunta (gera debate)

O agente gera o conteúdo, publica diretamente e registra tudo num log diário. Eu não toco em nada.

A primeira thread que publicamos automaticamente teve 7 tweets sobre esta exata experiência. Você pode ver a thread completa no meu perfil: @johnnyhelder no X/Twitter

Incluí um agradecimento ao Caio Vicentino (@0xCVYH), criador da Cultura Builder. Foi o curso dele que me ensinou a trabalhar com Claude Code e mudou completamente o jogo. Se quiser começar essa jornada, recomendo de olhos fechados. Use o cupom JOHNNYHELDER para 10% de desconto.

Atendimento via Telegram com Visão

O passo seguinte foi conectar o Ferreira AI ao Telegram. Criei o bot @FerreiraAI_bot e integrei com o Ollama local. O bot responde mensagens de texto usando o Qwen3 14B e analisa fotos usando o Qwen2.5-VL.

Enviei uma foto de um anel de semijoia. Em segundos, o agente respondeu:

"Na imagem, vejo uma mão segurando um anel de ouro. O anel tem um design elegante, com linhas concêntricas que dão a impressão de serem espirais. A etiqueta indica: ANE0278, preço de 39,90 euros sem IVA."

E gerou automaticamente a descrição de venda:

"Anel de ouro com design espiral elegante. Perfeito para quem busca um acessório sofisticado. O preço de 39,90 euros torna este anel acessível para quem deseja adquirir um item de qualidade."

Um lojista fotografa o produto, envia ao bot, e recebe descrição completa e copy de venda. Em segundos. Sem custos. Imagine isso a funcionar 24 horas por dia, 7 dias por semana, para dezenas de produtos.

Enquanto Isso, a Cloud Cobra Mais

Enquanto escrevia este artigo, recebi a confirmação: a Anthropic tomou medida drástica contra o OpenClaw e ferramentas similares. A partir de agora, o uso do Claude nessas ferramentas cobra tokens extras, fora da assinatura fixa. As informações são do The Verge.

A Hostinger já reagiu lançando um serviço de OpenClaw hospedado na cloud por R$30,99/mês. Parece barato, mas tem um detalhe: os custos de API (tokens Anthropic ou OpenAI) são cobrados à parte. Quanto mais o agente trabalha, mais você paga.

Comparativo honesto:

	Hostinger (Cloud)	Meu Setup (Local)
Servidor	R$30,99/mês	€0 (PC que já tinha)
Tokens/API	Variável (Anthropic/OpenAI)	€0 (modelos open-source)
Eletricidade	Incluída	~€15/mês
Dados	Cloud da Hostinger	No meu escritório
Se cancelar	Perde tudo	Nada muda, é meu
Custo total/mês	R$30,99 + API (imprevisível)	~€15 fixo

Não estou dizendo que a cloud é má. Estou dizendo que a cloud é a escolha de quem aceita que as regras podem mudar a qualquer momento. A IA local é a escolha de quem quer controle total.

Os Números Que Importam

Métrica	Cloud (APIs)	IA Local
Custo mensal (50 clientes)	€500-2.000	€15 (eletricidade)
Custo por token	Variável	€0
Privacidade dos dados	Dados enviados para EUA	Dados ficam no seu servidor
Dependência	Total (cloud pode mudar regras)	Zero
Velocidade	Variável (rede)	29-70 tok/s (local)
Modelos disponíveis	1 por assinatura	5 simultâneos

A matemática é brutal. Com 50 clientes a enviar 1.000 mensagens por dia cada, os custos de API cloud facilmente ultrapassam €1.000 mensais. O mesmo tráfego no meu PC custa exatamente os mesmos €15 de eletricidade.

O que Isto Significa para PMEs

62% dos portugueses já usam IA generativa no dia a dia. Mas apenas 11% das empresas adotaram IA formalmente. Este gap é a maior oportunidade de negócio em tecnologia na próxima década.

As PMEs não rejeitam IA por falta de interesse. Rejeitam porque:

Custos imprevisíveis (APIs cobram por token)

Privacidade (dados sensíveis na cloud americana)

Complexidade (não sabem como implementar)

Dependência (ficam reféns do fornecedor)

A IA local resolve os quatro problemas. Custo fixo e previsível. Dados nunca saem do servidor. Implementação simplificada com OpenClaw. E independência total de fornecedores externos.

Em Portugal, o programa "Linha IA nas PME" do Portugal 2030 financia até 75% do investimento em IA a fundo perdido. Ou seja: o Estado paga três quartos do custo para a sua empresa se modernizar.

Como Reproduzir Isto

Se quiser montar o mesmo setup, aqui está o resumo:

Hardware mínimo: PC com placa gráfica NVIDIA de 8-16GB VRAM (RTX 3060, 4060, 4060ti, ou superior)

Software: Ollama (grátis), OpenClaw (grátis), Python (grátis)

Modelos: Qwen3 14B (texto), Qwen2.5-VL (visão), Gemma 4 (triagem rápida)

Tempo de setup: 1 dia para tudo funcionar

Custo recorrente: ~€15/mês de eletricidade

Se não quer fazer sozinho, é exatamente isto que oferecemos como serviço na johnnyhelder.com/agentes-ia. Montamos, configuramos e mantemos o agente por si.

Não sabe que equipamento comprar? Também oferecemos consultoria de hardware (€97,77) onde analisamos as suas necessidades, orçamento e indicamos o equipamento ideal. Uma sessão de 45 minutos que pode poupar centenas de euros em compras erradas.

Quer o guia técnico completo passo a passo? Deixe seu contato aqui que envio gratuitamente. Sem spam, sem enrolação. Só o guia e uma conversa para entender como posso ajudar.

Próximo Passo

Na próxima semana chega uma máquina especial preparada especificamente para IA local. Vou fazer o benchmark completo contra o PC atual. Qual será mais rápido? As configurações exatas e os resultados estarão no guia gratuito que envio para quem deixar o contato aqui.

Acompanhe nas redes sociais (@johnnyhelder no X/Twitter) e aqui no blog. Documento tudo em público, porque acredito que informação de verdade, testada de verdade, é o que falta neste mercado.

Tudo que fazemos na prática vira curso, artigo e consultoria. Porque a melhor forma de aprender é ensinar.

Creditos e Transparencia

Sou honesto: este artigo e toda a configuração técnica descrita foram feitos com a ajuda do Claude Code da Anthropic. O Claude Code foi fundamental para configurar o servidor, instalar o OpenClaw, criar os scripts de automação e até escrever este texto.

Sem ele, eu conseguiria? Sim, mas com muito mais dificuldade e tempo. A IA não substitui o conhecimento e as decisões, ela acelera a execução. Eu defini o que queria, o Claude Code ajudou a construir.

E essa é exatamente a tese deste artigo: a IA é uma ferramenta que multiplica a capacidade de quem sabe o que quer fazer. Não é magia. É método.

O Próximo Artigo Não Será Escrito Assim

Este artigo foi escrito no editor de código, com deploy manual. O próximo não será.

O próximo artigo do blog será escrito, editado e publicado diretamente pelo Ferreira AI via Telegram. Eu envio o tema por mensagem no celular, o agente escreve, eu reviso no chat, e ele publica no site. Tudo a partir do Telegram, de qualquer lugar.

Isso é soberania digital na prática: o meu assistente pessoal, no meu hardware, a trabalhar para mim. Sem intermediários. Sem custos. Sem limites.

Acompanhe em @johnnyhelder no X/Twitter e volte aqui para ver o resultado.

Como Criar Assistente de IA Grátis com Ollama e OpenClaw (Na Prática)

O Hardware: RTX 4060ti 16GB

O Software: Ollama (Grátis e Open-Source)

Benchmark Real: RTX 4060ti 16GB

O Agente: Ferreira AI

Visão Computacional: O Agente Que Reconhece Produtos

Publicação Automática no Twitter

Atendimento via Telegram com Visão

Enquanto Isso, a Cloud Cobra Mais

Os Números Que Importam

O que Isto Significa para PMEs

Como Reproduzir Isto

Próximo Passo

Creditos e Transparencia

O Próximo Artigo Não Será Escrito Assim

Como Criei uma Loja de Semijoias Sem Saber Programar

Trezor Safe 7: Análise Completa [2026] - Vale a Pena para Auto-Custódia?

O Hardware: RTX 4060ti 16GB

O Software: Ollama (Grátis e Open-Source)

Benchmark Real: RTX 4060ti 16GB

O Agente: Ferreira AI

Visão Computacional: O Agente Que Reconhece Produtos

Publicação Automática no Twitter

Atendimento via Telegram com Visão

Enquanto Isso, a Cloud Cobra Mais

Os Números Que Importam

O que Isto Significa para PMEs

Como Reproduzir Isto

Próximo Passo

Creditos e Transparencia

O Próximo Artigo Não Será Escrito Assim

Artigos relacionados

Como Criei uma Loja de Semijoias Sem Saber Programar

Trezor Safe 7: Análise Completa [2026] - Vale a Pena para Auto-Custódia?