Há uma história famosa no mundo dos dados: um supermercado teria descoberto que, ao fim da tarde, quem comprava fraldas comprava também cerveja. A história é provavelmente exagerada, mas ficou porque ilustra uma ideia poderosa — dentro dos recibos de compra escondem-se padrões que ninguém planeou e que podem valer dinheiro.
A análise de cabaz de compras (em inglês, market basket analysis) é a técnica que procura esses padrões. Em vez de olhar para produtos um a um, olha para o que aparece em conjunto na mesma transação. A pergunta que responde é fácil de enunciar e difícil de responder à mão: que produtos tendem a ser comprados juntos, e com que força?
Este artigo explica a técnica sem matemática intimidante. Vamos ver os três números que interessam, um exemplo passo a passo, o que fazer com os resultados e os erros que levam muita gente a tirar conclusões erradas de padrões que, afinal, não significam nada.
O que é a análise de cabaz de compras
No essencial, é uma forma de encontrar regras de associação do tipo "quem compra A tende a comprar B". Cada compra é um cabaz — o conjunto de artigos que passaram na caixa ao mesmo tempo. Ao analisar milhares ou milhões destes cabazes, procuram-se combinações que aparecem com frequência e, sobretudo, que aparecem juntas mais do que seria de esperar por acaso.

O objetivo não é só curiosidade. Saber o que se vende em conjunto informa decisões concretas: que produtos sugerir na página de um artigo, que pacotes criar, onde colocar os produtos na loja e que promoções fazem sentido — e quais destroem margem sem ganhar vendas.
Os três números que interessam: suporte, confiança e lift
Toda a técnica assenta em três medidas. Percebê-las é a maior parte do trabalho.
- Suporte: com que frequência a combinação aparece. É a proporção de cabazes que contêm, por exemplo, A e B ao mesmo tempo. Um suporte alto significa que o padrão é comum.
- Confiança: dado que alguém comprou A, com que probabilidade compra também B. É a força da regra "A leva a B", mas, por si só, engana.
- Lift: quão mais provável é comprar B quando se compra A, comparado com comprar B em geral. Um lift de 1 significa que não há relação; acima de 1, há atração; abaixo de 1, os produtos até se repelem.
O lift é o número que evita a maior armadilha. Um produto muito popular — digamos, sacos de plástico — aparece com quase tudo e gera confiança alta em muitas regras. Mas isso não é um padrão útil: é só popularidade. O lift corrige isto ao comparar com a frequência base do produto.
Um exemplo passo a passo
Imagine-se uma loja com 1000 transações. O café aparece em 200 (suporte de 20%). O açúcar aparece em 150 (15%). Café e açúcar juntos aparecem em 120 transações (suporte de 12%).
A confiança da regra "café leva a açúcar" é 120 a dividir por 200, ou seja, 60%: de quem compra café, 60% também leva açúcar. Parece forte. O lift confirma: 60% de confiança a dividir pelos 15% de frequência base do açúcar dá um lift de 4. Comprar café torna a compra de açúcar quatro vezes mais provável do que o normal. Este é um padrão real e acionável.
Compare-se com os sacos de plástico, presentes em 700 transações (70%). Se "café leva a sacos" tiver 65% de confiança, parece alto — mas o lift é 65% a dividir por 70%, menos de 1. Não há associação; os sacos aparecem com café simplesmente porque aparecem com quase tudo.
Do padrão à ação: cross-sell, pacotes e layout
Encontrar regras é só metade do trabalho; a outra metade é agir sem estragar o que já funciona. Algumas aplicações típicas:
- Recomendações: sugerir B na página ou no checkout de A, usando o lift alto como critério de escolha.
- Pacotes e promoções: juntar produtos que já se compram em conjunto pode aumentar o valor médio da compra — mas cuidado para não descontar aquilo que as pessoas já comprariam de qualquer forma.
- Disposição da loja e do site: aproximar (ou, por vezes, afastar) produtos associados para influenciar o percurso de compra.
- Gestão de stock: antecipar que a rutura de um produto pode arrastar a quebra de vendas do seu par.
Regras de associação para além do retalho
Embora tenha nascido no retalho, a mesma lógica aplica-se em muitos setores. Na banca, ajuda a perceber que produtos financeiros são contratados em conjunto. Na saúde, encontra combinações de diagnósticos ou tratamentos que ocorrem juntos. Em plataformas digitais, revela que funcionalidades são usadas pelas mesmas pessoas. Em qualquer contexto onde existam cabazes de itens, a técnica tem espaço.
Cuidados: correlação não é causa
O maior risco é ler causalidade onde só há coincidência. Que A e B apareçam juntos não quer dizer que A provoque a compra de B; ambos podem ser puxados por uma terceira razão — uma promoção, uma época do ano, o perfil de quem visita a loja àquela hora.
Outros cuidados: a sazonalidade distorce padrões (o que é verdade no Natal não é em julho); regras óbvias — pão e manteiga — confirmam a técnica mas não trazem valor novo; e um suporte demasiado baixo produz regras que parecem fortes mas assentam em pouquíssimas transações, sendo pouco fiáveis. Convém sempre exigir um suporte mínimo e validar as regras com quem conhece o negócio.
Ferramentas e como começar
Não é preciso comprar software caro para começar. Com SQL, é possível calcular suporte, confiança e lift a partir de uma tabela de transações com algumas junções e agregações. Em Python, bibliotecas dedicadas implementam algoritmos como o Apriori e o FP-Growth, que encontram combinações frequentes de forma eficiente. E ferramentas como o Power BI permitem visualizar e explorar as regras encontradas de forma acessível para o negócio.
O caminho pragmático é começar simples: escolher uma categoria de produtos, calcular as regras com suporte e lift razoáveis, e testar uma ou duas ações concretas antes de generalizar. Medir o efeito é essencial — uma regra só vale se, ao agir sobre ela, alguma coisa melhora.
Mini-caso: uma empresa de retalho alimentar
Uma cadeia de retalho alimentar de média dimensão queria aumentar o valor médio por compra sem baixar preços. Em vez de promoções gerais, analisou seis meses de transações à procura de associações com lift elevado dentro de categorias complementares.
Descobriu que quem comprava um certo tipo de massa fresca comprava muitas vezes um molho específico, com um lift de 3,2 — mas apenas 18% de quem levava a massa levava o molho. A equipa colocou os dois produtos lado a lado e criou uma sugestão no site. Ao fim de dois meses, a taxa de compra conjunta subiu para 27% e o valor médio do cabaz nas transações com massa cresceu cerca de 6%, sem descontos. O ganho não veio de uma grande campanha, mas de perceber um padrão que já existia e remover o atrito para o seguir.
Na prática
A análise de cabaz de compras é uma das técnicas com melhor relação entre esforço e retorno em analítica de retalho. Precisa de dados que a maioria das empresas já tem — o histórico de transações — e devolve padrões que se traduzem em ações concretas. A chave é olhar para o lift e não só para a confiança, exigir suporte suficiente e validar as regras com o conhecimento do negócio.
Feita com cuidado, deixa de ser uma curiosidade estatística para se tornar uma ferramenta de decisão: o que oferecer, o que juntar e onde colocar cada produto. Os padrões já estão nos teus recibos; falta olhar para eles.