O Poder dos Gráficos na Estatística
- Roger Sampaio
- 13 de jan.
- 6 min de leitura
Atualizado: 13 de jan.
Fala meus guerreiros. Como diz em um provérbio antigo, uma imagem vale muito mais que mil palavras, na Estatística também. Independente do que estamos estudando ou trabalhando, é fácil visualizar, mentalizar e interpretar alguns poucos números. No entanto quando temos muitos números, a nossa cabeça começa a dar um nó, ao ponto de podermos até sonhar com eles atormentando nosso sonho, concorda meu guerreiros? Penso que sim. Logo entra uma ferramenta fabulosa para facilitar nossa vida: os gráficos. Nesse artigo vamos explorar os gráficos mais utilizados aprendendo principalmente o conceito e como gerá-lo através da ferramenta python. Apertem os cintos, porque vamos decolar.

O que é um gráfico?
Um gráfico é uma representação visual de dados ou informações. Em outras palavras, trata-se de uma imagem que resume alguma história contada pelo dados. Gráficos são usados para mostrar relações, padrões ou tendências de forma clara e rápida, basta apenas poucos segundos sobre eles, rapidamente interpretarmos. Eles podem ser muito úteis principalmente quando estamos apresentando resultados de pesquisas, estudos para gestores, os quais tomarão decisões importantes sobre o negócio, visto que dificilmente lerão relatórios extensos em quantidade de páginas, cheio de números e tabelas.
Suponha que você é um grande empresário, dono de uma loja de sapatos, localizado em um bairro nobre de Brasília. Os clientes adoram você e também sua loja foi mencionada como uma referência pelo bom atendimento prestado. Você aproveita o inicio do ano de 2025 e define como meta dobrar seu faturamento para chegar nos seus primeiros sete dígitos. Eita ambição, hein, meu guerreiro? Bem, tudo é possível e começa com uma decisão. Então a primeira pergunta é: como estão as vendas no ano anterior? Você solicita um relatório detalhado (faturamento por mês) ao setor financeiro da empresa. Veja:

Como são poucos dados, podemos rapidamente tirar algumas conclusões. O mês que mais vendeu foi em novembro, enquanto dezembro teve o menor faturamento. O mês de setembro é segundo que mais vendeu. Agora observe a mesma tabela representa graficamente:

Não importa a ferramenta que foi utilizada para gerar o gráfico aqui. Note que olhando o gráfico vemos facilmente o padrão: quedas, subidas e o meses envolvidos. Em menos de dois segundos, percebemos que o mês que teve maior número de vendas foi novembro, já que representa o pico do gráfico. Guerreiro, perceba ainda que durante o meses de junho até setembro há um aumento expansivo de vendas e cai bruscamente em outubro. Isso poderia ser facilmente um trabalho investigativo com a área de negócio entendendo os porquês. Agora, você, dono do negócio, já tem algo para começar a trabalhar e pensar em estratégias.
Os gráficos mais utilizados na Estatística são: gráfico de linhas, gráfico de barras, gráfico de pizza, histograma, gráfico de dispersão, boxplot. Vamos destrinchar alguns deles agora, meu guerreiro.

Gráfico de Linhas?
Ele é utilizado para representar a relação entre duas variáveis, uma delas é quantitativa contínua, enquanto a outra varia ao longo do tempo. A linha gerada pelo gráfico nada mais é do que a conexão dos pontos isolados. Vamos retornar ao exemplo da sua loja de sapatos, comentado anteriormente. Você, como grande pensador e inteligente, deseja analisar dois anos consecutivos as vendas, ou seja, 2023 e 2024. Ao solicitar ao departamento financeiro, obtém o seguinte relatório de vendas.

Note a quantidade de linhas na tabela cresceu, visto que temos agora 24 meses. Podemos analisar separadamente o ano de 2023 assim como fizemos com o ano de 2024. Suponha que queríamos resumir o faturamento por mês, independente do ano que estou falando. E agora meu guerreiro, temos dois valores de faturamento para cada mês, qual devemos escolher para o gráfico? Pense comigo. Não será nenhum deles. Como assim, professor? Precisamos sumarizar, resumir o faturamento por mês. E nesse caso, utilizaremos a soma para responder a pergunta de negócio. Sumarizando, agrupando por mês teremos:

Plotando teremos:

Importante ressaltar que nesse tipo de gráfico o eixo x (horizontal) geralmente é a variável independente como, por exemplo, o tempo. Já o eixo y (vertical) é a variável dependente, ou seja, aquela que está sendo analisada. No nosso exemplo é o faturamento das vendas em reais. O gráfico ainda está ordenado quanto a série do tempo para que possamos compreender a ideia de um tendência ao longo do tempo.
Gráfico de Barras?
Ele é um dos gráficos mais utilizados atualmente principalmente pelo fato de ser facilmente interpretável. Serve para representar dados categóricos ou discretos de forma comparativa. As barras representadas no gráfico podem estar em posição horizontal ou vertical. Retornando ao exemplo da loja de sapatos, suponha que existam diversas marcas de produtos esportivos: Nike, Adidas, Reebok. Iremos trabalhar apenas com os três primeiros meses.

Queremos responder a seguinte pergunta de negócio: como está o comparativo de vendas por marca nos três primeiros meses dos ano de 2023? A intenção é descobrir quais são as marcas que estão vendendo mais e as que não estão. Precisamos primeiramente agrupar os dados para que mostre apenas um único valor no mês, sumarizado (resumido) por marca e posteriormente montar o gráfico. Veja:

Veja que o o eixo x representa a marca(dado categórico), enquanto o eixo y as vendas, no caso o somatório. Perceba que a marca que mais vendeu independente do mês foi Nike, seguido da Adidas e por fim a Reebok. O código da construção desse gráfico, os demais, as bases de dados fornecidas estão disponíveis no git, link referenciado ao final do artigo. Meu guerreiro não mostraremos código aqui, por que a intenção principal é aprendermos o conceito, a base. O código para geração do gráfico, seja utilizando Python, PowerBI, Excel ou qualquer outra ferramenta é irrelevante nesse momento, embora usamos Python.
Gráfico de Pizza?
Ele é utilizado para representação da distribuição dos dados categóricos, porém em formato percentual, dando uma ideia de composição. Chamado também de gráfico de setores e didaticamente 'pizza' porque transmite a ideia de uma pizza fatiada em diversos pedaços, que podem ou não ter o mesmo tamanho. Didaticamente pense em uma pizza de domingo a noite a ser dividida em uma família. A forma que a pizza será dividida depende da família (base de dados). Algumas famílias serão mais unidas e justas, e todo os membros pegarão a mesma quantidade de pedaços. Já na família, por exemplo, Soares, o pai é guloso e sempre fica com 2/3 da pizza.
Caso queiramos representar o percentual(não mais a quantidade) de vendas por categoria apenas durante os três primeiros de 2023, podemos utilizar o gráfico de barras. Observe que quase 50% das vendas é a Nike, seguido de 33% da Adidas e 18% do Reebok.

Importante ressaltar que o gráfico de pizza assim como todos os demais devem estar legíveis. Recomendado o gráfico ter em torno de duas a quatro categorias, porque facilita a interpretação. Caso tenha muitas categorias, mais de cinco ou seis, pode ser difícil de interpretar, porque as fatias se tornam pequenas e sobrepõem-se. Para esse caso, poderíamos utilizar outras formas de visualização.
Histograma?
Serve para representar a distribuição dos dados de uma variável contínua ou discreta. Facilmente conseguimos percebemos quais os valores mais e menos presentes, além de detectar o formato da distribuição como, por exemplo, simétrica ou assimétrica. Veja um exemplo, representando as vendas dos três primeiros meses de 2023.

Note que os valores giraram em torno de um pouco abaixo de 20 mil e no máximo. O que mais temos são vendas entre 40 a 60 mil. Não há vendas entre 60 a 80 mil. E se quisermos representar tanto o ano de 2023 como 2024?

Perceba que os valores de vendas giram agora entre um pouco abaixo de 80 mil até um pouco acima de 180 mil. Os valores das vendas mais frequentes são entre 140 a 160 mil. Embora o histograma se assemelhe ao gráfico de barras, são ferramentas diferentes quanto ao propósito.
E ao final das contas?
Não existe um gráfico perfeito ou mestre, no sentido de atender a todas as situações. Ao contrário: cada gráfica é uma ferramenta, servindo para um proposito específico para contar uma história com os dados. Na prática, ou seja, em projetos reais de ciência de dados utilizamos diversos gráficos principalmente na análise exploratória dos dados. Abuse sempre dos gráficos para contar uma história, lembrando que uma 'imagem vale muito mais que mil palavras', 'um gráfico mais que mil tabelas'. Espero que tenha gostado. Beijos e até mais. Os scripts da aula estão aqui.

Comments