top of page

Box-plot

Atualizado: 2 de mai. de 2022

Em situações em que os dados da variável contínua que compõe a amostra são dispersos, apresentam coeficiente de variação elevado ou não carecem de representação em forma gráfica, podem utilizar o tipo de gráfico conhecido como Box-Plot para auxiliar na tarefa.

Exercício de reflexão: Pesquisa salarial e análise de distribuição de renda.

  • Amostra de salários: 465,00, 750,00, 980,00, 1.900,00, 5.500,00, 25.000,00, 2.250.000,00

  • Média: R$ 326.370,71

  • Mediana: R$ 1.900,00

Pergunta: Qual das medidas melhor representa o conjunto de salários?


Composição do Box-Plot

O gráfico de Box-Plot é especialmente útil na representação dos dados de variável contínua por apresentar o resumo de cinco medidas (ou seis) no mesmo objeto:

  • Mínimo e máximo: menor e maior valor calculado com base na variabilidade dos dados (média ± desvio padrão)

  • Q1 e Q3: posição que corresponde a 25% e a 75% dos dados

  • Mediana: posição que corresponde a 50% dos dados

  • Média: não faz parte das medidas originais no Box-Plot, mas foi incluída recentemente no Excel

  • Outlier: informação adicional que identifica valores da amostra que estejam acima ou abaixo das extremidades (mínimo e máximo)


Exemplo de Aplicação

Amostra: Percentual de rendimento mensal de três índices no período de Fev/2007 a Fev/2009 (Fonte: Yahoo Finance, 2009)

O gráfico de linha da série representa, mas não facilita a compreensão dos dados da amostra.


O quadro abaixo traz o resumo de algumas medidas, que aumenta a capacidade de análise do desempenho do índice, mas não facilita a comparação entre eles.

Média

Mediana

Mín

Máx

Q1

Q3

Desvio Padrão

CV

Ibovespa

-0,28%

0,84%

-24,80%

11,32%

-3,97%

6,72%

8,18%

-2934%

Dow Jones

-5,67%

-1,99%

-38,22%

8,97%

-6,89%

1,71%

11,46%

-202%

Nasdaq

-1,03%

-3,90%

-33,76%

23,94%

-7,15%

6,18%

13,27%

-1290%

No entanto, ao representar as 3 séries em um gráfico do tipo Box-Plot, a representação e, por consequência, interpretação fica facilitada.


Ao comparar as três séries, é possível, por exemplo:

  1. Identificar que existem pontos de outliers (potenciais extremos de perda) nos índices Ibovespa e Dow Jones

  2. Identificar o grande potencial de ganho (e perda) da Nasdaq em comparação às demais, demonstrando ser apropriado para investidores que toleram risco









Referência: prof. Wesley Almeida, Escola de Negócios, PUCPR
18 visualizações0 comentário

Posts recentes

Ver tudo

Tabela e Gráfico Dinâmico no Excel

Conceito abordado: Representação dos dados → Tabelas e Gráficos Ferramenta utilizada: Microsoft Excel v2016 Construindo tabela dinâmica...

bottom of page