Construção

Os conceitos básicos para você compreender como se constrói um boxplot envolvem os quartis da distribuição dos dados. Pense nos seus dados em uma escala numérica bem definida, ordenados do menor para o maior. Os três quartis são pontos nessa escala que dividem o seu conjunto de dados em quatro partes, todas com o mesmo número de observações.

Para calcular os três quartis, vamos inicialmente dividir o conjunto de dados em duas partes, cada uma com metade dos dados. Isto é, primeiro vamos calcular Q2, a mediana ou segundo quartil. A mediana é o valor central. Se há um número ímpar de dados no seu conjunto, a mediana é o valor central; se há um número par de observações, a mediana é a média dos dois valores centrais.

Calculado Q2, "esqueça" a mediana e considere agora as duas partes que ela gerou, uma abaixo da mediana e outra acima da mediana. Ambas têm o mesmo número de observações. O primeiro quartil será calculado como a mediana da parte inferior e o terceiro quartil será calculado como a mediana da parte superior.

É importante observar que diferentes programas computacionais podem calcular o primeiro e terceiro quartis de forma ligeiramente diferente, mas os valores resultantes não serão muito distantes. A forma aqui apresentada é a mais simples, já que envolve apenas o cálculo de medianas.

Outro conceito importante, que representa uma medida de dispersão, é o de amplitude interquartil, que é a distância entre Q1 e Q3, denotada por AIQ e calculada como AIQ = Q3 − Q1.

Finalmente, temos o conceito de valores discrepantes ou atípicos, que são valores muito afastados da grande parte dos dados. A regra que usaremos aqui é a seguinte: um valor será considerado discrepante se estiver abaixo de Q1 ou acima de Q3 por uma distância maior que 1,5 × AIQ. Nem todo conjunto de dados apresenta valor discrepante. Mas na presença deles, alguns cuidados devem ser tomados. Assim, o primeiro passo é descobrir se eles existem; o boxplot pode te mostrar isso.

Veja abaixo a animação que ilustrará todos esses conceitos!





Terminada a animação, responda às seguintes perguntas para completar o seu estudo.

1) Encontre o resumo dos cinco números, a amplitude interquartil e determine se há valores discrepantes no seguinte conjunto de dados:

1     4     3     7     7     2     7     12     8    6     5     4

  • Os dados ordenados são:

    1     2    3     4     4     5     6     7    7     7     8     12

  • A mediana é a média das observações de ordem 6 e de ordem 7 na lista ordenada − Q2 = (5 + 6)/2 = 5,5
  • Considerando as 6 primeiras observações, o primeiro quartil é a média da terceira e da quarta observações − Q1 = (3 + 4)/2 = 3,5
  • Considerando as 6 últimas observações, o terceiro quartil é a média da terceira e da quarta observações nessa sublista − Q3 = (7 + 7)/2 = 7
  • Resumo dos cinco números: {1;   3,5;   5,5;   7;   12}
  • AIQ = 7 − 3,5 = 3,5
  • Q1 − 1,5 ×AIQ = − 4,25     Q3 + 1,5 ×AIQ = 12,25      Não há valores atípicos.


2) Repita o exercício anterior, supondo que, em vez de 12, a maior observação seja 15. O que você observa?
  • Resumo dos cinco números: {1;   3,5;   5,5;   7;   15}
  • AIQ = 3,5
  • Q1 − 1,5 ×AIQ = − 4,25     Q3 + 1,5 ×AIQ = 12,25      A maior observação, 15, passa a ser um valor atípico.
  • Note que os quartis não se alteram com a mudança do valor máximo. Nesse sentido, dizemos que os quartis são medidas robustas, isto é, são medidas que não se alteram na presença de alguns poucos valores atípicos.


3) Repita o primeiro exercício, acrescentando uma nova observação de valor 9 aos dados.
  • Os dados ordenados são:

    1     2    3     4     4     5     6     6    7     7     8     9     12

  • A mediana é a observação central, de ordem 7, na lista ordenada − Q2 = 6
  • Considerando as 6 primeiras observações, o primeiro quartil é a média da terceira e da quarta observações − Q1 = (3 + 4)/2 = 3,5
  • Considerando as 6 últimas observações, o terceiro quartil é a média da terceira e da quarta observações nessa sublista − Q3 = (7 + 8)/2 = 7,5
  • Resumo dos cinco números: {1;   3,5;   6;   7,5;   12}
  • AIQ = 7,5 − 3.4 = 4,0
  • Q1 − 1,5 ×AIQ = − 5,0     Q3 + 1,5 ×AIQ = 13,5      Não há valores atípicos.


Dúvidas? Sugestões? Nós damos suporte! Contacte-nos pelo e-mail:
conteudosdigitais@im.uff.br.