HarboR Informática Industrial Ltda.
info@harbor.com.br
+55 (48) 3333-2249

Box Plot: você conhece esta ferramenta?

Blog

Box Plot: você conhece esta ferramenta?

Neste post vamos falar sobre o Box Plot e como ele pode te auxiliar ainda mais na interpretação dos dados. Já discutimos em posts anteriores outras ferramentas da qualidade para análises de dados, como o Gráfico de Controle, Gráfico de Dispersão, Gráfico de Pareto e Histograma. Porém, quando queremos comparar produtos, máquinas, turnos ou lotes, a ferramenta complementar para este tipo de análise é o Box Plot.

O Box Plot é um gráfico utilizado para auxiliar na identificação de valores discrepantes de um conjunto de dados (chamados de outliers), assim como comparar a dispersão entre dois ou mais conjuntos de dados (análise da simetria). Também é bastante útil para analisar a dispersão dos conjuntos de dados em torno dos limites de especificação e do valor alvo.

 

Entendendo o Box Plot

Quando analisamos um conjunto de dados é usual utilizar um Histograma para entender a tendência central e a distribuição dos dados. Porém, quando desejamos comparar mais de um conjunto de dados utilizamos o Box Plot. Como podemos ver na imagem abaixo, o Histograma é a vista frontal da distribuição dos dados, enquanto o Box Plot é a vista superior de um Histograma.

 

Box_Plot_interpretacao

 

O Box Plot baseia-se na localização dos quartis (quartil1, quartil2 ou mediana, quartil3), que são três valores que dividem um conjunto de dados (ordenado de forma crescente) em quatro sub-intervalos, cada um com 25% das observações.

 

Box_Plot_quartil

 

Qual o significado destes intervalos?

  • 1º intervalo quartílico: é delimitado pelo Valor Mín e Q1 (quartil1). A partir do menor ponto do conjunto de dados até o segmento vertical, encontram-se 5% dos valores do conjunto de dados; do segmento vertical até o 1º segmento do quadro amarelo, encontram-se 20% dos valores do conjunto de dados; totalizando 25% dos valores. Este intervalo é representado pelo 1º “bigode” do Box Plot.
  • 2º intervalo quartílico: é delimitado pelo Q1 e Q2 (quartil2 – mediana). Neste intervalo encontram-se mais 25% dos valores do conjunto de dados e é representado pela 1ª parte da caixa amarela.
  • 3º intervalo quartílico: é delimitado pelo Q2 e Q3 (quartil3). Neste intervalo encontram-se mais 25% dos valores do conjunto de dados e é representado pela 2ª parte da caixa amarela.
  • 4º intervalo quartílico: é delimitado pelo Q3 e Valor Máx. A partir do final do quadro amarelo até o segmento vertical, encontram-se 20% dos valores do conjunto de dados; do segmento vertical ao maior ponto do conjunto de dados, encontram-se os 5% restantes dos valores do conjunto de dados, totalizando os últimos 25% dos valores. Este intervalo é representado pelo 2º “bigode” do Box plot.

 


 

Exemplo Prático

Neste exemplo vamos comparar a dispersão dos dados entre dois produtos diferentes: “Eixo Roda Dianteira” e “Eixo Roda Traseira”. A dispersão é representada pela amplitude (máximo – mínimo) dos dados, quanto maior for a amplitude, maior a variação dos dados.

box_plot_produto

 

Com o Box Plot acima, conseguimos responder facilmente as seguintes questões:

  • Qual é o produto que apresenta a menor variação? Eixo Roda Traseira

Este produto pode servir de exemplo para levantar as causas do processo para se obter menor variação do produto.

  • Qual é o produto que apresenta a maior variação? Eixo Roda Dianteira

Por ser o produto com a maior dispersão dos dados, devemos realizar uma análise mais profunda, focada e ágil deste processo com o objetivo de diminuir a variação no produto.

 

Porém, onde esta variação está acontecendo?

Para enriquecer nossa análise, vamos utilizar o mesmo Box Plot adicionando mais um nível de estratificação, as características (testes) que foram avaliadas em cada peça. Três pontos diferentes (A, B e C) de diâmetros externos (DE) são avaliados para definir se a peça está conforme o padrão, respeitando seus limites de especificação.

 

box_plot_caracteristica

 

Nesta visualização do Box Plot, conseguimos ver a distribuição dos dados relacionados às características avaliadas em torno dos limites de especificação¹. De imediato, o Box Plot já nos responde as seguintes perguntas:

  • Qual é a característica que apresenta a maior variação? Eixo Roda Dianteira – DE – Ponto A

Mais de 25% dos dados estão sendo produzidos fora do limite inferior de especificação (LIE), deve-se investigar mais a fundo este processo para descobrir a causa desta variação.

  • Qual é a única característica dentro dos limites de especificação para o Eixo da Roda Dianteira? DE – Ponto B

Sua distribuição está completamente dentro dos limites de especificação. Neste caso os esforços podem ser direcionados na tentativa de centralizar a mediana do processo junto ao alvo da especificação.

  • Qual característica possui os maiores bigodes? Eixo Roda Dianteira – DE – Ponto C

Bigodes muito grandes é um sinal de que os valores mínimo e máximo devem ser investigados. Estes pontos discrepantes são chamados de outliers e podem revelar situações como erros de medições ou de execução de procedimento. Se os dados são referentes a erros de medição, é preciso corrigi-los para que eles não interfiram na tomada de decisões. Do contrário, estes pontos podem conter informações relevantes sobre o seu processo, sendo preciso identificar a causa desta variação para que não volte a acontecer.

  • Qual é a característica que apresenta a menor variação? Eixo Roda Traseira – DE – Ponto A

Esta é a característica onde se encontra a menor variação de todo o estudo, isto também deve ser levado em conta para entender o sucesso deste processo e tentar aplicar as mesmas condições nos demais.

 

O Box Plot é uma excelente ferramenta de análise que auxilia na interpretação e comparação de dados de diferentes processos, produtos, características, lotes e outros. Ele nos fornece informações à respeito da localização, dispersão e outliers do seu conjunto de dados.

Com o Software InfinityQS você consegue facilmente construir gráficos de Box Plot para a análise dos seus dados. Se sua empresa já utiliza o InfinityQS e você quer saber mais informações desse gráfico no InfinityQS, clique aqui e acesse nosso documento de suporte.

(1) Cada característica possui um limite de especificação diferente, para ser possível avaliar os limites em um mesmo gráfico os dados foram normalizados em torno do alvo especificado.

 

Você também pode gostar de ler:

Especialista de Aplicação na HarboR desde 2013. Trabalha com soluções para Controle de Qualidade e Controle Estatístico de Processo na área industrial.

Confira Perfil Completo no Linkedin

 

 

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Cancelar