Quão (e por que) usar funções outliers no excel

Conteúdo


Um valor atípico é um valor significativamente maior ou menor do que a maioria dos valores em seus dados. Ao usar o Excel para analisar dados, outliers podem distorcer os resultados. Como um exemplo, a média média de um conjunto de dados pode realmente refletir seus valores. O Excel fornece algumas funções úteis para ajudá-lo a gerenciar seus outliers, então vamos dar uma olhada.

Um exemplo rápido

Na imagem abaixo, outliers são razoavelmente fáceis de detectar: O valor de dois atribuído a Eric e o valor de 173 atribuído a Ryan. Em um conjunto de dados como este, é muito fácil detectar e lidar com esses outliers manualmente.

Faixa de valores contendo outliers

Em um conjunto de dados maior, esse não será o caso. Ser capaz de identificar outliers e removê-los dos cálculos estatísticos é essencial, e é isso que veremos neste post.

Como Encontrar Outliers em Seus Dados

Para descobrir outliers em um conjunto de dados, nós usamos os seguintes passos:

  1. Encontre o primeiro e o terceiro quartis (vamos falar um pouco sobre o que são).
  2. Avalie o intervalo interquartil (nós também iremos explicar isso um pouco mais tarde).
  3. Retorna os limites superior e inferior do nosso intervalo de dados.
  4. Use esses limites para identificar pontos de dados periféricos.

O intervalo de células à direita do conjunto de dados visto na imagem abaixo será usado para armazenar esses valores.

Intervalo de quartil

Vamos começar.

Passo um: calcular quartis

Se você dividir seus dados em trimestres, cada um desses conjuntos é chamado de quartil. o 25% menor número de números no intervalo constitui o primeiro quartil, o seguinte 25% o segundo quartil, e assim por diante. Damos esta etapa primeiro porque a definição mais comumente usada de um outlier é um ponto de dados que é mais do que 1,5 intervalos interquartis (IQR) abaixo do primeiro quartil e 1,5 intervalos interquartílicos acima do terceiro quartil. Para definir esses valores, primeiro temos que descobrir quais são os quartis.

O Excel fornece uma função QUARTILE para calcular quartis. Você precisa de duas informações: o útero e o quarto.

=QUARTIL(variedade, quarto)

a Treinamento é o intervalo de valores que você está avaliando. E ele quarto é um número que representa o quartil que você deseja retornar (como um exemplo, 1 para o 1S t quartil, 2 para o segundo quartil e assim por diante).

Observação: Em excel 2010, A Microsoft lançou as funções QUARTILE.INC e QUARTILE.EXC como aprimoramentos da função QUARTILE.. QUARTILE é mais compatível com versões anteriores ao trabalhar em várias versões do Excel.

Vamos voltar à nossa tabela de exemplo.

Intervalo de quartil

Para calcular o 1S t Quartil, podemos usar a próxima fórmula na célula F2.

=QUARTIL(B2:B14,1)

Conforme você insere a fórmula, O Excel fornece uma lista de alternativas para o argumento de um quarto.

Para calcular o 3rd quartil, podemos inserir uma fórmula como a acima na célula F3, mas usando um três em vez de um.

=QUARTIL(B2:B14,3)

Agora, temos os pontos de dados quartil exibidos nas células.

Valores do primeiro e terceiro quartis

Passo dois: examine o intervalo interquartil

O intervalo interquartil (o IQR) é o 50% média dos valores em seus dados. É calculado como a diferença entre o valor do primeiro quartil e o valor do terceiro quartil.

Usaremos uma fórmula simples na célula F4 que subtrai o 1S t quartil de 3rd metacarpos:

= F3-F2

Agora, podemos ver nosso intervalo interquartil mostrado.

Valor interquartil

Passo três: retornar os limites inferior e superior

Os limites inferior e superior são os menores e maiores valores do intervalo de dados que queremos usar. Qualquer valor menor ou maior do que esses valores limite são os outliers.

Vamos calcular o limite inferior na célula F5 multiplicando o valor IQR por 1.5 e posteriormente subtraindo-o do ponto de dados Q1:

= F2-(1.5*F4)

Fórmula do Excel para valor limite inferior

Observação: Os colchetes nesta fórmula não são necessários porque a parte da multiplicação será calculada antes da parte da subtração, mas eles tornam a fórmula mais fácil de ler.

Para calcular o limite superior na célula F6, vamos multiplicar o IQR por 1.5 novamente, mas esta vez adicionar para o ponto de dados Q3:

= F3 +(1.5*F4)

Valores limite inferior e superior

Etapa quatro: identificar outliers

Agora que temos todos os nossos dados subjacentes configurados, é hora de identificar nossos pontos de dados periféricos, aqueles que são inferiores ao valor limite inferior ou superiores ao valor limite superior.

Nós vamos usar o Função OR para realizar este teste lógico e exibir os valores que atendem a esses critérios, inserindo a próxima fórmula na célula C2:

= OU(B2<$F $ 5, B2>$F $ 6)

OU função para identificar outliers

Em seguida, copiaremos esse valor em nossas células C3-C14. Um valor TRUE indica um outlier e, como você pode ver, temos dois em nossos dados.

Ignore outliers ao calcular a média média

O uso da função QUARTILE permite calcular o IQR e trabalhar com a definição mais utilizada de outlier.. Apesar disto, ao calcular a média média para uma gama de valores e ignorar outliers, existe uma função mais rápida e fácil de usar. Esta técnica não identificará um outlier como antes, mas nos permitirá ser flexíveis com o que podemos considerar nossa porção de outliers.

A função de que precisamos é chamada TRIMMEAN, e você pode ver sua sintaxe abaixo:

= TRIMMEAN(variedade, por cento)

a Treinamento é o intervalo de valores que você deseja calcular a média. a por cento é a porcentagem de pontos de dados a serem excluídos da parte superior e inferior do conjunto de dados (você pode inseri-lo como uma porcentagem ou um valor decimal).

Nós inserimos a fórmula abaixo na célula D3 em nosso exemplo para calcular a média e excluir o 20% outliers.

= TRIMMEAN(B2:B14, 20%)

Fórmula TRIMMEAN para média excluindo outliers


Lá você tem duas funções diferentes para lidar com outliers. Se você deseja identificá-los para algumas necessidades de relatórios ou excluí-los dos cálculos como médias, O Excel tem uma função que se adapta às suas necessidades.

Assine a nossa newsletter

Nós não enviaremos SPAM para você. Nós odiamos isso tanto quanto você.