Mediana (estatística)

Origem: Wikipédia, a enciclopédia livre.
Ir para: navegação, pesquisa

Na estatística e teoria da probabilidade, a mediana é o valor numérico que separa a metade superior de uma amostra de dados, uma população ou uma distribuição de probabilidade, a partir da metade inferior. A mediana de uma lista finita de números pode ser encontrada por providenciar todas as observações do valor mais baixo para o valor mais elevado e colheita do meio (por exemplo, a mediana de {3, 3, 5, 9, 11} é 5). Se houver um número par de observações , então não existe um valor médio único, a mediana é, então, geralmente definido como a média dos dois valores médios [1] [2] (a mediana de {3, 5, 7, 9} é (5+7)/2 = 6), o que corresponde a interpretar a mediana como semi amplitudes totalmente aparadas . A mediana é de importância central nas estatísticas robustas, já que é a estatística mais resistente, ter um ponto de ruptura de 50%: enquanto não mais de metade dos dados está contaminada, a mediana não vai dar um resultado arbitrariamente grande. A mediana é definido apenas em dados unidimensionais encomendados, e é independente de qualquer distância métrica. Uma média geométrica, por outro lado, é definida em qualquer número de dimensões.

Em uma amostra de dados, ou uma população finita, pode não haver nenhum membro da amostra cujo valor é idêntico à mediana (no caso de um mesmo tamanho de amostra). Se houver um tal elemento, pode haver mais do que um de modo que a mediana pode não identificar um membro da amostra. No entanto, o valor da mediana é determinada exclusivamente com a definição usual. Um conceito relacionado, em que o resultado é forçado a corresponder a um membro da amostra, é o medoide. No máximo, a metade da população tem valores estritamente menos do que a média, e, no máximo, metade têm valores estritamente maiores do que a mediana. Se cada grupo contém menos de metade da população, em seguida, uma parte da população é exatamente igual à mediana. Por exemplo, se a < b < c, em seguida, a mediana da lista {a, b, c} é b, e, se a < b < c < d, então a mediana da lista {a, b​​, c, d} é a média de b e c, ou seja, é (b+c)/2.

A mediana pode ser utilizada como uma medida de localização quando a distribuição é desviada , quando os valores finais não são conhecidos , ou quando se exige reduzida importância para ser anexado a outliers, por exemplo, uma vez que podem existir erros de medição.

Em termos de notação, alguns autores representam a mediana de uma variável x ou como \tilde {x} ou como notação padrão \mu_ { 1/2 } [1] por vezes também M.[3] . [3] Não há amplamente aceito para o mediana, [4], de modo que o uso destes ou outros símbolos para o mediano deve ser explicitamente definida quando eles são introduzidos .

A mediana é o segundo quartil, 5° decil e 50° percentil.


Cálculo da mediana para dados ordenados[editar | editar código-fonte]

A mediana é uma forma de resumir os valores típicos associados com os membros de uma população de análise estatística, assim, é um possível parâmetro de localização.

Quando a mediana é usada como um parâmetro de localização em estatística descritiva, existem várias opções para uma medida de variabilidade: a amplitude, o intervalo interquartil, o desvio médio absoluto e o desvio absoluto mediano. Uma vez que a mediana é o mesmo que o segundo quartil, o seu cálculo é ilustrado no artigo em quartis.

Para fins práticos, várias medidas de localização e dispersão são frequentemente comparadas com base bem como os valores correspondentes da população pode ser estimada a partir de uma amostra de dados. A mediana, estimado com a mediana da amostra, tem boas propriedades a este respeito. Embora não seja geralmente melhor se uma determinada distribuição da população é assumida, as suas propriedades são sempre razoavelmente boa. Por exemplo, uma comparação entre a eficiência de estimadores candidatos mostra que a média da amostra é estatisticamente mais eficaz do que a mediana da amostra, quando os dados são não contaminadps por dados de distribuições com caudas pesadas ou a partir de misturas de distribuição, mas menos eficaz de outro modo, e que a eficiência da mediana da amostra é maior do que para uma ampla gama de distribuições. Mais especificamente, a mediana tem uma eficiência de 64% em comparação com a média variância mínima (para grandes amostras normais), o que quer dizer a variação da mediana será aproximadamente 50% maior do que a variação da média-ver Eficiência (estatísticas ) # eficiência assintótica e suas referências.

No caso de dados ordenados de amostras de tamanho n, se n for ímpar,[4] a mediana será o elemento central \frac{(n+1)}{2}. Se n for par, a mediana será o resultado da média simples entre os elementos \frac{n}{2} e \frac{n}{2}+1.

Exemplos[editar | editar código-fonte]

População com N° de Elementos Ímpar:[editar | editar código-fonte]

Para a seguinte população:

{1, 3, 5, 7, 9}
A posição da mediana será = (n+1)/2 = (5+1)/2 = 3
Logo, a mediana é o 3º elemento que é 5 (nesse caso, igual à média).

No entanto, para a população:

{1, 2, 4, 10, 13}
A mediana também é o 3° elemento, que portanto, vale 4 (enquanto neste caso, a média é 6).

População com N° de Elementos Par:[editar | editar código-fonte]

Na seguinte população:

{1, 2, 4, 8, 9, 10}
Não há um valor central, portanto a mediana é calculada tirando-se a média dos dois valores centrais (no caso, o 3° e 4° elemento).
Logo, o valor da mediana é = (4+8)/2 = 6 (e a média é 5,666).

Em uma amostragem com numeros repetitivos (4, 5, 5, 6, 6, 6, 6, 6, [6, 7], 7, 8, 8, 9, 9, 10, 11, 13) a mediana fica no meio sendo igual a 6,5.

Cálculo da mediana para dados classificados[editar | editar código-fonte]

Quando se trata de um conjunto de dados classificados, o cálculo da mediana é feito através do histograma, ou através da função cumulativa de frequências relativas. A mediana é o ponto do eixo das abcissas correspondente a 50% da frequência relativa acumulada.

No caso de variáveis contínuas, a mediana, m, é tal que \int_{-\infty}^m f(x) dx  = \int_{m}^{\infty} f(x) dx .

No caso de variáveis discretas, e quando as frequências estão calculadas por unidade, a mediana é o ponto do eixo das Abscissas para o qual a frequência relativa acumulada é inferior ou igual a 50% e superior ou igual a 50% para o ponto imediatamente a seguir.

Bibliografia[editar | editar código-fonte]

  • Murteira, Bento; Black, George; Estatística Descritiva, McGrawHill, 1983.

Ver Também[editar | editar código-fonte]

Referências

  1. a b Eric W. Weisstein, Statistical Median em MathWorld
  2. http://www.stat.psu.edu/old_resources/ClassNotes/ljs_07/sld008.htm Simon, Laura J.; "Descriptive statistics", Statistical Education Resource Kit, Pennsylvania State Department of Statistics
  3. David J. Sheskin. Handbook of Parametric and Nonparametric Statistical Procedures: Third Edition. [S.l.]: CRC Press, 27 August 2003. 7– p. ISBN 978-1-4200-3626-8 Página visitada em 25 February 2013.
  4. Michele Viana Debus de França. Moda e mediana (em português). UOL - Educação. Página visitada em 24 de junho de 2013.