Histograma

Origem: Wikipédia, a enciclopédia livre.
(Redirecionado de Fórmula de Sturges)
Ir para: navegação, pesquisa
Ambox important.svg
Foram assinalados vários aspectos a serem melhorados nesta página ou secção:
Histograma : Exemplo grupo de 18 pacientes coleta de HDL com 6 classes definidas e intervalo de 0,5 mg/dL

Em estatística, um histograma , também conhecido como distribuição de frequências ou diagrama das frequências, é uma representação gráfica na qual um conjunto de dados é agrupado em classes uniformes, representado por um retângulo cuja base horizontal são as classes e seu intervalo e a altura vertical representa a frequência com que os valores desta classe estão presente no conjunto de dados[1] . É uma das Sete Ferramentas da Qualidade. O histograma é um gráfico composto por retângulos justapostos em que a base de cada um deles corresponde ao intervalo de classe e a sua altura à respectiva freqüência. Quando o número de dados aumenta indefinidamente e o intervalo de classe tende a zero, a distribuição de freqüência passa para uma distribuição de densidade de probabilidades. A construção de histogramas tem caráter preliminar em qualquer estudo e é um importante indicador da distribuição de dados. Podem indicar se uma distribuição aproxima-se de uma função normal, como pode indicar mistura de populações quando se apresentam bimodais.

Um histograma pode ser construído, considerando dado como qualquer medida ou resultado experimental, para responder às seguintes questões [2]

  1. Que tipo de distribuição os dados estão sugerindo ?
  2. Como os dados estão localizados ?
  3. Os dados são simétricos  ?
  4. Existem dados que devem ser desconsiderados por estarem distante dos demais dentro do conjunto ?
  5. Como os dados estão dispersos ?

Exemplo[editar | editar código-fonte]

Coleta de colesterol de um grupo de 18 pacientes, ordenados em 6 classes com intervalo de 5 mg/dL
A construção de um Histograma envolve os seguintes passos 

1. Ordenar os valores observados em ordem crescente 2. Definir os intervalos e o número de classes 3. Como definir o intervalo e o número de classes para um dado conjunto de dados ?

  Não existe uma fórmula matemática exata, exceto que 
   κ    = número de classes
   Δi   = intervalo 
   Vmax = valor máximo
   Vmin = valor mínimo
   n    = número de dados
     κ .Δi  ≥ Vmax - Vmin   de modo a contemplar todos os dados. 
Δi muito pequeno pode incluir variações muito pequena de valores ou ruído.
Δi muito grande pode eliminar variações importantes dos dados.[3]  

Para n < 200 pode-se aplicar com segurança a fórmula proposta por Sturges [4]

κ é o menor inteiro tal que : κ > 1 + 3.32 * Log(n)

neste exemplo:

n=18, e κ = 6 é uma boa escolha.
Δi ≥ (Vmax-Vmin)/κ Neste exemplo, Δi ≥ (67-44)/6 , Δi = 5 é uma boa escolha.

Software gráfico como o Origin definem automaticamente o número de classes e intervalos. Porém o usuário tem que verificar se a solução proposta atende à necessidade de elucidação das questões propostas pelo histograma.

Tipos gráficos de um histograma[editar | editar código-fonte]

Frequência absoluta[editar | editar código-fonte]

O gráfico de frequência absoluta é o histograma usual, onde no eixo dos y, ordenadas, estão a frequência (absoluta ou relativa) com que uma classe aparece no conjunto de medidas, tal como representado na Figura acima.

Frequência relativa[editar | editar código-fonte]

Para a construção da frequência relativa e acumulativa, precisamos fazer uma tabela associando a cada classe o número porcentual em que ela aparece no conjunto de dados: tabela para confecção de um histograma indicando frequência absoluta, relativa e acumulativa. Por exemplo, na classe entre 45 e 50 mg/dL obteve-se quatro amostras dentre as 18 submetidas à análise. Logo a frequência relativa é.

                     frequência relativa =  (4/18) * 100 (%)  = 22.22%

Frequência cumulativa[editar | editar código-fonte]

Na frequência cumulativa soma-se, em ordem crescente, o valor de uma frequência relativa de uma classe com todas as classes com valores inferiores, conforme a tabela. Este gráfico é útil para obter informações a respeito de uma faixa de valores. Por exemplo, da tabela observa-se que 61,11% das amostras têm uma valor inferior a 55 mg/dL.

O gráfico representa os histogramas da Frequência Relativa e Acumulativa, indicando a frequência absoluta em cada classe

grafico de histograma de frequencias relativas e cumulativas

Polígono de Frequências[editar | editar código-fonte]

O Polígono de Frequências nada mais é do que um gráfico onde a frequência absoluta é representada por segmentos de retas.

polígono de frequências, usado em Histograma

Etimologia[editar | editar código-fonte]

A etimologia da palavra histograma é incerta. Algumas vezes é dito que essa palavra deriva do termo grego histos "não erguido" (como os mastros do navio ou as barras verticais do histograma) e gramma "desenhar, escrever, gravar". Também se fala que a palavra deriva de "historical diagram", Karl Pearson teria introduzido o termo em 1895.

Processamento de imagem[editar | editar código-fonte]

O campo da computação chamado processamento de imagem é um exemplo prático de como histogramas podem ser utilizados. Numa imagem a informação da quantidade de vezes que uma determinada cor se repete representa o histograma dessa imagem. Como as possibilidades de cores são altas, esse tipo de histograma é gerado com base numa foto preto e branco.

Uma informação assim sobre a imagem é importante pois pode gerar parâmetros para a avaliação da qualidade da mesma, como nitidez, luminosidade e profundidade.

Referências

  1. John E. Freund. Estatistica Aplicada Economicamente, pág. 42. ISBN 978853630667-4
  2. National Institute of Standards and Technology / "Histogram 1.3.3.14 ", e-book web
  3. 1. Wand MP. Data-Based Choice of Histogram Bin Width. The American Statistician. 1997 1997/02/01;51(1):59-64.
  4. Herbert A. Sturges Journal of the American Statistical Association Vol. 21, No. 153 (Mar., 1926), pp. 65-66

Ligações externas[editar | editar código-fonte]


Ícone de esboço Este artigo sobre matemática é um esboço. Você pode ajudar a Wikipédia expandindo-o.