Histograma: diferenças entre revisões
Aspeto
Conteúdo apagado Conteúdo adicionado
VDO |
texto trocado por 'gosto de vocesCategoria:QualidadeCategoria:Diagramas estatísticosCategoria:Processamento de imagemCategoria:Estatística não paramétricaCategoria:Estatís...' |
||
Linha 1: | Linha 1: | ||
gosto de voces[[Categoria:Qualidade]][[Categoria:Diagramas estatísticos]][[Categoria:Processamento de imagem]][[Categoria:Estatística não paramétrica]][[Categoria:Estatística descritiva]] |
|||
[[File:Histograma wiki.png|thumb|right|Histograma : Exemplo grupo de 18 pacientes coleta de HDL com 6 classes definidas e intervalo de 0,5 mg/dL]] |
|||
Na [[Estatística]], um '''histograma''' , também conhecido como ''Distribuição de Frequências'' ou ''Diagrama das Frequências'', é uma representação gráfica na qual um conjunto de dados é agrupado em classes uniformes, representado por um retângulo cuja base horizontal são as classes e seu intervalo e a altura vertical representa a frequência com que os valores desta classe estão presente no conjunto de dados<ref>John E. Freund. Estatistica Aplicada Economicamente, pag. 42. ISBN 978853630667-4</ref>. É uma das [[Sete Ferramentas da Qualidade]]. O histograma é um gráfico composto por retângulos justapostos em que a base de cada um deles corresponde ao intervalo de classe e a sua altura à respectiva freqüência. Quando o número de dados aumenta indefinidamente e o intervalo de classe tende a zero, a distribuição de freqüência passa para uma distribuição de densidade de probabilidades. A construção de histogramas tem caráter preliminar em qualquer estudo e é um importante indicador da distribuição de dados. Podem indicar se uma distribuição aproxima-se de uma função normal, como pode indicar mistura de populações quando se apresentam bimodais. |
|||
Um histograma pode ser construído, considerando dado como qualquer medida ou resultado experimental, para responder às seguintes questões <ref name="itl.nist.gov">National Institute of Standards and Technology [http://www.itl.nist.gov/div898/handbook/eda/section3/histogra.htm / "Histogram 1.3.3.14 "], e-book web</ref> |
|||
# Que tipo de distribuição os dados estão sugerindo ? |
|||
# Como os dados estão localizados ? |
|||
# Os dados são simétricos ? |
|||
# Existem dados que devem ser desconsiderados por estarem distante dos demais dentro do conjunto ? |
|||
# Como os dados estão dispersos ? |
|||
== Exemplo == |
|||
[[Ficheiro:Origin histogram dados ordenados.png|commoldura|esquerda|Coleta de colesterol de um grupo de 18 pacientes, ordenados em 6 classes com intervalo de 5 mg/dL]] |
|||
A construção de um Histograma envolve os seguintes passos |
|||
1. Ordenar os valores observados em ordem crescente |
|||
2. Definir os intervalos e o número de classes |
|||
3. Como definir o intervalo e o número de classes para um dado conjunto de dados ? |
|||
Não existe uma fórmula matemática exata, exceto que |
|||
κ = número de classes |
|||
Δi = intervalo |
|||
Vmax = valor máximo |
|||
Vmin = valor mínimo |
|||
n = número de dados |
|||
<big>'''κ .Δi ≥ Vmax - Vmin'''</big> de modo a contemplar todos os dados. |
|||
Δi muito pequeno pode incluir variações muito pequena de valores ou ruído. |
|||
Δi muito grande pode eliminar variações importantes dos dados.<ref>1. Wand MP. Data-Based Choice of Histogram Bin Width. The American Statistician. 1997 1997/02/01;51(1):59-64.</ref> |
|||
Para n < 200 pode-se aplicar com segurança a formula proposta por Sturges <ref>Herbert A. Sturges Journal of the American Statistical Association Vol. 21, No. 153 (Mar., 1926), pp. 65-66</ref> |
|||
κ é o menor inteiro tal que : κ > 1 + 3.32 * Log(n) |
|||
neste exemplo: |
|||
:n=18, e '''κ = 6''' é uma boa escolha. |
|||
:Δi ≥ (Vmax-Vmin)/κ Neste exemplo, Δi ≥ (67-44)/6 , '''Δi = 5''' é uma boa escolha. |
|||
Software gráfico como o [[Origin]] definem automaticamente o número de classes e intervalos. Porém o usuário tem que verificar se a solução proposta atende à necessidade de elucidação das questões propostas pelo histograma. |
|||
== Tipos Gráficos de um histograma == |
|||
=== Frequência Absoluta === |
|||
O Gráfico de frequência absoluta é o histograma usual, onde no eixo dos y, ordenadas, estão a frequência (absoluta ou relativa) com que uma classe aparece no conjunto de medidas, tal como representado na Figura acima. |
|||
=== Frequência Relativa === |
|||
Para a construção da [[frequência relativa]] e acumulativa, precisamos fazer uma tabela associando a cada classe o número porcentual em que ela aparece no conjunto de dados: |
|||
[[File:Tabela wiki 2.png|tabela para confecção de um histograma indicando frequência absoluta, relativa e acumulativa.]] Por exemplo, na classe entre 45 e 50 mg/dL obteve-se quatro amostras dentre as 18 submetidas à análise. Logo a frequência relativa é. |
|||
frequência relativa = (4/18) * 100 (%) = 22.22% |
|||
=== Frequência Cumulativa === |
|||
Na frequência cumulativa soma-se, em ordem crescente, o valor de uma frequência relativa de uma classe com todas as classes com valores inferiores, conforme a tabela. Este gráfico é útil para obter informações a respeito de uma faixa de valores. Por exemplo, da tabela observa-se que 61,11% das amostras têm uma valor inferior a 55 mg/dL. |
|||
O gráfico representa os histogramas da Frequência Relativa e Acumulativa, indicando a frequência absoluta em cada classe |
|||
[[File:Histograma wiki5.png|center|grafico de histograma de frequencias relativas e cumulativas]] |
|||
=== Polígono de Frequências === |
|||
O Polígono de Frequências nada mais é do que um gráfico onde a frequência absoluta é representada por segmentos de retas. |
|||
[[File:Histograma poligono de frequencias.png|center|polígono de frequências, usado em Histograma]] |
|||
== Etimologia == |
|||
A etimologia da palavra ''histograma'' é incerta. Algumas vezes é dito que essa palavra deriva do termo grego histos "não erguido" (como os mastros do navio ou as barras verticais do histograma) e ''gramma'' "desenhar, escrever, gravar". Também se fala que a palavra deriva de "historical diagram", [[Karl Pearson]] teria introduzido o termo em 1895. |
|||
== Processamento de imagem == |
|||
O campo da computação chamado processamento de imagem é um exemplo prático de como histogramas podem ser utilizados. Numa imagem a informação da quantidade de vezes que uma determinada cor se repete representa o histograma dessa imagem. Como as possibilidades de cores são altas, esse tipo de histograma é gerado com base numa foto preto e branco. |
|||
Uma informação assim sobre a imagem é importante pois pode gerar parâmetros para a avaliação da qualidade da mesma, como nitidez, luminosidade e profundidade. |
|||
== Ligações externas == |
|||
* [http://2000.jukuin.keio.ac.jp/shimazaki/res/histogram.html Um método para escolher o intervalo de classe de um histograma] |
|||
[[Categoria:Qualidade]] |
|||
[[Categoria:Diagramas estatísticos]] |
|||
[[Categoria:Processamento de imagem]] |
|||
[[Categoria:Estatística não paramétrica]] |
|||
[[Categoria:Estatística descritiva]] |
|||
{{esboço-matemática}} |
|||
{{referências}} |
Revisão das 17h45min de 24 de abril de 2014
gosto de voces