Intervalo de confiança

Origem: Wikipédia, a enciclopédia livre.
Ir para: navegação, pesquisa

Em estatística, um intervalo de confiança (IC) é o intervalo estimado onde a média de um parâmetro de uma amostra tem uma dada probabilidade de ocorrer. Comumente define-se como o intervalo onde há 95% de probabilidade da média verdadeira da população inteira ocorrer.

É calculada a partir das observações, em princípio, diferentes de amostra para amostra, que inclui frequentemente o valor de um parâmetro de interesse não observável se a experiência é repetida. Com que frequência o intervalo observado contém o parâmetro é determinado pelo nível de confiança ou coeficiente de confiança, mais especificamente, o significado do termo "nível de confiança" é que, se os I.C são construídos através de muitos dados em  análises separadas de experimentos replicados (e possivelmente diferentes), a proporção de tais intervalos que contêm o verdadeiro valor do parâmetro irá coincidir com o dado nível de confiança.[1] [2] [3]  

Introdução[editar | editar código-fonte]

Neste diagrama, as barras representam as médias observadas e as linhas vermelhas representam os intervalo de confiança ao redor delas. A diferença entre as duas populações à esquerda é significante.

Intervalos de confiança são usados para indicar a confiabilidade de uma estimativa. Por exemplo, um I.C pode ser usado para descrever quão confiáveis são os resultados de uma pesquisa. Sendo todas as outras coisas iguais, uma pesquisa que resulte num I.C pequeno é mais confiável do que uma que resulte em um I.C maior.

O intervalo de confiança no nível de 95% (95% I.C) é comumente mais usado e significa que o resultado estará dentro daquele intervalo de 95 dos 100 estudos realizados hipoteticamente. Desta forma, a leitura correta do intervalo de confiança é a de que, dentro das 95 das 100 amostras realizadas, o resultado estará dentro do intervalo de confiança.[4]

Usando a imagem ao lado como exemplo, "é um equívoco estatístico comum supor que duas quantidades cujos intervalos de confiança de 95% falhem em se sobrepor sejam significativamente diferentes no nível dos 5%"[5] .

Em sentido estrito, um I.C para um parâmetro populacional é um intervalo com uma proporção p associada a qual é gerada por uma amostra aleatória de uma população subjacente, de tal forma que se a amostragem for repetida inúmeras vezes e o intervalo de confiança for recalculado para cada amostra de acordo com o mesmo método, uma proporção p dos intervalos de confiança conteria o parâmetro estatístico em questão. Intervalos de confiança são a forma predominante de estimativa por intervalo.

Se U e V são estatísticas (isto é, variáveis aleatórias) cuja distribuição de probabilidade dependa de algum parâmetro não observável θ, e

\Pr(U<\theta<V|\theta)=x (onde x é um número entre 0 e 1)

então o intervalo aleatório (UV) é um intervalo de confiança "100x% para θ". O número x é chamado de nível de confiança ou coeficiente de confiança. Na prática moderna aplicada, a maioria dos intervalos de confiança estão no nível de 95%.[6] .

Intervalos de confiança desempenham em probabilidade frequentista um papel semelhante ao intervalo de credibilidade em estatística bayesiana.

Apesar do intervalo de confiança de 95% ser o mais usado,intervalos podem ser usados em vários níveis como 64%, 80%, 95% e 99%.

Intervalos de confiança tem relações com outros temas estatísticos como teste de significância, regiões de confiança e confiança de banda.

O tamanho do intervalo de confiança pode ser afetado pelo tamanho da amostra, nível de confiança e variações diversas, lembrando que um tamanho maior da amostra irá conduzir a uma melhor estimativa do parâmetro a ser analisado.[7]

Definição:[editar | editar código-fonte]

Intervalo de confiança para a média com variância conhecida:

Se x for a média observada duma amostra aleatória de dimensão n duma população normal (ou duma população qualquer desde que n grande, mas nesse caso o intervalo é apenas aproximado com variância conhecida σ 2, um intervalo de confiança a 100 × (1− α)% para µ é dado por x − a σ n ≤ µ ≤ x + a σ n com a: P(Z > a) = α2(ou a = zα 2, na notação do "Montgomery".

Interpretação:[editar | editar código-fonte]

Não podemos dizer que µ pertence ao intervalo de confiança com probabilidade 1− α ;

O que podemos dizer é que se fizermos um grande número de intervalos nestas condições, aproximadamente 100 × (1− α)% desses intervalos conterão de facto o verdadeiro valor de µ (que permanece desconhecido), é esta ideia que é traduzida por "confiança".[8]

Propriedades desejáveis[editar | editar código-fonte]

Ao aplicar procedimentos estatísticos padronizados, muitas vezes haverá formas padronizadas de construção de intervalos de confiança. Estes terão sido concebidos de modo a satisfazer certas propriedades desejáveis, que se realizará uma vez que os pressupostos em que se baseiam o procedimento são verdadeiros. 

Estas propriedades desejáveis ​​podem ser descritas como: validade, otimização e invariância. "Validade" é mais importante, seguido de perto por "otimização", já a "Invariância" pode ser considerado como uma propriedade do método de derivação de um intervalo de confiança de, em vez de a regra para a construção do intervalo. Em aplicações não-padrão, as mesmas propriedades desejáveis ​​seriam procuradas.

Mal entendidos[editar | editar código-fonte]

  • Um intervalo de confiança de 95% não significa que, para um dado intervalo calculado a partir de dados, há uma probabilidade de 95% do parâmetro da população de encontrar-se dentro do intervalo e nem que existe uma probabilidade de 95% do parâmetro da população abranger o intervalo [9]
  • Um intervalo de confiança de 95% não significa que 95% dos dados de amostra encontram-se dentro do intervalo.
  • Um intervalo de confiança não é uma gama de valores plausíveis para a média da amostra, embora possa ser entendida como uma estimativa dos valores plausíveis para o parâmetro da população.
  • Um intervalo de confiança particular de 95% calculada a partir de uma experiência não significa que existe uma probabilidade de 95% de uma média de amostras de uma repetição da experiência caindo dentro deste intervalo. [10]

Significado e interpretação[editar | editar código-fonte]

Várias interpretações podem ser dadas aos intervalos de confiança por diferentes usuários como por exemplo:

  • I.C pode ser expressado em termos de amostra ou repetidas amostras.

Onde esse procedimento pode ser repetido em várias amostras, calculando o intervalo de confiança (o que é diferente para cada amostra) que abrange o parâmetro população verdadeira de 90% das vezes. [11] " Note-se que este não se refere a medidas repetidas da mesma amostra, mas sim a amostragem repetida".

  • O I.C pode ser expressado em termos de uma única amostra: “Existe 90% de probabilidade de que o cálculo do I.C de alguns experimentos futuros envolvam o valor verdadeiro do parâmetro da população”[1] . Note que isso considera a probabilidade associada com o I.C de um ponto de visão de um pré- experimento.

Aqui, o pesquisador define a maneira em que ele pretende calcular um intervalo de confiança, antes de fazer o real experimento, aquele intervalo irá acabar sendo calculado terá certa chance de acertar o real valor. Esta maneira é muito semelhante à "amostra repetida", porém ela evita depender de repetidas considerações hipotéticas de um procedimento de amostragem que não pode ser repetido em qualquer sentido.

Questões filosóficas[editar | editar código-fonte]

O princípio por trás de intervalos de confiança foi formulado para proporcionar uma resposta à questão levantada em inferência estatística de como lidar com a incerteza inerente no resultado de derivação de dados que são eles próprios apenas um subconjunto selecionado aleatoriamente de uma população.

 Há outras respostas, nomeadamente  fornecidos por inferência Bayesiana na forma de intervalos de credibilidade. Intervalos de confiança correspondem a uma regra escolhida para determinar os limites de confiança, onde a regra é essencialmente determinada antes dos dados obtidos pela amostra. A regra é definida de tal modo que todos os conjuntos de dados possíveis que podem ser obtidos, existindo uma elevada probabilidade que o intervalo determinado pela regra incluirá o verdadeiro valor da quantidade em questão.

 Essa é uma maneira bastante simples e razoável de especificar uma regra para determinar intervalos de incerteza. A abordagem Bayesiana parece oferecer intervalos que podem, sob reserva de aceitação de uma interpretação da "probabilidade". A probabilidade Bayesiana pode ser interpretada no sentido de que o intervalo específico calculado a partir de um determinado conjunto de dados tem uma certa probabilidade de incluir o valor verdadeiro, condicionada à dados e outras informações disponíveis.

As perguntas a respeito de como um intervalo expressando incerteza em uma estimativa pode ser formulada, e de como tais intervalos pode ser interpretado, não são estritamente problemas matemáticos e são filosoficamente problemático[12] . E nas ciências físicas, pode ser utilizado um nível muito mais elevado[13]

Métodos de derivação[editar | editar código-fonte]

Para outros tipos de aplicações menos comuns, existem várias rotas que poderiam ser tomadas para derivar uma regra para a construção de I.C.

Normalmente uma regra para a construção de intervalos de confiança está intimamente ligada a uma forma particular de encontrar uma estimativa pontual da quantidade a ser considerada.

Estatísticas descritivas[editar | editar código-fonte]

Está intimamente relacionado com o método dos momentos de avaliação. Um exemplo simples surge quando a quantidade a ser avaliado é a média, em cujo caso uma estimativa natural é a média da amostra. Os argumentos habituais indicam que a variância da amostra pode ser utilizada para estimar a variação da média da amostra. Um intervalo de confiança sem muito detalhes para a média verdadeira pode ser construída focada sobre a média da amostra com uma largura que é um múltiplo da raiz quadrada da variância da amostra.

Teoria da Probabilidade[editar | editar código-fonte]

Quando as estimativas são construídas usando o princípio da máxima verossimilhança, a teoria para este experimento fornece duas formas de construir I.C.

Estimando equações[editar | editar código-fonte]

A abordagem de estimativa aqui pode ser considerada tanto como uma generalização de métodos dos experimentos e uma generalização da abordagem de máxima verossimilhança. Há generalizações correspondentes dos resultados da teoria de probabilidade máxima que permitem que os intervalos de confiança a ser construído com base em estimativas derivadas de equações de estimação.

Via teste de significância[editar | editar código-fonte]

Se os testes de significância estão disponíveis para os valores gerais de um parâmetro, então os intervalos de confiança/regiões podem ser construídos através da inclusão na região de confiança a 100% , e todos os pontos para os quais o teste de significância da hipótese é nula, o valor real, é o valor rejeitado ao nível de significância de (1-p).

Amostragem[editar | editar código-fonte]

Usado para situações em que as suposições de distribuição dos métodos são incertos ou violados. O método de Amostragem permitir a construção de intervalos de confiança ou intervalos de predição. A distribuição dos dados observados e as correlações internas são utilizados como o substituto para as correlações entre a população mais ampla.

Intervalos de confiança para proporções e quantidades relacionadas[editar | editar código-fonte]

Um intervalo de confiança aproximado para uma média da população pode ser construído para variáveis ​​aleatórias que não são normalmente distribuídas na população, contando com o teorema do limite central, caso os tamanhos das amostras e contagens são grandes o suficiente. A aproximação será boa com apenas algumas dezenas de observações na amostra se a distribuição de probabilidade da variável aleatória não for muito diferente da distribuição normal (por exemplo, a sua função de distribuição cumulativa não possui descontinuidades e sua assimetria é moderada).

Um tipo de média da amostra é a média de uma variável de indicador que assume o valor um para o verdadeiro, e o valor zero para falso. A média de tal variável é igual à proporção que tem a variável igual a um (tanto na população como em nenhuma das amostras). Esta é uma propriedade útil de variáveis ​​indicadoras, especialmente para testes de hipóteses. Para aplicar o teorema do limite central, deve-se usar uma amostra grande o suficiente. A regra básica é que se devem ver pelo menos cinco casos em que o indicador é um e, pelo menos, cinco em que é zero. Os intervalos de confiança construídos utilizando as fórmulas acima podem incluir números negativos ou números maiores que um, obviamente, não pode ser negativo ou exceder um. Além disso, as proporções de amostras só pode assumir um número finito de valores, de modo que o teorema do limite central e a distribuição normal não são as melhores ferramentas para a construção de um intervalo de confiança.

Exemplos práticos[editar | editar código-fonte]

Exemplo de construção de um intervalo de confiança para a média populacional com variância desconhecida[editar | editar código-fonte]

Num determinado hospital, um grupo de pacientes tem o nível de glicose e uma variável aleatória com distribuição normal de média desconhecidas e variância de 64 (mg/ml)/2

Para uma amostra de 46 pacientes que forneceram níveis médios de colesterol de 120mg/ml, construa um intervalo de 88% de confiança.

O intervalo de 88% I.C para µ está compreendido entre os valores (118.1661, 121.8339)

____________________________________________________________________________________________________________________________________________

Exemplo prático II:[editar | editar código-fonte]

Intervaloconfiancamodificado.png

Uma máquina de sorvete é ajustada para despejar a quantidade de 250,0 g. Porém como a máquina não pode encher cada copo com exatamente 250,0 g, o conteúdo adicionado apresenta variação, e é considerado uma variável aleatória X. Supõe-se que esta variação é ajustada para uma distribuição normal em torno da porcentagem média desejada de 250,0 g, com um desvio padrão de 2,5 g. Para determinar se a máquina está devidamente calibrada, uma amostra aleatória de n = 25 xícaras de sorvete é levada para a pesagem. A medição de gelo substância resultante é X 1, ..., X 25, X sendo uma amostra aleatória

Para uma apreciação da expectativa, μ é suficiente para dar uma estimativa. A estimativa é a média da amostra apropriadamente:

\hat \mu=\bar X = \frac{1}{n}\sum_{i=1}^n X_i

Pesos reais da amostra x1, ..., x25, com média:

\bar x=\frac {1}{25} \sum_{i=1}^{25} x_i = 250.2\,\text{gramas}

Se considerarmos uma outra amostra de 25 copos, poderíamos esperar facilmente para encontrar valores médios como 250,4 ou 251,1 gramas. Uma amostra do valor médio de 280 gramas, contudo, seria extremamente raro se o conteúdo médio das xícaras é de fato perto de 250 gramas. Há um intervalo inteiro em torno do valor. Tal intervalo é chamado um intervalo de confiança para o parâmetro μ.

Os parâmetros devem ser calculados a partir da amostra resultante para funções estatísticas X 1 mostra, ..., X 25 e, portanto, vire são variáveis ​​aleatórias.

Neste caso, as extremidades considerando a média da amostra X a partir da distribuição normal de amostra também é normalmente distribuída com a mesma expectativa μ, e é determinada com um erro padrão de:

\frac {\sigma}{\sqrt{n}}=\frac {2.5~\text{g}}{\sqrt{25}}=0.5\ \text{gramas}

Para padronização, uma variável aleatória é obtida:

Z = \frac {\bar X-\mu}{\sigma/\sqrt{n}} =\frac {\bar X-\mu}{0.5}

Tomamos 1 - α = 0,95, por exemplo. 

Assim, temos:

\!P(-z\le Z\le z) = 1-\alpha = 0.95

O número Z a partir da seguinte função de distribuição cumulativa, neste caso, a função de distribuição cumulativa normal é:

\begin{align}
\Phi(z) & = P(Z \le z) = 1 - \tfrac{\alpha}2 = 0.975,\\[6pt]
z & = \Phi^{-1}(\Phi(z)) = \Phi^{-1}(0.975) = 1.96
\end{align}

E obtém-se:

\begin{align}
0.95 & = 1-\alpha=P(-z \le Z \le z)=P \left(-1.96 \le \frac {\bar X-\mu}{\sigma/\sqrt{n}} \le 1.96 \right) \\[6pt]
& = P \left( \bar X - 1.96 \frac{\sigma}{\sqrt{n}} \le \mu \le \bar X + 1.96 \frac{\sigma}{\sqrt{n}}\right)
\end{align}

Em outras palavras, o limite inferior do intervalo de confiança é 95%:

Limite\ inferior = \bar X - 1.96 \frac{\sigma}{\sqrt{n}}

Com os valores deste exemplo, o intervalo de confiança é:

\begin{align}
0.95 & = P\left(\bar X - 1.96 \times 0.5 \le \mu \le \bar X + 1.96 \times 0.5\right) \\[6pt]
& = P \left( \bar X - 0.98 \le \mu \le \bar X + 0.98 \right).
\end{align}

Isso pode ser interpretado como a probabilidade de 0,95, com um intervalo de confiança onde se encontra com o parâmetro μ entre os limites estocásticos.

\! \bar X - 0{.}98

e

\! \bar X + 0.98

Isto não implica que existe uma probabilidade de 0,95 encontrar o parâmetro μ na gama efetivamente obtida utilizando o valor definido para o valor médio da amostra.

(\bar{x}-0.98,\, \bar{x}+0.98)

No entanto, cada vez que as medições são repetidas, dão um valor diferente para a média de X na amostra. Em 95% dos casos μ irá situar-se entre os limites calculados a partir da média, mas em 5% dos casos, não será. 

(\bar x - 0.98;\bar x + 0.98) = (250.2 - 0.98; 250.2 + 0.98) = (249.22; 251.18).

Seguimento Vertical representando 50 mediações de um I.C  ''μ''.

Em outras palavras, o intervalo de confiança de 95% é entre o limite inferior de 249,22 g e 251,18 g do topo.

Como o valor desejado de 250 μ está dentro do intervalo de confiança resultante e não há nenhuma razão para acreditar que a máquina não está corretamente calibrada.

Intervalo de confiança para a média de uma população [editar | editar código-fonte]

Uma população de metade \mu e desvio padrão \sigma  podem tomar amostras de n elementos. Cada uma destas amostras foram, sucessivamente, uma média (\bar{x}). Pode ser visto que a média de todas as amostras significativas coincide com a média da população: \mu_{\bar{x}} = \mu.

Além disso, se a dimensão da amostra é suficientemente grande, a distribuição de amostra praticamente significa uma distribuição normal (ou de Gauss)[14] com média μ e dada pela seguinte expressão desvio padrão: 

\sigma_{\bar{x}} = \frac{\sigma}{\sqrt{n}}

Isto é representado da seguinte forma: 

\bar{X} \sim N(\mu, \frac{\sigma}{\sqrt{n}})

Se nós padronizarmos, tem-se que:

\frac{\bar{X} - \mu}{\frac{\sigma}{\sqrt{n}}}=Z \sim N(0, 1)

Numa Z ~ N (0, 1) A distribuição pode facilmente calcular um intervalo dentro do qual uma determinada porcentagem pode cair uma certa percentagem de observações, que é fácil de encontrar Z 1 e Z 2 ,tal que P [Z 1 ≤ z ≤ z 2] = 1 - α, onde (1 - α) · 100 é o percentual desejado.

Caso você deseje obter uma expressão de tal forma que 

P\left[\mu_1 \le \mu \le \mu_2\right] = 1 - \alpha

Nesta distribuição normal pode-se calcular o intervalo de confiança onde a população significativa apenas pode ser encontrada, se uma amostra conhecida média \bar{x} ), tiver uma certa confiança. Normalmente, os valores de a 95 por cento e 99 são comuns. Este valor irá ser chamado 1 - \alpha, Isto exige a computação ponto Z_{\alpha/2} ou valor crítico junto com sua "distribuição oposta" X_{-\alpha/2} . Estes pontos definem a probabilidade de o intervalo de tempo.Estes pontos definem a probabilidade de o intervalo de tempo, como se mostra na figura que se segue:

ConfIntervNormalP.png

Este ponto é o número tal que:

\mathbb{P}[\bar{x} \ge X_{\alpha/2}] = \mathbb{P}[z \ge z_{\alpha/2}] = \alpha/2

E na versão padronizada é seguro que:

z_{-\alpha/2} = -z_{\alpha/2}

Assim:

\mathbb{P}\left[-z_{\alpha/2} \le \frac{\bar{x} - \mu}{\frac{\sigma}{\sqrt{n}}} \le z_{\alpha/2}\right] = 1 - \alpha

Fazendo possíveis operações de compensação  para o u intervalo:

\mathbb{P}\left[\bar{x} - z_{\alpha/2}\frac{\sigma}{\sqrt{n}} \le \mu \le \bar{x} + z_{\alpha/2}\frac{\sigma}{\sqrt{n}}\right] = 1 - \alpha

No qual o intervalo de confiança obtido é:

(\bar{x} - z_{\alpha/2}\frac{\sigma}{\sqrt{n}}, \bar{x} + z_{\alpha/2}\frac{\sigma}{\sqrt{n}})

Note-se que o intervalo de confiança é dado pela média da amostra (\bar{x}) ± o produto de valor crítico Z_{\alpha/2}, o erro padrão é (\frac{\sigma}{\sqrt{n}}).

Se não conhecida \sigma e n não é muito grande

(\bar{x} - z_{\alpha/2}\frac{s}{\sqrt{n}}, \bar{x} + z_{\alpha/2}\frac{s}{\sqrt{n}})

Onde s é o desvio padrão de uma amostra.

Intervalo de confiança para uma proporção [editar | editar código-fonte]

O intervalo de confiança para a estimativa de uma proporção p, conhecido como um n de uma amostra de tamanho n proporção de exemplo, para um nível de confiança (1-α) · 100% é:

(p_n - z_{\alpha/2}\sqrt{\frac{p_n(1-p_n)}{n}}, \; p_n + z_{\alpha/2}\sqrt{\frac{p_n(1-p_n)}{n}})

Na demonstração dessas fórmulas estão envolvidos o Teorema do Limite Central e a abordagem de um binômio normal.

Referências

  1. a b Neyman, J.. Outline of a Theory of Statistical Estimation Based on the Classical Theory of Probability. [S.l.: s.n.], 1937. ISBN Philosophical Transactions of the Royal Society A 236: 333–380. doi:10.1098/rsta.1937.0005.
  2. Kendall, M.G. and Stuart, D.G.. The Advanced Theory of Statistics. Vol 2: Inference and Relationship. [S.l.: s.n.], 1973. ISBN Griffin, London. Section 20.4
  3. Cox D.R., Hinkley D.V.. Theoretical Statistics. [S.l.: s.n.], 1974. ISBN Chapman & Hall
  4. FIELD, Andy. Discovering statistics using SPSS.. [S.l.: s.n.], 2013. ISBN London: SAGE
  5. Goldstein, H., & Healey, M.J.R. (1995). "The graphical presentation of a collection of means." Journal of the Royal Statistical Society, 158, 175-77.
  6. ZAR, J.H. Biostatistical Analysis. Nova Jérsei: Prentice Hall International, 1984 (pp. 43-45).
  7. Confidence interval.
  8. Material IPE.
  9. Morey, R.D., Hoekstra, R., Lee, M.D., Rouder, J.N., Wagenmakers, E-J.. The Fallacy of Placing Confidence in Confidence Intervals. [S.l.: s.n.], 2015.
  10. PAV, Kalinowski. Understanding Confidence Intervals (CIs) and Effect Size Estimation. Association for Psychological Science Observer. [S.l.: s.n.], April 10, 2010.
  11. Cox D.R., Hinkley D.V.. heoretical Statistics. [S.l.: s.n.], 1947. ISBN Chapman & Hall, p49, p209
  12. T. Seidenfeld. Philosophical Problems of Statistical Inference. [S.l.: s.n.], 1979. ISBN Learning from R.A. Fisher, Springer-Verlag
  13. Statistical significance defined using the five sigma standard"..
  14. V, Guerriero. . "Power Law Distribution: Method of Multi-scale Inferential Statistics". J. Mod. Math. Frontier.

Ver também[editar | editar código-fonte]

Ligações externas[editar | editar código-fonte]