Intervalo de confiança

Origem: Wikipédia, a enciclopédia livre.
Ir para: navegação, pesquisa

Em estatística, o intervalo de confiança (IC) é o intervalo estimado em que a média de um parâmetro de uma amostra tem uma dada probabilidade de ocorrer. Introduzido na estatística por Jerzy Neyman em 1937[1], é um intervalo observado (calculado a partir de observações) que pode variar de amostra para amostra e que frequentemente inclui o parâmetro de interesse real não observável. O intervalo de confiança é um tipo de estimativa por intervalo ou parâmetro estatístico. Em termos mais formais, é o cálculo da probabilidade de um evento ocorrer dentro de um determinado intervalo a partir da simulação de uma situação (amostra) com base em um conjunto de informações históricas (população). Como os dados observados são amostras aleatórias da população, o intervalo de confiança construído a partir dos dados também é aleatório.

O intervalo de confiança consiste de um intervalo de valores, que atuam como estimativas do parâmetro populacional desconhecido. Entretanto, o intervalo calculado a partir de uma amostra particular não inclui necessariamente o valor real do parâmetro. Quando tem–se 99% de confiança de que o valor real do parâmetro está no intervalo de confiança, significa que 99% dos intervalos de confiança observados tem o valor real do parâmetro. Tomando–se qualquer amostra particular, o parâmetro populacional desconhecido pode estar e pode não estar no intervalo de confiança observado.

O nível de confiança é a frequência com a qual o intervalo observado contém o parâmetro real de interesse quando o experimento é repetido várias vezes. Em outras palavras, o nível de confiança seria a proporção de intervalos de confiança construídos em experimentos separados da mesma população e com mesmo procedimento que contém o parâmetro de interesse real.[1][2][3] Limites de confiança com dois lados formam o intervalo de confiança. Limites de confiança com um lado referem–se às extremidades de confiança inferiores ou superiores. O nível de confiança de 99% significa que 99% dos intervalos de confiança construídos a partir das amostras aleatórias contêm o parâmetro real. O nível de confiança desejado é determinado pelo pesquisador, não pelos dados. Se um teste de hipótese for realizado, o nível de confiança é o complemento do nível de significância. Isto é, um intervalo de confiança de 95% reflete um nível de significância de 0,05.[4]

Os intervalos de confiança são tipicamente estabelecidos no nível de confiança de 95%.[5] Entretanto, quando apresentados graficamente os intervalos de confiança podem ser mostrados em vários níveis de confiança como 90%, 95% e 99%. Certos fatores podem afetar o tamanho do intervalo de confiança, incluindo o tamanho da amostra, o nível de confiança e a variabilidade da população. Um tamanho de amostra maior normalmente levará a uma estimativa melhor do parâmetro populacional. O intervalo de confiança contém os valores do parâmetro que quando testados não devem ser rejeitados com a mesma amostra. Intervalos de confiança de parâmetros diferentes que não contém "0" implicam uma diferença de significância estatística entre as populações.

História[editar | editar código-fonte]

Jerzy Neyman.

O intervalo de confiança foi introduzido por Jerzy Neyman (1894 – 1981). Formado em matemática pelo Instituto de Tecnologia de Kharkov, Neyman demonstrou interesse pela estatística desde que era estudante do probabilista russo Sergey Natanovich Bernstein. O interesse pela estatística levou Neyman a estudar com importantes matemáticos como Karl Pearson, Félix Êdouard Justin Émile Borel, Léon Lebesgue, Paul Pierre Lévy e Jacques Salomon Hadamard.[6]

Em 1926, Neyman começou a parceria com Egon Sharpe Pearson na University College. Neyman ingressou na University College para estudar com Karl Pearson, pai de Egon Sharpe Pearson. Neyman e Pearson desenvolveram vários conceitos sobre testes de significância de prova de hipóteses.[6]

Em 1934, Neyman continuou a parceira com Pearson na London College. Neyman retomou os estudos sobre a estimação intervalar, assunto pelo qual tinha se dedicado desde 1930. Foi quando surgiu a teoria do intervalos de confiança, publicada no apêndice do artigo On the Two Different Aspects of the Representative Method: the Method of Stratified Sampling and the Method of Purposive Selection.[6][7]

Nota–se que desde que tornou–se doutor em matemática pela Universidade de Warsaw em 1923, Neyman também cooperou com vários institutos de agricultura e supervisionou vários estudantes de doutorado como Pytkowski. Pytkowski questionou como caracterizar não dogmaticamente a precisão de um coeficiente de regressão estimado, o que ajudou Neyman a elaborar a teoria do intervalo de confiança.[7]

Em 1970, Neyman recebeu um título honorário pelos seus estudos em Londres que cita o intervalo de confiança:[8]

Em 1938, Neyman mudou–se para os Estados Unidos e tornou–se professor no Departamento de Matemática da Universidade da Califórnia. Hoje Neyman é considerado um dos fundadores da estatística moderna, com teorias sobre probabilidades, teste de hipóteses, teste de qui–quadrado, entre outros.[6]

Definição informal[editar | editar código-fonte]

Neste diagrama, as barras representam as médias observadas e as linhas vermelhas representam os intervalo de confiança ao redor delas. A diferença entre as duas populações à esquerda é significante.

Os intervalos de confiança são usados para indicar a confiabilidade de uma estimativa. Por exemplo, o intervalo de confiança pode ser usado para descrever o quão confiáveis são os resultados de uma pesquisa (uma pesquisa com intervalo de confiança menor é mais confiável que uma pesquisa com intervalo de confiança maior). O intervalo de confiança com nível de confiança de 95% é o mais comum e significa que o resultado está dentro do intervalo de 95 dos 100 estudos hipoteticamente realizados (a leitura correta é que o resultado está dentro do intervalo de confiança em 95 das 100 amostras realizadas).[4]

Baseando–se na imagem ao lado, é um equívoco supor que duas quantidades cujos intervalos de confiança de 95% não se sobreponham sejam significativamente diferentes ao nível de 5%.[9] Um intervalo de confiança para um parâmetro populacional é um intervalo com uma proporção associada gerada por uma amostra aleatória de uma população subjacente, de tal forma que se o experimento for repetido várias vezes e o intervalo de confiança for recalculado para cada experimento com mesmo procedimento, uma proporção dos intervalos de confiança conteria o parâmetro estatístico em questão.

Intervalos de confiança são a forma predominante de estimativa por intervalo e essa estimativa por intervalo pode ser contrastada com estimativa pontual corresponde ao valor único dado como a estimativa de um parâmetro da população de interesse. A estimativa por intervalo especifica um intervalo dentro do qual o parâmetro deve estar. Intervalos de confiança são comumente reportados como tabelas ou gráficos juntamente com estimativas pontuais do mesmo parâmetro para mostrar a confiabilidade das estimativas.

Por exemplo, um intervalo de confiança pode ser usado para descrever o quão confiáveis são os resultados de uma pesquisa. De acordo com uma pesquisa sobre intenção de votos, 40% dos entrevistados pretendem votar em um certo partido. É possível calcular um intervalo de confiança de 99% para a proporção de toda a população com a mesma intenção de voto, que pode ficar entre 30% e 50%. Também é possível calcular um intervalo de confiança de 90% para a proporção de toda a população com a mesma intenção de voto, que neste caso pode ficar entre 37% e 43%. Um importante fator que determina o comprimento de um intervalo de confiança é o tamanho da amostra usado no processo de estimativa. Por exemplo, o número de pessoas que participaram da pesquisa.

Se e são estatísticas (isto é, variáveis aleatórias), cuja distribuição de probabilidade depende de algum parâmetro não observável e (em que, é um número entre 0 e 1), então o intervalo aleatório é um intervalo de confiança . é chamado nível de confiança ou coeficiente de confiança. Na prática moderna aplicada, a maioria dos intervalos de confiança estão no nível de confiança de 95%.[5] Embora o intervalo de confiança de 95% seja o mais comum, os intervalos de confiança podem ser usados em vários níveis como 64%, 80%, 95% e 99%.

O intervalo de confiança em probabilidade frequentista tem papel semelhante ao intervalo de credibilidade em estatística bayesiana. O intervalo de confiança também tem relações com outros temas estatísticos como teste de significância, regiões de confiança e confiança de banda. O tamanho do intervalo de confiança pode ser influenciado pelo tamanho da amostra, pelo nível de confiança e por variações diversas. Lembrando que uma amostra maior conduzirá a uma estimativa melhor do parâmetro analisado.

Intervalo de confiança para a média com variância conhecida[editar | editar código-fonte]

Seja uma média observada em uma amostra aleatória de dimensão de uma população normal (ou de uma população qualquer desde que grande, mas neste caso o intervalo de confiança é apenas aproximado com variância conhecida ). Um intervalo de confiança a para é dado por , com . (ou , na notação de Montgomery). Não é possível construir um intervalo de confiança sem uma variância, pois a ideia de intervalo de confiança são baseadas na distribuição amostras do estimador pontual. [10]

Interpretação[editar | editar código-fonte]

Não pode–se afirmar que pertence ao intervalo de confiança com probabilidade . Pode–se afirmar que se forem construídos um grande número de intervalos de confiança nestas condições aproximadamente destes intervalos de confiança conterão o valor real de (permanece desconhecido). É esta a ideia traduzida por confiança.[11]

Para utilizadores da inferência frequentista, várias interpretações do intervalo de confiança podem ser dadas tomando–se o exemplo do intervalo de confiança de 90%.

  • O intervalo de confiança pode ser expresso em termos de amostras ou amostras repetidas (replicação). Se o procedimento for repetido para várias amostras, a fração dos intervalos de confiança calculados que pode variar de amostra para amostra e inclui o parâmetro real da população tende a 90%.[3]
  • O intervalo de confiança pode ser expresso em termos de uma única amostra. Há probabilidade de 90% do intervalo de confiança de algum experimento futuro incluir o valor real do parâmetro da população. Nota–se que isto é uma afirmação estatística sobre o intervalo de confiança, não sobre o parâmetro da população.[1] Isto considera a probabilidade associada ao intervalo de confiança a partir de um ponto de vista pre–experimento, no mesmo contexto em que os argumentos para a alocação aleatória de tratamentos para itens de estudo são feitos. O pesquisador determina a forma pela qual ele pretende calcular o intervalo de confiança e como assim como antes de realizar o experimento real o intervalo de confiança que será calculado tem uma chance de cobrir o valor real desconhecido.[1] Isto é muito similar à interpretação da replicação acima, exceto por evitar basear–se nas repetições hipotéticas de um procedimento de amostragem que não pode ser repetido em nenhum sentido significativo.
  • O intervalo de confiança representa os valores para um parâmetro da população para o qual a diferença entre o parâmetro e a estimativa observados não é estatisticamente significante no nível de confiança de 10%.[12] Isto está relacionado a uma forma particular pela qual o intervalo de confiança pode ser construído.

Em cada interpretação, aplica se o valor real de um parâmetro está fora do intervalo de confiança de 90% uma vez que ele foi calculado, então o evento de amostrado ocorreu com a probabilidade de 10% (ou menos) de acontecer por acaso.

Erro de interpretação[editar | editar código-fonte]

Intervalos de confiança são frequentemente confundidos. Estudos publicados têm mostrado que mesmo cientistas profissionais frequentemente os interpretam mal.[13][14][15]

  • Um intervalo de confiança de 95% não significa que para um dado intervalo calculado a partir de dados amostrais há a probabilidade de 95% do parâmetro da população estar dentro do intervalo.[13] Uma vez que um experimento é realizado e um intervalo é calculado, esse intervalo pode cobrir ou não cobrir o valor do parâmetro. Não é mais uma questão de probabilidade. A probabilidade de 95% está relacionada à confiabilidade do procedimento de estimativa, não a um intervalo específico calculado.[16] Jerzy Neyman, que propôs o intervalo de confiança, afirma em seu trabalho original:[1]
Deborah Mayo expande o assunto:[17]
  • Um intervalo de confiança de 95% não significa que 95% dos dados da amostra estejam dentro do intervalo.
  • Um intervalo de confiança não é um intervalo de valores plausíveis para o parâmetro de amostra, embora possa ser entendido como uma estimativa de valores plausíveis para o parâmetro da população.
  • Um intervalo de confiança específico de 95% calculado a partir de uma experiência não significa que há uma probabilidade de 95% de um parâmetro da amostra a partir da repetição de uma experiência ficar dentro desse intervalo.[18]

Definição formal[editar | editar código-fonte]

Seja uma amostra aleatória de uma distribuição de probabilidade com parâmetros estatísticos , que é a quantidade a ser estimada e representando as quantidades que não são de interesse imediato. Um intervalo de confiança para o parâmetro , com nível de confiança ou coeficiente de confiança , é um intervalo com pontos aleatórios , determinado pelo par de variáveis aleatórias e com a propriedade

As quantidades que não são de interesse imediato são chamadas parâmetros de incômodo, conforme a teoria estatística ainda precisa encontrar alguma forma de lidar com eles. O número , com valores típicos próximos, mas não maiores que 1, são às vezes dados na forma ou como a porcentagem , em que é um pequeno número não negativo próximo de 0.

indica a distribuição de probabilidade de caracterizado por . Uma parte importante desta especificação é que o intervalo aleatório cobre o valor desconhecido com grande probabilidade independente do valor real de .

Note–se que não precisa referir–se a uma dada família de distribuições explicitamente parametrizada, embora a propriedade geralmente refira–se.

Assim como a variável aleatória teoricamente corresponde a outras possíveis realizações de a partir da mesma população ou a partir da mesma versão da realidade, os parâmetros indicam que é necessário considerar outras versões da realidade nas quais a distribuição de pode ter diferentes características.

Intervalos de confiança aproximados[editar | editar código-fonte]

Em muitas aplicações, intervalos de confiança que possuem exatamente o nível de confiança requerido são difíceis de construir. Mas praticamente intervalos úteis ainda podem ser encontrados – a regra para construir o intervalo pode ser aceita fornecendo um intervalo de confiança no nível se , para um nível aceitável de aproximação. De outro modo, alguns autores[19] simplesmente requerem que , que é útil se as probabilidades forem apenas parcialmente identificadas ou imprecisas.

Propriedades desejáveis[editar | editar código-fonte]

Ao aplicar procedimentos estatísticos padronizados, muitas vezes haverá formas padronizadas de construção de intervalos de confiança. Estes terão sido concebidos de modo a satisfazer certas propriedades desejáveis, que se realizará uma vez que os pressupostos em que se baseiam o procedimento são verdadeiros.

Estas propriedades desejáveis ​​podem ser descritas como: validade, otimização e invariância. "Validade" é mais importante, seguido de perto por "otimização", já a "invariância" pode ser considerado como uma propriedade do método de derivação de um intervalo de confiança de, em vez de a regra para a construção do intervalo. Em aplicações não-padrão, as mesmas propriedades desejáveis ​​seriam procuradas.

Quando aplicados os procedimentos estatísticos padrão, geralmente haverá formas padronizadas para construir intervalos de confiança. Os intervalos de confiança serão construídos de modo a satisfazer certas propriedades desejáveis, que se manterão dada que as suposições sobre o procedimentos são verdadeiras. Estas propriedades desejáveis podem ser descritas como validade, otimização e invariância. Validade é a propriedade mais importante, seguida por otimização. Invariância pode ser considerada a propriedade do método de derivação do intervalo de confiança em vez da regra do construção do intervalo. Em aplicações não padrão, as mesmas propriedades desejáveis seriam procuradas.

Validade significa que a probabilidade de cobertura nominal (nível de confiança) do intervalo de confiança deve manter–se exatamente ou para uma boa aproximação.

Otimização significa que a regra para construir o intervalo de confiança dever fazer o máximo de uso possível da informação do conjunto de dados. Lembra–se que poderia–se descartar metade do conjunto de dado e ainda ser possível fazer um intervalo de confiança válido. Uma forma de avaliar a otimização é por meio do comprimento do intervalo, para que então a regra para a construção do intervalo de confiança seja melhor julgada se ela leva para intervalo cujos comprimento são tipicamente menores.

invariância. Em muitas aplicações a quantidade a ser estimada pode não ser bem definida como tal. Por exemplo, uma pesquisa pode resultar em uma estimativa da renda média da população, mas pode ser igualmente considerada como fornecedora da estimativa do logaritmo da renda média dado que é uma escala comum para representar resultados gráficos. Seria desejável que o método usado para construir o intervalo de confiança para a renda média desse resultados equivalentes quando aplicados à construção do intervalo de confiança para o logaritmo da renda média – especificamente os valores nas extremidades dos últimos intervalos seriam os logaritmos dos valores nas extremidades do intervalo anterior.

Métodos de derivação[editar | editar código-fonte]

Para outros tipos de aplicações menos comuns, existem várias rotas que poderiam ser tomadas para derivar uma regra para a construção do intervalo de confiança. Normalmente uma regra para a construção de intervalos de confiança está intimamente ligada a uma forma particular de encontrar uma estimativa pontual da quantidade a ser considerada.

Estatísticas descritivas[editar | editar código-fonte]

Está intimamente relacionado com o método dos momentos de avaliação. Um exemplo simples surge quando a quantidade a ser avaliado é a média, em cujo caso uma estimativa natural é a média da amostra. Os argumentos habituais indicam que a variância da amostra pode ser utilizada para estimar a variação da média da amostra. Um intervalo de confiança sem muito detalhes para a média verdadeira pode ser construída focada sobre a média da amostra com uma largura que é um múltiplo da raiz quadrada da variância da amostra.

Teoria da Probabilidade[editar | editar código-fonte]

Quando as estimativas são construídas usando o princípio da máxima verossimilhança, a teoria para este experimento fornece duas formas de construir o intervalo de confiança. Uma forma é usar o Teorema de Wilks para encontrar todos os possíveis valores de que completam a seguinte restrição[20] .

Estimando equações[editar | editar código-fonte]

A abordagem de estimativa aqui pode ser considerada tanto como uma generalização de métodos dos experimentos e uma generalização da abordagem de máxima verossimilhança. Há generalizações correspondentes dos resultados da teoria de probabilidade máxima que permitem que os intervalos de confiança a ser construído com base em estimativas derivadas de equações de estimação.

Via teste de significância[editar | editar código-fonte]

Se os testes de significância estão disponíveis para os valores gerais de um parâmetro, então os intervalos de confiança/regiões podem ser construídos através da inclusão na região de confiança a 100%, e todos os pontos para os quais o teste de significância da hipótese é nula, o valor real, é o valor rejeitado ao nível de significância de .

Amostragem[editar | editar código-fonte]

Usado para situações em que as suposições de distribuição dos métodos são incertos ou violados. O método de Amostragem permitir a construção de intervalos de confiança ou intervalos de predição. A distribuição dos dados observados e as correlações internas são utilizados como o substituto para as correlações entre a população mais ampla.

Exemplo teórico[editar | editar código-fonte]

Suponha–se uma amostra independente de uma população normalmente distribuição média e variância (parâmetros) desconhecidos. Seja, , em que é a média da amostra e é a variância da amostra. Então, tem distribuição t de Student com grais de liberdade.[21] Nota–se que a distribuição não depende dos valores dos parâmetros não observáveis e . Isto é, é uma quantidade pivotal.

Suponha–se o cálculo do intervalo de confiança de 95% para . Então, denotando–se como o 97,5 percentil desta distribuição . 97,5 e 0,95 estão corretos nas expressões anteriores. Há uma 2,5% de chance de ser menor que e 2,5% de chance de ser maior que . Então, a probabilidade de estar entre e é 95%. Consequentemente, , com intervalo de confiança teórico (estocástico) de 95% para .

Depois de observar a amostra, encontra–se valores para e para , a partir dos quais calcula–se o intervalo de confiança com números fixos como extremidades, sobre os quais não pode–se afirmar que há certa probabilidade de conter o parâmetro e que está ou não está neste intervalo.

Exemplos práticos[editar | editar código-fonte]

Consumo médio de bebida em uma festa[editar | editar código-fonte]

Seja um buffet que tenha realizado 500 festas, desde festas pequenas com 10 convidados até festas grandes com 1000 convidados. Medindo o consumo médio de bebida por pessoa em todas as festas, percebe–se que cada pessoa bebe em média 200 ml com desvio padrão de 50 ml.

Deseja–se fazer uma festa com o mínimo possível de bebida para desperdiçar menos e lucrar mais. O que fazer? Compra–se 200 ml de bebida? Para não correr o risco de faltar bebida e desagradar o cliente, resolve–se comprar uma quantidade pouco superior à média mais o desvio padrão como 300 ml de bebida por pessoa.

Supondo que o próximo evento seja para 20 convidados. Como a quantidade considerada é de 300 ml de bebida por pessoa, decide–se comprar 6 litros de bebidas. Mas será que a quantidade é suficiente? Quais as chances da média de consumo de bebida por pessoa superar 300 ml?

Para calcular a probabilidade, é preciso saber a média de consumo de bebida por pessoa e o desvio padrão no evento para 20 convidados para criar o gráfico da distribuição normal. Como não tem–se os valores porque a festa ainda não aconteceu, a solução é simular uma curva normal a partir dos dados históricos. Como a média histórica do consumo de bebida por pessoa e a média do evento serão muito próximos, o valor será o mesmo (200 ml). Embora o desvio padrão não possa ser o mesmo, sabe–se que o desvio padrão da amostral é igual ao desvio padrão da população dividido pela raiz quadrada do tamanho da amostra. Então, o desvio padrão da curva normal calculado a partir dos dados históricos será igual a .[22]

Com os valores da média da amostra (200 ml) e do desvio padrão (125 ml), tem–se a curva normal simulada para a próxima festa. Para saber a probabilidade do consumo de bebida por pessoa ser superior a 300 ml, basta subtrair a média da amostra (200 ml) de do consumo de bebida por pessoa (300 ml) e dividir pelo desvio padrão simulado (125 ml), obtendo–se . Consultando–se qualquer tabela de distribuição normal acumulada em livros ou na Internet, encontra–se que a probabilidade para é 0,7881. Como quer–se calcular a probabilidade da média do consumo de bebida por pessoa ser superior a 300 ml, é preciso subtrair 0,7881 de 1. Portanto, a probabilidade do consumo de bebida por pessoa ser superior a 300 ml em um evento para 20 convidados é de 0,2119 ou de 21,19%.[22]

Máquina de sorvete[editar | editar código-fonte]

Margarinefilling.png

Uma máquina é ajustada para despejar 250 gramas de sorvete. Como a máquina não pode encher cada copo com exatamente 250 gramas, o conteúdo adicionado apresenta variação e é considerado uma variável aleatória . Supõe–se que a variação é ajustada para uma distribuição normal em torno da porcentagem média desejada de 250 gramas com desvio padrão de 2,5 gramas. Para determinar se a máquina está devidamente calibrada, uma amostra aleatória  de 25 copos é pesada. Os pesos resultantes são , uma amostra aleatória de .

Para uma impressão da expectativa , basta fornecer uma estimativa. A estimativa apropriada é a média da amostra. Os pesos reais da amostra têm média .[23]

Considerando–se outra amostra de 25 copos, pode–se esperar encontrar valores médios como 250,4 gramas ou 251,1 gramas. Entretanto, o valor da média da amostra de 280 gramas seria raro se o conteúdo médio dos copos fosse de fato próximo de 250 gramas. Há um intervalo em torno do valor observado de 250 gramas da média da amostra dentro de cada copo. Se toda média da população realmente tomar o valor neste intervalo, o dado observado não será considerado particularmente incomum. Este intervalo é chamado intervalo de confiança para o parâmetro . Para calcular este intervalo de confiança, é preciso calcular as extremidades do intervalo a partir da amostra. São funções estatísticas da amostra e, portanto, são variáveis aleatórias.

No exemplo, pode–se determinar as extremidades considerando que a média da amostra da amostra normalmente distribuída também é normalmente distribuída com a mesma expectativa e com desvio padrão de [22]

Para padronização, a variável aleatória é obtida por .[24]

Tomando–se , tem–se . O número a partir da seguinte função de distribuição cumulativa ou a função de distribuição cumulativa é .

Então, obtém–se .[25]

Em outras palavras, a extremidade inferior do intervalo de confiança é 95% é e a extremidade superior do intervalo de confiança é 95% é .

Com os valores do exemplo, o intervalo de confiança é .[25]

Interpretação[editar | editar código-fonte]

Com probabilidade 0,95, encontra–se um intervalo de confiança no qual o valor do parâmetro estará entre as extremidades estocásticas e . Isto não significa que há probabilidade de 95% do valor do parâmetro estar no intervalo obtido usando o valor computado da média da amostra .[26]

De modo contrário, toda vez que as medidas repetem–se, haverá outro valor para a média da amostra. Em 95% dos casos, estará entre as extremidades calculadas a partir da média. O intervalo de confiança real é calculado, inserindo as massas medidas na fórmula. O intervalo de confiança de 95% torna–se .[26]

Em outras palavras, o intervalo de confiança de 95% está entre a extremidade inferior de 249,22 gramas e a extremidade superior de 251,18 gramas.

Como o valor desejado 250 de está dentro do intervalo de confiança resultantes. Não há razão para acreditar que a máquina está calibrada de maneira errada.

The blue vertical line segments represent 50 realizations of a confidence interval for the population mean μ, represented as a red horizontal dashed line; note that some confidence intervals do not contain the population mean, as expected.

O intervalo calculado tem extremidades fixas, em que pode ou não pode estar entre elas. Portanto este evento tem probabilidade 0 ou 1. Não é possível afirmar que com probabilidade o parâmetro está no intervalo de confiança. Pela repetição em dos casos, estará no intervalo calculado. Em dos casos, isto não acontece. Porém, não é possível saber em quais casos isto acontece. É por isso que em vez de usar o termo probabilidade é possível afirmar que com nível de confiança está no intervalo de confiança. O erro máximo é calculado para ser 0,98, uma vez que é a diferença entre o valor no qual confia–se e a extremidade superior ou inferior.

A imagem mostra 50 realizações de intervalos de confiança para a média de uma dada população. Se uma realização for aleatoriamente escolhida, a probabilidade é de 95% de escolher um intervalo que contenha o parâmetro. Entretanto, pode–se dar azar e escolher o intervalo errado. Nunca se sabe.[26]

 Margem de erro[editar | editar código-fonte]

A margem de erro para uma estatística particular geralmente é definida como o raio ou a metade da largura do intervalo de confiança para a mesma estatística.[27][28] Portanto, para determinar o erro de um intervalo de confiança ao estimar a média de uma população qualquer e a partir da média da população . Tem-se[29]

.[29]

Pode-se utilizar a média da amostra como estimador para gerar o erro quadrático médio (EQM) o qual é definido como,

[30]

ou seja, ao considerar o parâmetro da distribuição da variável aleatória pelo estimador quando a amostra é , tem-se o EQM do estimador como o valor

[30]

Intervalos de confiança para proporções e quantidades relacionadas[editar | editar código-fonte]

Um intervalo de confiança aproximado para uma média da população pode ser construído para variáveis ​​aleatórias que não são normalmente distribuídas na população, contando com o teorema do limite central, caso os tamanhos das amostras e contagens são grandes o suficiente. A aproximação será boa com apenas algumas dezenas de observações na amostra se a distribuição de probabilidade da variável aleatória não for muito diferente da distribuição normal (por exemplo, a sua função de distribuição cumulativa não possui descontinuidades e sua assimetria é moderada).

Um tipo de média da amostra é a média de uma variável de indicador que assume o valor um para o verdadeiro, e o valor zero para falso. A média de tal variável é igual à proporção que tem a variável igual a um (tanto na população como em nenhuma das amostras). Esta é uma propriedade útil de variáveis ​​indicadoras, especialmente para testes de hipóteses. Para aplicar o teorema do limite central, deve-se usar uma amostra grande o suficiente. A regra básica é que se devem ver pelo menos cinco casos em que o indicador é um e, pelo menos, cinco em que é zero. Os intervalos de confiança construídos utilizando as fórmulas acima podem incluir números negativos ou números maiores que um, obviamente, não pode ser negativo ou exceder um. Além disso, as proporções de amostras só pode assumir um número finito de valores, de modo que o teorema do limite central e a distribuição normal não são as melhores ferramentas para a construção de um intervalo de confiança.

Intervalo de confiança para a média de uma população [editar | editar código-fonte]

Seja uma população de média  e desvio padrão  , da qual toma–se amostras de  elementos. Cada uma das amostras tem média , sendo que a média de todas as amostras significativas coincide com a média da população .

Se o tamanho da amostra for suficientemente grande, a distribuição da amostra segue praticamente uma distribuição normal (distribuição de Gauss)[31] com média e desvio padrão . Isto é representado como . Padronizando, tem–se .

Com , pode–se calcular um intervalo de confiança dentro do qual pode conter uma determinada porcentagem de observações. É possível encontrar e , tal que , em que é o porcentual desejado. Com , .

Nesta distribuição normal, pode–se calcular o intervalo de confiança en que a população significativa apenas pode ser encontrada se uma amostra conhecida com média  tiver uma certa confiança. Normalmente, os valores entre 95% e 99% são comuns. Este valor será chamado . Isto exige o cálculo de ou do valor crítico junto com sua distribuição oposta  . Estes pontos definem a probabilidade de o intervalo de tempo como mostra a figura a seguir.

ConfIntervNormalP.png

Este ponto é o número tal que . Para a versão padronizada, assegura–se . Assim, Fazendo possíveis operações de compensação, , no qual o intervalo de confiança obtido.

Nota–se que o intervalo de confiança é dado pela média da amostra . O erro padrão é .

Se não for conhecido e não for muito grande, , em que é o desvio padrão da amostra.

Intervalo de confiança para uma proporção [editar | editar código-fonte]

O intervalo de confiança para a estimativa de uma proporção  de uma amostra de tamanho  para um nível de confiança quando uma amostragem ou reposição de uma população infinita, tem-se.[32]

A demonstração destas fórmulas envolvem o teorema central do limite e a abordagem de um binômio normal. Quando não há reposição, tem-se

, [32]

Relação com outros tópicos estatísticos[editar | editar código-fonte]

Teste de hipótese estatístico[editar | editar código-fonte]

Intervalos de confiança são intimamente ligados ao teste de significância estatístico. Por exemplo, se para algum parâmetro estimado quer testar da hipótese nula contra a alternativa , então este teste pode ser realizado determinando se o intervalo de confiança para contém 0.

Em termos mais gerais, dada a disponibilidade de um procedimento de teste de hipótese que pode testar a hipótese nula contra a alternativa para qualquer valor de , então o intervalo de confiança com nível de confiança pode ser definido como contendo qualquer número para o qual a hipótese numa correspondente não é rejeitada no nível de significância .[33]

Se a estimativa dos dois parâmetros (parâmetros, os valores médios de uma variável em dois grupos independentes) tem intervalos de confiança, então a diferença entre os dois valores é mais significante que a indicada pelos valores individuais de .[18] Então, este teste é muito conservador e pode levar a um resultado que é mais significante que os valores individuais de poderiam indicar. Se dois intervalos de confiança se sobrepõem, as duas médias ainda podem ser significantemente diferente.[9][34][35] Por consequinte, consistente com o teste qui–quadrado de Manter Haenszel, é uma correção prooposta pela qual reduz–se os limites de erro para duas médias multiplicando–as para raiz quadrada de (0,707107) antes de fazer a comparação.

Enquanto as formulações das noções de intervalos de confiança e de testes de hipótese estatísticos são distintos, eles são em algum sentido relacionados e em alguma medida complementares. Enquanto nem todos os intervalos de confiança são construídos desta maneira, uma abordagem genérica proposta para construir intervalos de confiança é definir um intervalo de confiança de para consistir todos estes para quais o teste de hipótese não é rejeitado no nível de significância de . Tal abordagem nem sempre podem estar disponíveis uma vez que pressupõe a disponibilidade prática de um teste de significância apropriado. Naturalmente, quaisquer suposições necessárias para o teste de significância seriam transferidas para os intervalos de confiança.

Pode ser conveniente fazer a conveniência geral que os valores dos parâmetros dentro do intervalo de confiança são equivalente para aqueles valores que não seriam rejeitados pelo teste de hipótese, mas isto não seria indicado. Em muitas circunstâncias, os intervalos de confiança citados são apenas aproximadamente válidos, talvez derivados de mais ou menos o dobro do erro padrão e as implicações disso para o teste de hipótese supostamente corresponde geralmente não são conhecidas.

Nota–se que o intervalo de confiança para um parâmetro não é o mesmo que a região de aceitação de um teste para este parâmetro, como às vezes se pensa.O intervalo de confiança é parte do espaço do parâmetro, independente se a região de aceitação é parte do espaço da amostra. Pela mesma razão o nível de confiança não é o mesmo que a probabilidade complemente do nível de significância.

Região de confiança[editar | editar código-fonte]

Regiões de confiança generalizam o conceito de intervalo de confiança para lidar com múltiplas quantidades. Tais regiões podem indicar não apenas a extensão dos prováveis erros de amostragem, mas também podem revelar se (por exemplo) é o caso de se a estimativa para uma quantidade não é confiável, então outra também não deve ser confiável.

Faixa de confiança[editar | editar código-fonte]

Uma faixa de confiança é usada em análise estatística para representar a incerteza em uma estimativa de uma curva ou uma função baseada em dados limitados ou ruidosos. Similarmente, uma banda de previsão é usada para representar a incerteza sobre o valor de um novo ponto de dado na curva, mas sujeito ao ruído. As faixas de previsão e de confiança são frequentemente usadas como parte da representação gráfica dos resultados da análise de regressão.

Faixas de confiança são intimamente relacionadas ao intervalo de confiança, que representam a incerteza em uma estimativa de um único valor numérico. À medida que os intervalos de confiança, pelo construção, apenas refere–se a um único ponto, eles são mais estreitos (neste ponto) que a faixa de confiança que deve manter–se simultaneamente em muitos pontos.[36]

Outros métodos de estimativa por intervalo[editar | editar código-fonte]

Intervalos de confiança são um método de estimativa por intervalo e o método mais usado na estatística frequentista. Um conceito análogo na estatística bayseana é o intervalo de credibilidade, enquanto um método frequentista alternativo é o intervalo de previsão, que em vez de estimar parâmetro, estima o resultado de amostras futuras. Para outras abordagens para expressar a incerteza usando intervalos, ver estimativa por intervalo.

Comparação para intervalos de previsão[editar | editar código-fonte]

Um intervalo de previsão de uma variável aleatória é definido de maneira parecida ao intervalo de confiança para o parâmetro estatístico. Considerando uma variável aleatória , que pode ou não pode ser estatisticamente dependente da amostra aleatória . Então, fornece um intervalo de previsão para o valor a ser observado de se indica a distribuição de probabilidade conjunta das variáveis aleatórias , nas quais estas distribuições dependem dos parâmetros estatísticos .

Comparação para intervalos de tolerância[editar | editar código-fonte]

Ver artigo principal: Intervalo de tolerância

O intervalo de tolerância é um intervalo estatístico com uma certa proporção específica de uma amostra de uma população com um dado nível de confiança. O intervalo de tolerância delimita um intervalo superior e inferior de uma distribuição. Isto é, a área na qual abrange as características almejadas da distribuição. Mais especificamente, um intervalo de confiança fornece limites como pelo menos uma certa proporção da população com um dado nível de confiança .[37] Um intervalo de tolerância baseado em uma amostra é construído, de modo a incluir pelo menos a proporção da população amostral com confiança . Tal intervalo de tolerância geralmente é referido como intervalo de tolerância com conteúdo e cobertura .[38] Um intervalo de tolerância pode ser visto como a versão estatística do intervalo de probabilidade. Intervalos de tolerância unilaterais normais tem uma solução exata em termos de média amostral e variância amostral baseada na distribuição–t não central. Intervalos de tolerância bilaterais normais podem ser obtidos com base na distribuição não central.[39] 

Comparação para estimativas do intervalo bayseano[editar | editar código-fonte]

Uma estimativa do intervalo bayseano é chamada intervalo de credibilidade. Usando muitas das mesmas notações acima, a definição de intervalo de credibilidade para o valor real desconhecido de para um dado é[40] é usado para enfatizar que o valor desconhecido de é tratado como uma variável aleatória. As definições dos dois tipos de intervalo podem ser comparadas como a seguir.

  • A definição do intervalo de confiança envolve probabilidade calculadas a partir da distribuição de para um dado (ou condicional a estes valores) e a condição precisa manter–se todos os valores de .
  • A definição de intervalo de credibilidade envolve probabilidades calculadas a partir da distribuição de condicional aos valores observados de e marginalizada (na média) sobre os valores de , em que esta última quantidade é a variável aleatória correspondente à incerteza sobre os parâmetros de incômodo em .

Nota–se que o tratamento dos parâmetros de incômodo acima é geralmente omitido das discussões, comparando a confiança e a credibilidade, mas é marcadamente diferente entre os dois casos.

Em alguns casos padrões simples, os intervalos produzidos como os intervalos de confiança e os intervalos de credibilidade a partir do mesmo conjunto de dados podem ser idênticos. Eles são muito diferente se a probabilidade a priori informativa for incluída na análise bayseana e podem ser muito diferentes para algumas partes do espaço de possíveis dados mesmo se a análise bayseana a prior for relativamente pouco informativa.

Há uma discordância sobre quais dos métodos produz os resultados mais úteis. A matemática da computação raramente está em questão – intervalos de confiança sendo baseados em distribuições amostrais, intervalos de credibilidade sendo baseados no teorema de Bayes –, mas a aplicação destes métodos, a utilidade e a interpretação das estatísticas produzidas é debatida.

Intervalos de confiança para proporções e quantidades relacionadas[editar | editar código-fonte]

Um intervalo de confiança aproximado para a média da população pode ser construído para variáveis aleatórias que não são normalmente distribuídas na população, permanecendo no teorema central do limite se os tamanhos e as contagens das amostras forem suficientemente grandes. As fórmulas são idênticas ao caso acima (em que a média da amostra é na verdade normalmente distribuída em relação à média da população). A aproximação será muito bom com apenas algumas dúzias de observações da amostra se a distribuição de probabilidade da variável aleatória não for muito diferente da distribuição normal (por exemplo, a função cumulativa de distribuição não tem nenhuma descontinuidade e sua distorção é moderada).

Um tipo de média da amostra é a média de uma variável dummy, que toma o valor "1" como verdadeiro e o valor "0" como falso. A média desta variável é igual a proporção em tem a variável igual a 1 (na população e em qualquer amostra). Esta é uma propriedade útil das variáveis dummy, especialmente para os testes de hipóteses. Para aplicar o teorema central do limite, é preciso usar uma amostra suficientemente grande. Uma regra de ouro é que deve–se ver pelo menos 5 casos, nos quais o indicador é 1 e pelo menos 5 casos nos quais o indicador é 0. Intervalos de confiança construídos usando a fórmula acima podem incluir números negativos ou números maiores que 1, mas as proporções obviamente não podem ser negativas ou exceder 1. Proporções das amostras também podem tomar apenas números infinitos de valores, então o teorema central do limite e a distribuição normal não são as melhores ferramentas para construir um intervalo de confiança.

Contra–exemplos[editar | editar código-fonte]

Uma vez que a teoria do intervalo de confiança foi proposta, um número de contra–exemplos foi desenvolvido para mostrar como a interpretação dos intervalos de confiança pode ser problemática, pelo menos se forem interpretados de maneira ingênua.

Procedimento de confiança para localização uniforme[editar | editar código-fonte]

Welch[41] apresenta exemplo que claramente mostra a diferença entre a teoria dos intervalos de confiança e outras teorias de estimativas por intervalo (incluindo os intervalos fiduciais de Fisher e os intervalos objetivos de Bayes). Robinson[42] chamou este exemplo "possivelmente o melhor contra–exemplo conhecido para a versão de Neyman da teorida do intervalo de confiança". Para Welch, isto mostra a superioridade da teoria do intervalo de confiança. Para críticos, isto mostra a deficiência da teoria do intervalo de confiança. Neste artigo, apresenta–se uma versão simplificada.

Supondo que são observações independentes da distribuição uniforme , então o procedimento de confiança ótimo de 50%[43] é .

Um argumento fiducial de Fisher ou objetivo de Bayes pode ser usado para derivar a estimativa do intervalo que também é um procedimento de confiança de 50%.

Welch mostrou que o primeiro procedimento de confiança domina o segundo procedimento de confiança, de acordo com desiderata da teoria do intervalo de confiança. Para cada , a probabilidade de o primeiro procedimento conter é menor ou igual a probabilidade de o segundo procedimento conter . A largura média dos intervalos do primeiro procedimento é menor que a largura média dos intervalos do segundo procedimento. Portanto, o primeiro procedimento é preferível sob a teoria clássica do intervalo de confiança.

Entretanto, quando , os intervalos do primeiro procedimento com certeza contém o valor real . Consequentemente, o coeficiente de confiança nominal de 50% não está relacionado à incerteza que deve–se ter de que um intervalo específico contenha o valor real. O segundo procedimento não tem esta propriedade.

Além disso, quando o primeiro procedimento gera um intervalo muito pequeno, isto indica que estão muito próximo e que, portanto, eles apenas oferecem a informação em um único ponto do dado. Ainda, o primeiro intervalo exclui quase todos os valores razoáveis do parâmetro devido à sua largura pequena. O segundo procedimento não tem esta propriedade.

As duas propriedades contra–intuitivas do primeiro procedimento – 100% de cobertura quando estão afastados e quase 0% de cobertura quando estão próximos – equilibram–se para 50% de cobertura em média. Entretanto, apesar do primeiro procedimento ser ótimo, seus intervalos não oferecem uma avaliação da precisão da estimativa nem uma avaliação da incerteza que deve–se ter do intervalo conter o valor real.

Estes contra–exemplos são usados para argumentar contra interpretações ingênuas dos intervalos de confiança. Se um procedimento de confiança é realizado para ter propriedades além da cobertura nominal (como relacionada à precisão ou à relação com a inferência bayseana), estas propriedades precisam ser provadas. Elas não seguem a partir do fato de o procedimento ser um procedimento de confiança.

Procedimento de confiança para [editar | editar código-fonte]

Steiger[44] sugere um número de procedimentos de confiança de medidas de tamanhos de efeitos comuns em análise de variância. Morey et al.[45] apontam que vários destes procedimentos de confiança, incluindo um para , têm a propriedade de à medida que a estatística torna–se cada vez menor – indicando inadaptação com todos os possíveis valores de – o intervalo de confiança encolhe e pode até conter apenas o valor único . Isto é, o intervalo de confiança é infinitamente apertado. Isto ocorre quando para um intervalo de confiança de .

Este comportamento é consistente com a relação entre o procedimento de confiança e o teste de significância – à medida que torna–se tão pequeno que as médias do grupo estão muito mais próximas que o esperado pela chance, o teste de significância pode indicar rejeição para a maioria ou para todos os valores de . Portanto, o intervalo será muito apertado ou até vazio (ou, pela convenção sugerida por Steiger, conter apenas "0"). Entretanto, isto não indica que a estimativa de é muito precisa. Isto indica o oposto, que a confiabilidade dos próprios resultados podem estar em dúvida. Isto é o contrário da interpretação comum dos intervalos de confiança que revelam a precisão da estimativa.

Questões filosóficas[editar | editar código-fonte]

O princípio por trás dos intervalos de confiança foi formulado para dar uma resposta a uma pergunta levantada em inferência estatística sobre como lidar com a incerteza inerente dos resultados derivados de dados que são eles mesmos um subconjunto selecionado aleatoriamente de uma população. Há outras respostas fornecidas pela inferência bayseana na forma de intervalos de credibilidade. Intervalos de confiança correspondem a uma regra escolhida para determinar os limites de confiança, em casos em que essa regra é essencialmente determinada antes de qualquer dado ser obtido ou antes de qualquer experimento ser realizado. Essa regra é definida de tal modo que sobre todos os conjuntos de dados possíveis há uma alta probabilidade (alto é especialmente quantificada) de que o intervalo determinado pela regra incluirá o valor real da quantidade em questão. Essa é uma maneira bastante direta e razoável de especificar uma regra para determinar intervalos de incerteza. A abordagem bayseana parece oferecer intervalos que podem, sujeito a aceitação da uma interpretação de probabilidade com probabilidade bayseana, ser interpretados como significando que o intervalo específico calculado a partir de um dado conjunto de dado tem uma probabilidade particular de incluir o valor real, condicional aos dados e as outras informações disponíveis. A abordagem do intervalo de confiança não permite isso, uma vez que nessa formulação nesse mesmo estágio os limites do intervalo e os valores reais são valores fixados e não há aleatoriedade envolvida.

Por exemplo, no exemplo da pesquisa na introdução do artigo, para estar 95% confiante que o número real de eleitores que pretendem votar no partido em questão está entre 36% e 44%, não deve ser interpretado de acordo com o senso comum que há probabilidade de 95% de que o número real de eleitores que pretendem votar no partido em questão esteja entre 36% e 44%. O real significado de níveis de confiança e intervalos de confiança é muito mais sutil. No caso acima, a interpretação correta seria: se a pesquisa for repetida um grande número de vezes (poderia ser produzido um intervalo de confiança de 95% para o intervalo de confiança da pesquisa), cada vez gerando um intervalo de confiança de 95% a partir da amostra da pesquisa, então 95% dos intervalos gerados poderiam conter a porcentagem real de eleitores que pretendem votar no em um determinado partido. Cada vez que a pesquisa é repetida, um intervalo de confiança diferente é produzido. Portanto, não é possível fazer afirmações absolutas sobre probabilidades para qualquer intervalo.

Perguntas referentes a como um intervalo expressando incerteza em uma estimativa pode ser formulado e a como tais intervalos podem ser interpretados não são problemas estritamente matemáticos e são problemas filosóficos.[46] Matemática pode assumir o controla uma vez que os princípios básicos de uma abordagem de inferência foram estabelecidos, mas tem apenas um papel limitado em afirmar por que deve–se preferir uma ou outra abordagem: por exemplo, um nível de confiança de 95% geralmente é usado nas ciências biológicas, mas é uma questão de convenção ou escolha. Nas ciências físicas, um nível muito mais elevado pode ser usado.[47]

Referências

  1. a b c d e Neyman, J. (1937). «Outline of a Theory of Statistical Estimation Based on the Classical Theory of Probability». Philosophical Transactions of the Royal Society. 236: 333 – 380 
  2. Kendall, M. G.. The Advanced Theory of Statistics – Vol 2: Inference and Relationship. Londres: Griffin, 1973.
  3. a b Cox, D. R.. Theoretical Statistics. Londres: Chapman & Hall, 1974.
  4. a b Field, Andy. Discovering statistics using SPSS. Londres: SAGE, 2013.
  5. a b Zar, J. H.. Biostatistical Analysis. New Jersey: Prentice Hall International, 1984.
  6. a b c d Memória, José Maria Pompeu (2004). «Breve História da Estatística» (PDF). Empresa Brasileira de Pesquisa Agropecuária (EMBRAPA) 
  7. a b «The Legacy of Jerzy Neyman» (PDF) 
  8. O'Connor, J. J.; Robertson, E. F. «Biography of Jerzy Neyman». MacTutor History of Mathematics Archive. Consultado em 31 de janeiro de 2017 
  9. a b Goldstein, H. (1995). «The Graphical Presentation of a Collection of Means». Journal of the Royal Statistical Society. 158: 175 – 177 
  10. Básica, Bussab. Estatística. São Paulo: Saraiva, 2012. Página visitada em 16/02/2017.
  11. Pires, Ana (2000). «Estimação por Intervalos» (PDF). Instituto Superior Técnico (IST). Consultado em 30 de janeiro de 2017 
  12. Cox, D. R.. Theoretical Statistics. Londres: Chapman & Hall, 1974.
  13. a b Hoekstra, Rink; Morey, Richard D.; Rouder, Jeffrey N.; Wagenmakers, Eric–Jan (2014). «Robust Misinterpretation of Confidence Intervals» (PDF) 
  14. Kalinowski, Pawel (2010). «Identifying Misconceptions about Confidence Intervals» (PDF) 
  15. Siegfried, Tom (03 de julho de 2014). «Scientists' Grasp of Confidence Intervals doesn't Inspire Confidence». Science News. Consultado em 30 de janeiro de 2017  Verifique data em: |date= (ajuda)
  16. «Confidence Limits for the Mean». Engineering Statistics Handbook. Consultado em 30 de janeiro de 2017 
  17. Mayo, D. G. (1981). «In Defence of the Neyman–Pearson Theory of Confidence Intervals» (PDF). Philosophy of Science. 48 (02): 269 – 280 
  18. a b Kalinowski, Pav (2010). «Understanding Confidence Intervals (CIs) and Effect Size Estimation». APS (Association for Psychological Science). Consultado em 30 de janeiro de 2017 
  19. Roussas, George G.. A Course in Mathematical Statistics. [S.l.]: Academic Press, 1997.
  20. Abramovich, Felix. Statistical Theory: A Concise Introduction. [S.l.]: CRC Press, 2013.
  21. Rees, D. G.. Essential Statistics. [S.l.]: Chapman and Hall / CRC, 2001.
  22. a b c Spiegel, Murray R.. Estatística. São Paulo: Pearson, 2006. Página visitada em 22/02/2017.
  23. Bussab, Pedro A.. Estatística Básica. São Paulo: Saraiva, 2012. Página visitada em 22/02/2017.
  24. Spiegel, Murray R.. Estatística. São Paulo: Pearson, 2006. Página visitada em 22/02/2017.
  25. a b Spiegel, Murray R.. Estatística. São Paulo: Pearson, 2006. Página visitada em 22/02/1017.
  26. a b c Magalhães, Marcos Nascimento. Noções de probabilidade e estatística. São Paulo: EdUSP, 2007. Página visitada em 22/02/2017.
  27. Lohr, Sharon L. (1999). Sampling: Design and Analysis. Pacific Grove, California: Duxbury Press. p. 49. ISBN 0-534-35361-4. The margin of error of an estimate is the half-width of the confidence interval ... 
  28. Stokes, Lynne; Tom Belin (2004). «What is a Margin of Error?» (PDF). What is a Survey?. Survey Research Methods Section, American Statistical Association. p. 64. Consultado em 31 de maio de 2006 
  29. a b Bussab, Wilton de O.. Estatística Básica. São Paulo: Saraiva, 2012. Página visitada em 16/01/2017.
  30. a b Bussab, Wilton de O.. Estatística Básica. São Paulo: Saraiva, 2012. Página visitada em 16/02/2017.
  31. Guerriero, Vincenzo. «Power Law Distribution: Method of Multi–Scale Inferential Statistics». Journal of Modern Mathematics Frontier 
  32. a b Spiegel, Murray R.. Estatística. São Paulo: Pearson, 2006. Página visitada em 22/02/2017.
  33. Cox, D. R.. Theoretical Statistics. Londres: Chapman & Hall, 1974.
  34. Knezevic, Andrea (2008). «Overlapping Confidence Intervals and Statistical Significance» (PDF). StatNews – Cornell Statistical Consulting Unit (73) 
  35. Wolfe, Rory; Hanley, James (8 de janeiro de 2002). «If We're So Different, Why Do We Keep Overlapping?». CMAJ. Consultado em 30 de janeiro de 2016 
  36. Härdle, W.. Nonparametric and Semiparametric Models. [S.l.]: Springer, 2004.
  37. D. S. Young (2010), Book Reviews: "Statistical Tolerance Regions: Theory, Applications, and Computation", TECHNOMETRICS, FEBRUARY 2010, VOL. 52, NO. 1, pp.143-144.
  38. Krishnamoorthy, K. and Lian, Xiaodong(2011) 'Closed-form approximate tolerance intervals for some general linear models and comparison studies', Journal of Statistical Computation and Simulation,, First published on: 13 June 2011 doi:10.1080/00949655.2010.545061
  39. Derek S. Young (August 2010). «tolerance: An R Package for Estimating Tolerance Intervals». Journal of Statistical Software. 36 (5): 1–39. ISSN 1548-7660. Consultado em 19 February 2013  Verifique data em: |access-date=, |date= (ajuda), p.23
  40. Bernardo, José M.. Bayesian Theory. Nova Iorque: Wiley, 2000.
  41. Welch, B. L. (1939). «On Confidence Limits and Sufficiency, with Particular Reference to Parameters of Location». The Annals of Mathematical Statistics. 10 (01): 58 – 69 
  42. Robinson, G. K. (1975). «Some Counterexamples to the Theory of Confidence Intervals». Biometrika. 62 (01): 155 – 161 
  43. Pratt, J. W. «Book Review: Testing Statistical Hypotheses by E. L. Lehmann». Journal of the American Statistical Association. 56 (293): 163 – 167 
  44. Steiger, J. H. (2004). «Beyond the F Test: Effect Size Confidence Intervals and Tests of Close Fit in the Analysis of Variance and Contrast Analysis». Psychological Methods. 9 (2): 164 – 182 
  45. Morey, R. D.; Hoekstra, R.; Rouder, J. N.; Lee, M. D.; Wagenmakers, E. (2016). «The Fallacy of Placing Confidence in Confidence Intervals». Psychonomic Bulletin & Review. 23 (01): 103 – 123 
  46. Seidenfeld, T.. Philosophical Problems of Statistical Inference: Learning from R.A. Fisher. [S.l.]: Springer–Verlag, 1979.
  47. «Statistical Significance Defined Using the Five Sigma Standard». Data Analysis Blog. Consultado em 30 de janeiro de 2017 

Ver também[editar | editar código-fonte]