Teste t de Student

Origem: Wikipédia, a enciclopédia livre.
Ir para: navegação, pesquisa
NoFonti.svg
Este artigo ou se(c)ção cita fontes fiáveis e independentes, mas que não cobrem todo o conteúdo (desde Janeiro de 2011). Por favor, adicione mais referências e insira-as corretamente no texto ou no rodapé. Trechos sem fontes poderão ser removidos.
Encontre fontes: Googlenotícias, livros, acadêmicoYahoo!Bing.

O teste t de Student ou somente teste t é um teste de hipótese que usa conceitos estatísticos para rejeitar ou não uma hipótese nula quando a estatística de teste (t\;) segue uma distribuição t de Student.

Essa premissa é normalmente usada quando a estatística de teste, na verdade, segue uma distribuição normal, mas a variância da população \sigma2 é desconhecida. Nesse caso, é usada a variância amostral s\;2 e, com esse ajuste, a estatística de teste passa a seguir uma distribuição t de Student.

História[editar | editar código-fonte]

A estatística t foi introduzida em 1908 por William Sealy Gosset, químico da cervejaria Guinness em Dublin, Irlanda ("student" era seu pseudônimo).[1] [2] [3] Gosset havia sido contratado devido à política inovadora de CLaude Guinness de recrutar os melhores graduados de Oxford e Cambridge para os cargos de bioquímico e estatístico da indústria Guinness.[2] Gosset desenvolveu o Teste t como um modo barato de monitorar a qualidade da cerveja tipo stout. Ele publicou o Teste t na revista acadêmica Biometrika em 1908, mas foi forçado a usar seu pseudônimo pelo seu empregador, que acreditava que o fato de usar estatística era um segredo industrial. De fato, a identidade de Gosset não foi reconhecida por seus colegas estatísticos. [4]

Conceito[editar | editar código-fonte]

Função Densidade de Probabilidade para t de Student, indicando o nível de confiança \alpha e o p-valor unicaudal para determinado t
Função Densidade de Probabilidade para t de Student, indicando o nível de confiança \alpha e o p-valor bicaudal para determinado t

Se forem feitas inúmeras amostras de tamanho n\! a partir da mesma população e se fossem tiradas as médias de uma variável dessa população que possui uma distribuição normal, a distribuição dessas inúmeras médias seguiria uma distribuição t de Student. Por exemplo, imaginemos que a altura das pessoas segue uma distribuição normal. Se selecionarmos diversas amostras aleatórias de 100 pessoas e calculássemos a média da altura das pessoas de cada amostra, essa média da altura das pessoas seguirá uma distribuição t de Student.

Perceba que, na distribuição t de Student, valores muito baixos ou muito altos tem menor probabilidade de ocorrer, indicando que é menos provável que a média de uma amostra apresente valores muito distantes da média da população.

O formato da distribuição t de Student depende do número de graus de liberdade. Quanto maior o número de graus de liberdade, mais "concentrada" é a distribuição. Para valores muito grandes de graus de liberdade, a distribuição t de Student se aproxima da distribuição normal.

O Teste t consiste em formular uma hipótese nula e consequentemente uma hipótese alternativa, calcular o valor de t\! conforme a fórmula apropriada (abaixo) e aplicá-lo à função densidade de probabilidade da distribuição t de Student medindo o tamanho da área abaixo dessa função para valores maiores ou iguais a t\!. Essa área representa a probabilidade da média dessa(s) amostra(s) em questão ter(em) apresentado o(s) valor(es) observado(s) ou algo mais extremo. Se a probabilidade desse resultado ter ocorrido for muito pequena, podemos concluir que o resultado observado é estatisticamente relevante. Essa probabilidade também é chamada de p-valor ou valor p. Consequentemente, o nível de confiança \alpha\! é igual a 1 - p-valor.

Normalmente é usado um "ponto de corte" para o p-valor ou para o nível de confiança para definir se a hipótese nula deve ser rejeitada ou não. Se o p-valor for menor que esse "ponto de corte", a hipótese nula é rejeitada. Caso contrário, a hipótese nula não é rejeitada.

É comum que sejam usados os "pontos de corte" para p-valor 0,1%, 0,5%, 1%, 2% ou 5%, fazendo com que os níveis de confiança sejam, respectivamente, 99,9%, 99,5%, 99%, 98% ou 95%. Caso seja usado o p-valor 5% como "ponto de corte" e a área abaixo da função densidade de probabilidade da distribuição t de Student seja menor do que 5%, pode-se afirmar que a hipótese nula é rejeitada com nível de confiança de 95%.

Note que não rejeitar a hipótese nula não é a mesma coisa que afirmar que a hipótese alternativa é válida com o mesmo nível de confiança. Isso seria uma interpretação incorreta do teste.

Unicaudal vs. Bicaudal[editar | editar código-fonte]

Dependendo da definição da hipótese nula, deve ser usado uma ou duas caudas da distribuição t de Student na avaliação do teste. Por exemplo, se a hipótese nula for \bar{x} \le \mu_0 e a hipótese alternativa \bar{x} > \mu_0, o teste deve ser feito somente para valores maiores do que t\! e, portanto, ao consultar a função densidade de probabilidade da distribuição t de Student, deve-se considerar somente a área superior a t\!, ou seja, somente uma das "caudas" da distribuição.

Por outro lado, se a hipótese nula for \bar{x}=\mu_0 e, consequentemente, a hipótese alternativa \bar{x} \ne \mu_0, teríamos que avaliar ao mesmo tempo a possibilidade de \bar{x} < \mu_0 e de \bar{x} > \mu_0. Para isso, ao consultar a função densidade de probabilidade da distribuição t de Student , devem ser consideradas as áreas abaixo da curva para valores superiores a t\! e inferiores a -t\!, ou seja, as duas "caudas" da distribuição. Como a distribuição é simétrica, os tamanhos dessas áreas são iguais.

Teste t para média de uma amostra[editar | editar código-fonte]

O teste t para média de uma amostra consiste em medir a probabilidade da média da amostra em questão ter apresentado o valor observado \bar{x} ou algo mais extremo, dada a média da população \mu_0\!.

Para fazer isso, estipulamos, por exemplo, que a hipótese nula é \bar{x} \le \mu_0 e que, por consequência, a hipótese alternativa é \bar{x} > \mu_0. Usamos a seguinte fórmula para o cálculo da estatística t:

t=\frac{\bar{x}-\mu_0}{\tfrac{s}{\sqrt{n}}}

, onde:

  • \bar{x}: Média da amostra;
  • \mu_0\!: Valor fixo usado para comparação com a média da amostra;
  • s\!: Desvio padrão amostral;
  • n\!: Tamanho da amostra.

Quanto maior t\!, mais confiança temos ao rejeitar a hipótese nula, ou seja, mais certeza temos ao afirmar que \bar{x} \le \mu_0 não é verdadeiro.

Note que, na fórmula acima, quanto maior \bar{x}-\mu_0, maior será t\!. Ou seja, quanto maior a distância dos valores observados ao valor que estamos comparando, mais certeza teremos em afirmar que eles são diferentes. Do mesmo modo, t\! aumenta quando o tamanho da amostra n\! é maior ou quando o desvio padrão s\! é menor. Teoricamente, o desvio padrão a ser usado deveria ser o da população (normalmente identificado com o símbolo \sigma\!), mas em muitos casos práticos esse valor é desconhecido, sendo necessário aproximá-lo pelo desvio padrão amostral s\!:

s = \sqrt{\dfrac{1}{n-1} \sum_{i=1}^n (x_i - \overline{x})^2}

Exemplo prático[editar | editar código-fonte]

Determinado carro consegue percorrer 15 km a cada litro de combustível gasto em uma estrada plana e de boas condições, mas essa distância pode variar devido a diversos fatores. Digamos que a distância percorrida por litro de combustível tenha uma distribuição normal com média 15 km e desvio padrão de 2 km.

Suponhamos que seja feita uma modificação no motor desse carro com o objetivo de aumentar a distância percorrida por litro de combustível. Depois da modificação, foram realizados 10 testes. Nesses testes, a média das distâncias percorridas por litro de combustível foi de 16,6 km.

A princípio, como 16,6 km é uma distância superior a 15 km, parece que a modificação no motor aumentou a distância percorrida por litro de combustível. Mas, para comprovar esse efeito de forma estatística, definimos a hipótese nula \bar{x}\le\mu_0 e calculamos o valor de t\!.

Neste caso, temos:

 \bar{x} = 16,6 \,\mathrm{km}
 \mu_0 = 15 \, \mathrm{km}
 s = 2 \, \mathrm{km}
 n = 10

Assim,

t=\frac{16,6-15}{\tfrac{2}{\sqrt{10}}}=2,53

Conforme a função de densidade de probabilidade da distribuição t de Student com 9 (10-1) graus de liberdade, existe 1,61% de probabilidade de valores superiores a 2,53 terem sido obtidos caso a distância percorrida por litro de combustível não ter sido alterada. Se estivermos usando nível de confiança de 95%, rejeitaríamos a hipótese nula \bar{x}\le\mu_0. Isso pode ser explicado de duas formas:

  • A probabilidade obtida com o t calculado (1,61%) é inferior ao "ponto de corte" do p-valor (5%), ou
  • O valor t do "ponto de corte" escolhido (95% de confiança, que corresponde ao t de 1,833), é inferior ao t calculado (2,53).

Na primeira explicação, é necessário calcular a área abaixo da função densidade de probabilidade da distribuição t de Student com 9 graus de liberdade para valores superiores a 2,53 usando algum software estatístico ou planilha de cálculo. Na segunda explicação, além dos softwares estatísticos ou planilhas de cálculo, também poderia-se chegar no valor 1,833 usando uma tabela de valores para distribuição t de Student, que normalmente constam em livros de estatística.

Perceba que, se usássemos nível de confiança de 99%, ao invés de 95%, não rejeitaríamos a hipótese nula porque:

  • A probabilidade obtida com o t calculado (1,61%) é superior ao "ponto de corte" do p-valor (1%), ou
  • O valor t do "ponto de corte" escolhido (99% de confiança, que corresponde ao t de 2,821), é superior ao t calculado (2,53).

Teste t para médias de duas amostras[editar | editar código-fonte]

Tamanhos iguais, variâncias iguais[editar | editar código-fonte]

Este teste só deve ser usado quando:

  • o tamanho das amostras (n) dos dois grupos são iguais;
  • Podemos assumir que as duas distribuições possuem a mesma variância.

A estatística t é calculada conforme a fórmula:

t = \frac{\bar {x}_1 - \bar{x}_2}{S_{x_1x_2} \cdot \sqrt{\frac{2}{n}}}

,onde

\ S_{x_1x_2} = \sqrt{\frac{S_{x_1}^2+S_{x_2}^2}{2}}

A quantidade de graus de liberdade a ser usado nesse teste é 2n-2.

Tamanhos diferentes, variâncias iguais[editar | editar código-fonte]

Este teste só deve ser usado quando podemos assumir que as duas distribuições possuem a mesma variância.

A estatística t é calculada conforme a fórmula:

t = \frac{\bar {x}_1 - \bar{x}_2}{S_{x_1x_2} \cdot \sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}

,onde

 S_{x_1x_2} = \sqrt{\frac{(n_1-1)S_{x_1}^2+(n_2-1)S_{x_2}^2}{n_1+n_2-2}}.

A quantidade de graus de liberdade a ser usado nesse teste é n_1+n_2-2.

Tamanhos diferentes, variâncias diferentes[editar | editar código-fonte]

Este teste é usado quando as amostras possuem variâncias diferentes. Para confirmar se as variâncias são realmente diferentes, é recomendável realizar um teste de variâncias.

A estatística t é calculada conforme a fórmula:

t = {\bar{x}_1 - \bar{x}_2 \over s_{\bar{x}_1 - \bar{x}_2}}

,onde

s_{\bar{x}_1 - \bar{x}_2} = \sqrt{{s_1^2 \over n_1} + {s_2^2  \over n_2}}

A quantidade de graus de liberdade a ser usado nesse teste é:

\frac{(s_1^2/n_1 + s_2^2/n_2)^2}{(s_1^2/n_1)^2/(n_1-1) + (s_2^2/n_2)^2/(n_2-1)}

Essa equação é chamada de Equação Welch–Satterthwaite.

Teste t para coeficiente de regressões[editar | editar código-fonte]

O Teste t também pode ser usado para testar a significância de coeficientes de regressões. Em geral esse teste é usado para confirmar se a variável que está sendo usada na regressão está realmente contribuindo para a estimativa.

Ver também[editar | editar código-fonte]

Referências

  1. Richard Mankiewicz, The Story of Mathematics (Princeton University Press), p.158.
  2. a b Biografia em MacTutor (em inglês)
  3. Fisher Box, Joan. (1987). "Guinness, Gosset, Fisher, and Small Samples". Statistical Science 2 (1): 45–52. DOI:10.1214/ss/1177013437.
  4. Raju TN. (2005). "William Sealy Gosset and William A. Silverman: two "students" of science". Pediatrics 116 (3): 732–5. DOI:10.1542/peds.2005-1134. PMID 16140715.