Teste t de Student

Origem: Wikipédia, a enciclopédia livre.

O teste t de Student ou somente teste t é um teste de hipótese que usa conceitos estatísticos para rejeitar ou não uma hipótese nula quando a estatística de teste () segue uma distribuição t de Student.

Essa premissa é normalmente usada quando a estatística de teste, na verdade, segue uma distribuição normal, mas a variância da população 2 é desconhecida. Nesse caso, é usada a variância amostral 2 e, com esse ajuste, a estatística de teste passa a seguir uma distribuição t de Student.

História[editar | editar código-fonte]

A estatística t foi introduzida em 1908 por William Sealy Gosset, químico da cervejaria Guinness em Dublin, Irlanda ("student" era seu pseudônimo).[1][2][3] Gosset havia sido contratado devido à política inovadora de Claude Guinness de recrutar os melhores graduados de Oxford e Cambridge para os cargos de bioquímico e estatístico da indústria Guinness.[2] Gosset desenvolveu o Teste t como um modo barato de monitorar a qualidade da cerveja tipo stout. Ele publicou o Teste t na revista acadêmica Biometrika em 1908, mas foi forçado a usar seu pseudônimo pelo seu empregador, que acreditava que o fato de usar estatística era um segredo industrial. De fato, a identidade de Gosset não foi reconhecida por seus colegas estatísticos.[4]

Conceito[editar | editar código-fonte]

Função Densidade de Probabilidade para t de Student, indicando o p-valor unicaudal para determinado t
Função Densidade de Probabilidade para t de Student, indicando o nível de confiança e o p-valor bicaudal para determinado t

Se forem feitas inúmeras amostras de tamanho a partir da mesma população e se fossem tiradas as médias de uma variável dessa população que possui uma distribuição normal, a distribuição dessas inúmeras médias seguiria uma distribuição t de Student. Por exemplo, imaginemos que a altura das pessoas segue uma distribuição normal. Se selecionarmos diversas amostras aleatórias de 100 pessoas e calculássemos a média da altura das pessoas de cada amostra, essa média da altura das pessoas seguirá uma distribuição t de Student.

Perceba que, na distribuição t de Student, valores muito baixos ou muito altos tem menor probabilidade de ocorrer, indicando que é menos provável que a média de uma amostra apresente valores muito distantes da média da população.

O formato da distribuição t de Student depende do número de graus de liberdade. Quanto maior o número de graus de liberdade, mais "concentrada" é a distribuição. Para valores muito grandes de graus de liberdade, a distribuição t de Student se aproxima da distribuição normal.

O Teste t consiste em formular uma hipótese nula e consequentemente uma hipótese alternativa, calcular o valor de conforme a fórmula apropriada (abaixo) e aplicá-lo à função densidade de probabilidade da distribuição t de Student medindo o tamanho da área abaixo dessa função para valores maiores ou iguais a . Essa área representa a probabilidade da média dessa(s) amostra(s) em questão ter(em) apresentado o(s) valor(es) observado(s) ou algo mais extremo. Se a probabilidade desse resultado ter ocorrido for muito pequena, podemos concluir que o resultado observado é estatisticamente relevante. Essa probabilidade também é chamada de p-valor ou valor p. Consequentemente, o nível de confiança é igual a 1 - p-valor.

Normalmente é usado um "ponto de corte" para o p-valor ou para o nível de confiança para definir se a hipótese nula deve ser rejeitada ou não. Se o p-valor for menor que esse "ponto de corte", a hipótese nula é rejeitada. Caso contrário, a hipótese nula não é rejeitada.

É comum que sejam usados os "pontos de corte" para p-valor 0,1%, 0,5%, 1%, 2% ou 5%, fazendo com que os níveis de confiança sejam, respectivamente, 99,9%, 99,5%, 99%, 98% ou 95%. Caso seja usado o p-valor 5% como "ponto de corte" e a área abaixo da função densidade de probabilidade da distribuição t de Student seja menor do que 5%, pode-se afirmar que a hipótese nula é rejeitada com nível de confiança de 95%.

Note que não rejeitar a hipótese nula não é a mesma coisa que afirmar que a hipótese alternativa é válida com o mesmo nível de confiança. Isso seria uma interpretação incorreta do teste.

Unicaudal vs. Bicaudal[editar | editar código-fonte]

Dependendo da definição da hipótese nula, deve ser usado uma ou duas caudas da distribuição t de Student na avaliação do teste. Por exemplo, se a hipótese nula for e a hipótese alternativa , o teste deve ser feito somente para valores maiores do que e, portanto, ao consultar a função densidade de probabilidade da distribuição t de Student, deve-se considerar somente a área superior a , ou seja, somente uma das "caudas" da distribuição.

Por outro lado, se a hipótese nula for e, consequentemente, a hipótese alternativa , teríamos que avaliar ao mesmo tempo a possibilidade de e de . Para isso, ao consultar a função densidade de probabilidade da distribuição t de Student, devem ser consideradas as áreas abaixo da curva para valores superiores a e inferiores a , ou seja, as duas "caudas" da distribuição. Como a distribuição é simétrica, os tamanhos dessas áreas são iguais.

Teste t para média de uma amostra[editar | editar código-fonte]

O teste t para média de uma amostra consiste em medir a probabilidade da média da amostra em questão ter apresentado o valor observado ou algo mais extremo, dada a média da população .

Para fazer isso, estipulamos, por exemplo, que a hipótese nula é e que, por consequência, a hipótese alternativa é . Usamos a seguinte fórmula para o cálculo da estatística t:

Em que:

  • : Média da amostra;
  • : Valor fixo usado para comparação com a média da amostra;
  • : Desvio padrão amostral;
  • : Tamanho da amostra.

Quanto maior , mais confiança temos ao rejeitar a hipótese nula, ou seja, mais certeza temos ao afirmar que não é verdadeiro.

Note que, na fórmula acima, quanto maior , maior será . Ou seja, quanto maior a distância dos valores observados ao valor que estamos comparando, mais certeza teremos em afirmar que eles são diferentes. Do mesmo modo, aumenta quando o tamanho da amostra é maior ou quando o desvio padrão é menor. Teoricamente, o desvio padrão a ser usado deveria ser o da população (normalmente identificado com o símbolo ), mas em muitos casos práticos esse valor é desconhecido, sendo necessário aproximá-lo pelo desvio padrão amostral :

Exemplo prático[editar | editar código-fonte]

Determinado carro consegue percorrer 15 km a cada litro de combustível gasto em uma estrada plana e de boas condições, mas essa distância pode variar devido a diversos fatores. Digamos que a distância percorrida por litro de combustível tenha uma distribuição normal com média 15 km e desvio padrão de 2 km.

Suponhamos que seja feita uma modificação no motor desse carro com o objetivo de aumentar a distância percorrida por litro de combustível. Depois da modificação, foram realizados 10 testes. Nesses testes, a média das distâncias percorridas por litro de combustível foi de 16,6 km.

A princípio, como 16,6 km é uma distância superior a 15 km, parece que a modificação no motor aumentou a distância percorrida por litro de combustível. Mas, para comprovar esse efeito de forma estatística, definimos a hipótese nula e calculamos o valor de .

Neste caso, temos:

Assim,

Conforme a função de densidade de probabilidade da distribuição t de Student com 9 (10-1) graus de liberdade, existe 1,61% de probabilidade de valores superiores a 2,53 terem sido obtidos caso a distância percorrida por litro de combustível não ter sido alterada. Se estivermos usando nível de confiança de 95%, rejeitaríamos a hipótese nula . Isso pode ser explicado de duas formas:

  • A probabilidade obtida com o t calculado (1,61%) é inferior ao "ponto de corte" do p-valor (5%), ou
  • O valor t do "ponto de corte" escolhido (95% de confiança, que corresponde ao t de 1,833), é inferior ao t calculado (2,53).

Na primeira explicação, é necessário calcular a área abaixo da função densidade de probabilidade da distribuição t de Student com 9 graus de liberdade para valores superiores a 2,53 usando algum software estatístico ou planilha de cálculo. Na segunda explicação, além dos softwares estatísticos ou planilhas de cálculo, também poderia-se chegar no valor 1,833 usando uma tabela de valores para distribuição t de Student, que normalmente constam em livros de estatística.

Perceba que, se usássemos nível de confiança de 99%, ao invés de 95%, não rejeitaríamos a hipótese nula porque:

  • A probabilidade obtida com o t calculado (1,61%) é superior ao "ponto de corte" do p-valor (1%), ou
  • O valor t do "ponto de corte" escolhido (99% de confiança, que corresponde ao t de 2,821), é superior ao t calculado (2,53).

Teste t para médias de duas amostras[editar | editar código-fonte]

Tamanhos iguais, variâncias iguais[editar | editar código-fonte]

Este teste só deve ser usado quando:

  • o tamanho das amostras (n) dos dois grupos são iguais;
  • Podemos assumir que as duas distribuições possuem a mesma variância.

A estatística t é calculada conforme a fórmula:

,onde

A quantidade de graus de liberdade a ser usado nesse teste é .

Tamanhos diferentes, variâncias iguais[editar | editar código-fonte]

Este teste só deve ser usado quando podemos assumir que as duas distribuições possuem a mesma variância.

A estatística t é calculada conforme a fórmula:

,onde

A quantidade de graus de liberdade a ser usado nesse teste é .

Tamanhos diferentes, variâncias diferentes[editar | editar código-fonte]

Este teste é usado quando as amostras possuem variâncias diferentes. Para confirmar se as variâncias são realmente diferentes, é recomendável realizar um teste de variâncias.

A estatística t é calculada conforme a fórmula:

,onde

A quantidade de graus de liberdade a ser usado nesse teste é:

Essa equação é chamada de Equação Welch–Satterthwaite.

Teste t para coeficiente de regressões[editar | editar código-fonte]

O Teste t também pode ser usado para testar a significância de coeficientes de regressões. Em geral esse teste é usado para confirmar se a variável que está sendo usada na regressão está realmente contribuindo para a estimativa.

Ver também[editar | editar código-fonte]

Referências

  1. Richard Mankiewicz, The Story of Mathematics (Princeton University Press), p.158.
  2. a b John J. O’Connor, Edmund F. RobertsonTeste t de Student. In: MacTutor History of Mathematics archive.
  3. Fisher Box, Joan (1987). «Guinness, Gosset, Fisher, and Small Samples». Statistical Science. 2 (1): 45–52. doi:10.1214/ss/1177013437 
  4. Raju TN (2005). «William Sealy Gosset and William A. Silverman: two "students" of science». Pediatrics. 116 (3): 732–5. PMID 16140715. doi:10.1542/peds.2005-1134