Teste t de Student
O teste t de Student ou somente teste t é um teste de hipótese que usa conceitos estatísticos para rejeitar ou não uma hipótese nula quando a estatística de teste (
) segue uma distribuição t de Student.
Essa premissa é normalmente usada quando a estatística de teste, na verdade, segue uma distribuição normal, mas a variância da população
é desconhecida. Nesse caso, é usada a variância amostral
e, com esse ajuste, a estatística de teste passa a seguir uma distribuição t de Student.
Índice |
História [editar]
A estatística t foi introduzida em 1908 por William Sealy Gosset, químico da cervejaria Guinness em Dublin, Irlanda ("student" era seu pseudônimo).1 2 3 Gosset havia sido contratado devido à política inovadora de CLaude Guinness de recrutar os melhores graduados de Oxford e Cambridge para os cargos de bioquímico e estatístico da indústria Guinness.2 Gosset desenvolveu o Teste t como um modo barato de monitorar a qualidade da cerveja tipo stout. Ele publicou o Teste t na revista acadêmica Biometrika em 1908, mas foi forçado a usar seu pseudônimo pelo seu empregador, que acreditava que o fato de usar estatística era um segredo industrial. De fato, a identidade de Gosset não foi reconhecida por seus colegas estatísticos. 4
Conceito [editar]
Se forem feitas inúmeras amostras de tamanho
a partir da mesma população e se fossem tiradas as médias de uma variável dessa população que possui uma distribuição normal, a distribuição dessas inúmeras médias seguiria uma distribuição t de Student. Por exemplo, imaginemos que a altura das pessoas segue uma distribuição normal. Se selecionarmos diversas amostras aleatórias de 100 pessoas e calculássemos a média da altura das pessoas de cada amostra, essa média da altura das pessoas seguirá uma distribuição t de Student.
Perceba que, na distribuição t de Student, valores muito baixos ou muito altos tem menor probabilidade de ocorrer, indicando que é menos provável que a média de uma amostra apresente valores muito distantes da média da população.
O formato da distribuição t de Student depende do número de graus de liberdade. Quanto maior o número de graus de liberdade, mais "concentrada" é a distribuição. Para valores muito grandes de graus de liberdade, a distribuição t de Student se aproxima da distribuição normal.
O Teste t consiste em formular uma hipótese nula e consequentemente uma hipótese alternativa, calcular o valor de
conforme a fórmula apropriada (abaixo) e aplicá-lo à função densidade de probabilidade da distribuição t de Student medindo o tamanho da área abaixo dessa função para valores maiores ou iguais a
. Essa área representa a probabilidade da média dessa(s) amostra(s) em questão ter(em) apresentado o(s) valor(es) observado(s) ou algo mais extremo. Se a probabilidade desse resultado ter ocorrido for muito pequena, podemos concluir que o resultado observado é estatisticamente relevante. Essa probabilidade também é chamada de p-valor ou valor p. Consequentemente, o nível de confiança
é igual a 1 - p-valor.
Normalmente é usado um "ponto de corte" para o p-valor ou para o nível de confiança para definir se a hipótese nula deve ser rejeitada ou não. Se o p-valor for menor que esse "ponto de corte", a hipótese nula é rejeitada. Caso contrário, a hipótese nula não é rejeitada.
É comum que sejam usados os "pontos de corte" para p-valor 0,1%, 0,5%, 1%, 2% ou 5%, fazendo com que os níveis de confiança sejam, respectivamente, 99,9%, 99,5%, 99%, 98% ou 95%. Caso seja usado o p-valor 5% como "ponto de corte" e a área abaixo da função densidade de probabilidade da distribuição t de Student seja menor do que 5%, pode-se afirmar que a hipótese nula é rejeitada com nível de confiança de 95%.
Note que não rejeitar a hipótese nula não é a mesma coisa que afirmar que a hipótese alternativa é válida com o mesmo nível de confiança. Isso seria uma interpretação incorreta do teste.
Unicaudal vs. Bicaudal [editar]
Dependendo da definição da hipótese nula, deve ser usado uma ou duas caudas da distribuição t de Student na avaliação do teste. Por exemplo, se a hipótese nula for
e a hipótese alternativa
, o teste deve ser feito somente para valores maiores do que
e, portanto, ao consultar a função densidade de probabilidade da distribuição t de Student, deve-se considerar somente a área superior a
, ou seja, somente uma das "caudas" da distribuição.
Por outro lado, se a hipótese nula for
e, consequentemente, a hipótese alternativa
, teríamos que avaliar ao mesmo tempo a possibilidade de
e de
. Para isso, ao consultar a função densidade de probabilidade da distribuição t de Student , devem ser consideradas as áreas abaixo da curva para valores superiores a
e inferiores a
, ou seja, as duas "caudas" da distribuição. Como a distribuição é simétrica, os tamanhos dessas áreas são iguais.
Teste t para média de uma amostra [editar]
O teste t para média de uma amostra consiste em medir a probabilidade da média da amostra em questão ter apresentado o valor observado
ou algo mais extremo, dada a média da população
.
Para fazer isso, estipulamos, por exemplo, que a hipótese nula é
e que, por consequência, a hipótese alternativa é
. Usamos a seguinte fórmula para o cálculo da estatística t:
, onde:
: Média da amostra;
: Valor fixo usado para comparação com a média da amostra;
: Desvio padrão amostral;
: Tamanho da amostra.
Quanto maior
, mais confiança temos ao rejeitar a hipótese nula, ou seja, mais certeza temos ao afirmar que
não é verdadeiro.
Note que, na fórmula acima, quanto maior
, maior será
. Ou seja, quanto maior a distância dos valores observados ao valor que estamos comparando, mais certeza teremos em afirmar que eles são diferentes. Do mesmo modo,
aumenta quando o tamanho da amostra
é maior ou quando o desvio padrão
é menor. Teoricamente, o desvio padrão a ser usado deveria ser o da população (normalmente identificado com o símbolo
), mas em muitos casos práticos esse valor é desconhecido, sendo necessário aproximá-lo pelo desvio padrão amostral
:
Exemplo prático [editar]
Determinado carro consegue percorrer 15 km a cada litro de combustível gasto em uma estrada plana e de boas condições, mas essa distância pode variar devido a diversos fatores. Digamos que a distância percorrida por litro de combustível tenha uma distribuição normal com média 15 km e desvio padrão de 2 km.
Suponhamos que seja feita uma modificação no motor desse carro com o objetivo de aumentar a distância percorrida por litro de combustível. Depois da modificação, foram realizados 10 testes. Nesses testes, a média das distâncias percorridas por litro de combustível foi de 16,6 km.
A princípio, como 16,6 km é uma distância superior a 15 km, parece que a modificação no motor aumentou a distância percorrida por litro de combustível. Mas, para comprovar esse efeito de forma estatística, definimos a hipótese nula
e calculamos o valor de
:
Conforme a função de densidade de probabilidade da distribuição t de Student com 9 (10-1) graus de liberdade, existe 1,61% de probabilidade de valores superiores a 2,53 terem sido obtidos caso a distância percorrida por litro de combustível não ter sido alterada. Se estivermos usando nível de confiança de 95%, rejeitaríamos a hipótese nula
. Isso pode ser explicado de duas formas:
- A probabilidade obtida com o t calculado (1,61%) é inferior ao "ponto de corte" do p-valor (5%), ou
- O valor t do "ponto de corte" escolhido (95% de confiança, que corresponde ao t de 1,833), é inferior ao t calculado (2,53).
Na primeira explicação, é necessário calcular a área abaixo da função densidade de probabilidade da distribuição t de Student com 9 graus de liberdade para valores superiores a 2,53 usando algum software estatístico ou planilha de cálculo. Na segunda explicação, além dos softwares estatísticos ou planilhas de cálculo, também poderia-se chegar no valor 1,833 usando uma tabela de valores para distribuição t de Student, que normalmente constam em livros de estatística.
Perceba que, se usássemos nível de confiança de 99%, ao invés de 95%, não rejeitaríamos a hipótese nula porque:
- A probabilidade obtida com o t calculado (1,61%) é superior ao "ponto de corte" do p-valor (1%), ou
- O valor t do "ponto de corte" escolhido (99% de confiança, que corresponde ao t de 2,821), é superior ao t calculado (2,53).
Teste t para médias de duas amostras [editar]
Tamanhos iguais, variâncias iguais [editar]
Este teste só deve ser usado quando:
- o tamanho das amostras (n) dos dois grupos são iguais;
- Podemos assumir que as duas distribuições possuem a mesma variância.
A estatística t é calculada conforme a fórmula:
,onde
A quantidade de graus de liberdade a ser usado nesse teste é
.
Tamanhos diferentes, variâncias iguais [editar]
Este teste só deve ser usado quando podemos assumir que as duas distribuições possuem a mesma variância.
A estatística t é calculada conforme a fórmula:
,onde
A quantidade de graus de liberdade a ser usado nesse teste é
.
Tamanhos diferentes, variâncias diferentes [editar]
Este teste é usado quando as amostras possuem variâncias diferentes. Para confirmar se as variâncias são realmente diferentes, é recomendável realizar um teste de variâncias.
A estatística t é calculada conforme a fórmula:
,onde
A quantidade de graus de liberdade a ser usado nesse teste é:
Essa equação é chamada de Equação Welch–Satterthwaite.
Teste t para coeficiente de regressões [editar]
O Teste t também pode ser usado para testar a significância de coeficientes de regressões. Em geral esse teste é usado para confirmar se a variável que está sendo usada na regressão está realmente contribuindo para a estimativa.
Ver também [editar]
Referências
- ↑ Richard Mankiewicz, The Story of Mathematics (Princeton University Press), p.158.
- ↑ a b Biografia em MacTutor (em inglês)
- ↑ Fisher Box, Joan. (1987). "Guinness, Gosset, Fisher, and Small Samples". Statistical Science 2 (1): 45–52. DOI:10.1214/ss/1177013437.
- ↑ Raju TN. (2005). "William Sealy Gosset and William A. Silverman: two "students" of science". Pediatrics 116 (3): 732–5. DOI:10.1542/peds.2005-1134. PMID 16140715.
e o p-valor unicaudal para determinado t








