Amostra (estatística)

Origem: Wikipédia, a enciclopédia livre.
(Redirecionado de Amostra estatística)
Ir para: navegação, pesquisa

Em estatística e metodologia da pesquisa quantitativa, uma amostra de dados é um conjunto de dados coletados e/ou selecionados de uma população estatística por um procedimento definido.[1] Os elementos de uma amostra são conhecidos como pontos amostrais, unidades amostrais ou observações.

Tipicamente, a população é muito grande, portanto fazer um censo ou uma enumeração completa de todos os valores na população é pouco prático ou impossível.[2] A amostra geralmente representa um subconjunto de tamanho manejável.[3] Amostras são coletadas e estatísticas são calculadas a partir das amostras, de modo que se possam fazer inferências ou extrapolações da amostra à população.[4]

A amostra de dados pode ser retirada de uma população "sem reposição" (nenhum elemento pode ser selecionado mais de uma vez na mesma amostra), no caso em que a amostra é um subconjunto de uma população, ou "com reposição" (um elemento pode aparecer múltiplas vezes em uma amostra), no caso em que a amostra é um multisubconjunto.[5]

Tipos de amostra[editar | editar código-fonte]

Uma representação visual da seleção de uma amostra aleatória simples.

Uma amostra completa é um conjunto de objetos de uma população de origem que inclui todos os objetos que satisfazem um conjunto de critérios de seleção bem definidos.[6] Por exemplo, uma amostra completa de homens australianos com altura superior a dois metros consistiria em uma lista com todos os homens australianos com altura superior a dois metros. Contudo, não incluiria homens alemães, mulheres australianas altas ou pessoas com altura inferior a dois metros. Então, compilar tal amostra completa exige uma lista completa da população de origem, incluindo dados sobre altura, gênero e nacionalidade para cada membro da população de origem. No caso de populações humanas, é improvável que tal lista completa exista, já que a população humana está na casa dos bilhões. No entanto, tais amostras completas estão frequentemente disponíveis em outras disciplinas, como o conjunto de jogadores em uma divisão principal de esportes, as datas de nascimento dos membros de um parlamento ou uma lista de magnitude limitada completa de objetos astronômicos.

Uma amostra não viesada (representatitva) é um conjunto de objetos escolhidos a partir de uma amostra completa usando um processo de seleção que não depende das propriedades dos objetos.[7] Por exemplo, uma amostra não viesada de homens australianos com altura superior a dois metros pode consistir em um subconjunto aleatoriamente amostrado de 1% dos homens australianos com altura superior a dois metros. Contudo, um subconjunto escolhido a partir do registro eleitoral pode ser viesada já que, por exemplo, homens com menos de 18 anos não estarão no registro eleitoral. No contexto astronômico, uma amostra não viesada pode consistir em uma fração de uma amostra completa para a qual os dados estão disponíveis, desde que a disponibilidade dos dados não seja viesada por propriedades individuais de fontes.

A melhor forma de evitar uma amostra viesada ou não representativa é selecionar uma amostra aleatória, também conhecida como amostra probabilística. Uma amostra aleatória é definida como uma amostra em que cada membro individual da população tem um chance conhecida e diferente de zero de ser selecionado como parte da amostra.[8] Os vários tipos de amostras aleatórias incluem amostras aleatórias simples, amostras sistemáticas, amostras aleatórias estratificadas e amostras aleatórias por conglomerados.

Uma amostra que não é aleatória é chamada de amostra não aleatória ou amostra não probabilística.[9] Alguns exemplos de amostras não aleatórias incluem as amostras por conveniência, amostras por julgamento, amostras intencionais, amostras por quotas, amostras por bola de neve e nós de quadratura em métodos quase-Monte Carlo.

Descrição matemática da amostra aleatória[editar | editar código-fonte]

Em termos matemáticos, dada uma variável aleatória com distribuição , uma amostra aleatória de comprimento (em que pode ser qualquer um de ) é um conjunto de variáveis aleatórias independentes e identicamente distribuídas com distribuição .[10]

Uma amostra concretamente representa experimentos nos quais a mesma quantidade é medida. Por exemplo, se representa a altura de um indivíduo e indivíduos forem medidos, será a altura do -ésimo indivíduo. Note que a amostra de variáveis aleatórias (isto é, um conjunto de funções mensuráveis) não deve ser confundida com as realizações destas variáveis (que são os valores que estas variáveis aleatórias assumem, formalmente chamados de variados aleatórios). Em outras palavras, é uma função que representa a medição no -ésimo experimento e é o valor realmente obtido quando se faz o experimento.

O conceito de uma amostra assim inclui o processo pelo qual os dados são obtidos (isto é, as variáveis aleatórias). Isto é necessário de modo que afirmações matemáticas possam ser feitas sobre a amostra e as estatísticas computadas a partir dela, tais como a média e a covariância amostrais.

Ver também[editar | editar código-fonte]

Referências[editar | editar código-fonte]

  1. Roxy., Peck,; L., Devore, Jay (2008). Introduction to statistics and data analysis 3rd ed ed. Australia: Thomson Brooks/Cole. ISBN 0495557838. OCLC 152580422 
  2. R., Spiegel, Murray; Alu., Srinivasan, R.; Correa,, Carmona, Sara Ianda (2004). Teoria e problemas de probabilidade e estatística 2 ed ed. Porto Alegre: Bookman. ISBN 9788536302973. OCLC 69939300 
  3. MARCONI), MARCONI, M. de A. (MARINA DE ANDRADE (2010). Fundamentos de metodologia científica. 7. ed ed. São Paulo: Atlas. ISBN 9788522457588. OCLC 708360984 
  4. D.,, Pinheiro, João Ismael; Coelho,, Gomes, Gastão; Da,, Cunha, Sonia Baptista; Ramírez,, Carvajal, Santiago. Estatística básica : a arte de trabalhar com dados. Rio de Janeiro: [s.n.] ISBN 9788535230307. OCLC 901457079 
  5. Berstel, Jean; Séébold, Patrice (30 de agosto de 1993). «A characterization of Sturmian morphisms». Springer, Berlin, Heidelberg. Mathematical Foundations of Computer Science 1993. Lecture Notes in Computer Science (em inglês): 281–290. ISBN 3540571825. doi:10.1007/3-540-57182-5_20 
  6. 1931-, Pratt, John W. (John Winsor),; Robert., Schlaifer, (1995). Introduction to statistical decision theory. Cambridge, Mass.: MIT Press. ISBN 0262161443. OCLC 44964037 
  7. Hahs-Vaughn, Debbie L.; Lomax, Richard G. (19 de junho de 2013). An Introduction to Statistical Concepts: Third Edition (em inglês). [S.l.]: Routledge. ISBN 9781136490125 
  8. 1909-1980., Cochran, William G. (William Gemmell), (1977). Sampling techniques 3d ed ed. New York: Wiley. ISBN 047116240X. OCLC 2799031 
  9. Johan., Strydom, (2004). Introduction to marketing 3rd ed ed. Cape Town, South Africa: Juta. ISBN 9780702165115. OCLC 56981522 
  10. S., Wilks, (2013). Mathematical Statistics. [S.l.]: Read Books Ltd. ISBN 9781443725255. OCLC 936199307