Estatística multivariável

Origem: Wikipédia, a enciclopédia livre.
Ir para: navegação, pesquisa
Wikitext.svg
Esta página ou seção precisa ser wikificada (desde fevereiro de 2014).
Por favor ajude a formatar esta página de acordo com as diretrizes estabelecidas.
Question book-4.svg
Esta página ou secção cita fontes confiáveis e independentes, mas que não cobrem todo o conteúdo, comprometendo a sua verificabilidade (desde fevereiro de 2014).
Por favor, adicione mais referências inserindo-as no texto. Material sem fontes poderá ser removido.—Encontre fontes: Google (notícias, livros e acadêmico)


Um vetor aleatório é um vetor contendo uma ou mais variáveis ​​aleatórias escalares. A estatística multivariável lida com vetores aleatórios e possíveis aplicações em muitos campos da ciência e tecnologia, como a econometria e a taxonomia. Um modelo explicativo para uma variável aleatória baseia-se no comportamento de outras variáveis. Os vetores aleatórios servem para construir tais modelos. Na física, onde os modelos podem condicionar claramente o valor das variáveis​​, podem ocorrer erros causados ​​por variáveis ​​não incluídas no modelo ou devido a processos puramente aleatórios, tornando-se necessária a utilização de modelos estatísticos para estimar estes parâmetros.

Os métodos estatísticos multivariados e ferramentas de análise estatística multivariada estudam o comportamento de três ou mais variáveis ​​simultaneamente. São utilizados principalmente para encontrar a variável menos representativa e eliminá-la​​, simplificando modelos estatísticos, em que o número de variáveis torna-se um problema para compreender a relação entre os vários grupos de variáveis​​. Alguns dos métodos mais utilizados são a regressão linear e análise discriminante. Podem ser sintetizado dois objetivos claros:

  1. Fornecer métodos cujo objetivo é o analisar um conjunto de dados multivariados que a análise estatística uni-dimensional é incapaz de alcançar.
  2. Ajudar o analista a tomar decisões no contexto diante da informação disponível para o conjunto de dados analisados​​.

Existem diferentes modelos e métodos, com diferentes hipóteses para a análise:

  1. Métodos de unidade:
    1. Um estudo de regressão permite-nos determinar a probabilidade com que uma variável pode ser prevista com base em outras variáveis. Ela é usada para tentar prever o comportamento das variáveis, tais como os benefícios do investimento em marketing e custos de produção.
    2. A análise de correlação canônica tenta analisar a possível existência de uma relação entre dois conjuntos de variáveis​​.
    3. A análise discriminante pode dar-nos uma função discriminante, que pode ser usada para distinguir entre dois ou mais grupos e, assim, tomar decisões.
    4. A análise multivariada da variância (MANOVA), estendendo-se à análise de variância (ANOVA), cobrindo os casos com mais do que uma variável dependente, sem ser capaz de simplificar o modelo conhecido.
    5. A regressão logística permite calcular e testar a influência de uma variável sobre outra, ou quando a variável dependente é de resposta dicotómica.
  2. Métodos de interdependência:
    1. A análise de componentes principais procura determinar o menor conjunto de variáveis ​​que resumem o sistema original.
    2. A análise de cluster classifica uma amostra de entidades (físicas ou variáveis) em um pequeno número de grupos, de modo que as observações dentro de um grupo são muito semelhantes entre si e muito diferentes do resto. Ao contrário de análise discriminante, o número e composição de tais grupos é desconhecido.
    3. A iconografia das correlações.
  3. Métodos estruturais
    1. Os modelos de equações estruturais analisam as relações entre um conjunto de variáveis ​​representadas por sistemas de equações simultâneas que assumem que alguns deles (chamado de ##constructos) são medidos com o erro de outras variáveis ​​observáveis ​​chamados indicadores. Os modelos consistem, portanto, de duas partes: um modelo estrutural que especifica as relações ##de dependência entre os construtos latentes e um modelo de mensuração que especifica como os indicadores se relacionam com seus construtos correspondentes.

História[editar | editar código-fonte]

Encontram-se exemplos na edição de 1968 de An Introduction to Multivariate Analysis,[1] destacando testes hipotéticos via o teste de rácio potencial e as propriedades das funções estatísticas: admissibilidade, iconografia e análise de clusters.[2][3]

Software & Ferramentas[editar | editar código-fonte]

Existe um grande número de aplicativos e outras ferramentas para a estatística multivariável, incluindo:

Referências

  1. Theodore Wilbur Anderson (1958) An Introduction to Multivariate Analysis, New York: Wiley ISBN 0471026409; 2e (1984) ISBN 0471889873; 3e (2003) ISBN 0471360910
  2. Sen, Pranab Kumar; Anderson, T. W.; Arnold, S. F.; Eaton, M. L.; Giri, N. C.; Gnanadesikan, R.; Kendall, M. G.; Kshirsagar, A. M.; Mardia, K. V. (junho de 1986). «Review: Contemporary Textbooks on Multivariate Statistical Analysis: A Panoramic Appraisal and Critique». Journal of the American Statistical Association. 81 (394): 560–564. ISSN 0162-1459. JSTOR 2289251. doi:10.2307/2289251 (Pages 560–561)
  3. Schervish, Mark J. (novembro de 1987). «A Review of Multivariate Analysis». Statistical Science. 2 (4): 396–413. ISSN 0883-4237. JSTOR 2245530. doi:10.1214/ss/1177013111 

Bibliografia[editar | editar código-fonte]

Ligações externas[editar | editar código-fonte]


Ícone de esboço Este artigo sobre matemática é um esboço. Você pode ajudar a Wikipédia expandindo-o.