Grafos aleatórios exponenciais

Origem: Wikipédia, a enciclopédia livre.
Ir para: navegação, pesquisa
Question book.svg
Esta página ou secção não cita fontes confiáveis e independentes, o que compromete sua credibilidade (desde fevereiro de 2014). Por favor, adicione referências e insira-as corretamente no texto ou no rodapé. Conteúdo sem fontes poderá ser removido.
Encontre fontes: Google (notícias, livros e acadêmico)
Ambox rewrite.svg
Esta página precisa ser reciclada de acordo com o livro de estilo (desde fevereiro de 2014).
Sinta-se livre para editá-la para que esta possa atingir um nível de qualidade superior.



Modelos de grafos aleatórios exponenciais (ERGMs) são uma família de modelos estatísticos para a análise de dados sobre redes sociais e outros.


Fundo[editar | editar código-fonte]

Existem muitas métricas para descrever as características estruturais de uma rede observada como a densidade, uma posição central, ou assortativity. No entanto, estas métricas descrevem a rede observada que é apenas um exemplo de um grande número de possíveis cadeias de alternativas. Este conjunto de redes alternativas, podem ter características estruturais similares ou dissimilares. Para dar suporte à inferência estatística sobre os processos que influenciam a formação da estrutura de rede, um modelo estatístico deve considerar o conjunto de todas as possíveis redes alternativas ponderadas sobre sua semelhança com uma rede observada. No entanto, porque os dados da rede é inerentemente relacional, viola os pressupostos de independência e distribuição idêntica de modelos estatísticos padrão, como regressão linear. Modelos estatísticos alternativos devem reflectir a incerteza associada a uma dada observação, permitem inferir sobre a frequência relativa, sobre subestruturas de rede de interesse teórico, resolução de ambiguidade à influência dos processos de confusão, o que representa de forma eficiente estruturas complexas, e que liga os processos de nível local para propriedades de nível global.


Definição[editar | editar código-fonte]

A família exponencial é uma ampla família de modelos para cobrir muitos tipos de dados, e não apenas redes. Um ERGM é um modelo desta família que descreve redes. Formalmente um grafo aleatório Y é constituído por um conjunto de n nós e m arestas \{ Y_{ij}: i=1,\dots,n; j=1,\dots,n\} onde Y_{ij}=1 se os nós (i,j) estão ligados e Y_{ij}=0 em caso contrário.

O pressuposto básico destes modelos é que a estrutura de um grafo de y observada pode ser atribuída a qualquer estatísticas s(y) em função da rede observada e atributos nodais. Desta forma, é possível descrever qualquer tipo de dependência entre as variáveis diádicas:

 P(Y = y | \theta) = \frac{\exp(\theta^{T} s(y))}{c(\theta)}

onde \theta é um vetor de parâmetros do modelo associados s(y) e c(\theta) é uma constante de normalização.

Esses modelos representam uma distribuição de probabilidade de cada possível rede em n nós. No entanto, o tamanho do conjunto de redes possíveis para uma rede não-dirigida (grafo simples) de tamanho n é 2^{n(n-1)\over 2}. Uma vez que o número de possíveis cadeias num conjunto supera vastamente o número de parâmetros que pode condicionar o modelo, a distribuição de probabilidade ideal é aquela que maximiza Gibbs Entropy.

Fonte[editar | editar código-fonte]

Este texto foi a tradução da página http://en.wikipedia.org/wiki/Epidemic_model para uma cadeira de mestrado.