Grafos aleatórios exponenciais

Origem: Wikipédia, a enciclopédia livre.

Modelos de grafos aleatórios exponenciais (ERGMs) são uma família de modelos estatísticos para analisar dados de redes sociais e outros tipos de rede.

Contexto[editar | editar código-fonte]

Existem muitas métricas para descrever as características estruturais de uma rede observada como densidade, centralidade ou assortatividade.[1][2] No entanto, essas métricas descrevem a rede observada, que é apenas uma instância de um grande número de redes alternativas possíveis. Esse conjunto de redes alternativas pode ter características estruturais similares ou não. Para creditar uma inferência estatística sobre os processos que influenciam a formação das estruturas de rede, um modelo estatístico deve considerar o conjunto de todas as possíveis redes alternativas ponderadas em sua similaridade com uma rede observada. No entanto, porque os dados de uma rede são inerentementes relacionais, eles violam os pressupostos de independência e distribuição idêntica de modelos estatísticos como a regressão linear.[3] Modelos estatísticos alternativos devem refletir a incerteza associada a uma dada observação, permitir inferência sobre a frequência relativa sobre as subestrututras de rede de interesse teórico, eliminar ambiguidades na influência de processos de confundimento, representar eficientemente estruturas complexas e ligar processos de nível local com propriedades de nível global.[4] Randomização com preservação de grau, por exemplo, é uma forma específica em que uma rede observada pode ser considerada em termos de múltiplas redes alternativas.

Definição[editar | editar código-fonte]

A família exponencial é uma família abrangente de modelos para cobrir muitos tipos de dados, não apenas de redes. Um ERGM é um modelo desta família que descreve redes.

Formalmente, um grafo aleatório consiste de um conjunto de nós e díades (arestas) onde se os nós são conectados e de outro modo.

O pressuposto básico desses modelos é que a estrutura em um grafo observado pode ser explicado por qualquer estatística dependendo da rede observada e seus atributos nodais. Desse modo, é possível descrever qualquer tipo de dependência entre as variáveis diádicas:

onde é um vetor de parâmetros do modelo associados com e é uma constante de normalização.

Esses modelos representam uma distribuição de probabilidade em cada rede possível nos nós . No entanto, o tamanho do conjunto de redes possíveis para uma rede não direcionada (grafo simples) de tamanho é . Porque o número de redes possíveis no conjunto supera vastamente o número de parâmetro que podem restringir o modelo, a distribuição de probabilidade ideal é a que maximiza a entropia de Gibbs.[5]

Referências[editar | editar código-fonte]

  1. Wasserman, Stanley; Faust, Katherine (1994). Social Network Analysis: Methods and Applications. [S.l.: s.n.] ISBN 978-0-521-38707-1 
  2. Newman, M.E.J. «The Structure and Function of Complex Networks». SIAM Review. 45 (2): 167–256. doi:10.1137/S003614450342480 
  3. Contractor, Noshir; Wasserman, Stanley; Faust, Katherine. «Testing Multitheoretical, Multilevel Hypotheses About Organizational Networks: An Analytic Framework and Empirical Example». Academy of Management Review. 31 (3): 681–703. doi:10.5465/AMR.2006.21318925 
  4. Robins, G.; Pattison, P.; Kalish, Y.; Lusher, D. (2007). «An introduction to exponential random graph models for social networks». Social Networks. 29: 173–191. doi:10.1016/j.socnet.2006.08.002 
  5. Newman, M.E.J. «Other Network Models». Networks. [S.l.: s.n.] pp. 565–585. ISBN 978-0-19-920665-0 

Leitura adicional[editar | editar código-fonte]