Centralidade

Origem: Wikipédia, a enciclopédia livre.
Ir para: navegação, pesquisa


No âmbito da teoria dos grafos e da análise de redes, existem diferentes tipos de medidas de centralidade de um vértice num grafo que determinam a importância relativa de um vértice no grafo (isto é, o quanto uma pessoa é influente dentro de uma rede social, ou, na teoria da sintaxe espacial, o quanto é importante uma sala dentro de um edifício ou como é bem utilizada uma estrada dentro de uma rede urbana). Muitos dos conceitos de centralidade foram primeiramente desenvolvidos na análise de redes sociais, e muitos dos termos usados para medir a centralidade refletem a sua origem sociológica.[1]

Existem quatro medidas de centralidade que são amplamente utilizados na análise de rede: centralidade de grau, centralidade de intermediação, centralidade de proximidade e centralidade de vetor próprio. Para uma revisão, bem como generalizações para redes ponderadas, consulte Opsahl et al.(2010).[2]

Exemplos do mesmo grafo: A) Centralidade de Grau, B) Centralidade de Proximidade, C) Centralidade de Intermediação, D) Centralidade de vetor próprio, E) Centralidade de Katz, F) Centralidade Alpha

Centralidade de Grau[editar | editar código-fonte]

Historicamente primeira, a centralidade de grau é conceptualmente a mais simples, a qual é definida como o número de ligações incidentes sobre um nó (por exemplo, o número de ligações que um nó possuí). O grau pode ser interpretado em termos de risco imediato de um nó para capturar tudo o que circula através da rede (por exemplo, um vírus, ou alguma informação) No caso de uma rede orientada (onde os laços tem direção), costumamos definir duas medidas distintas de centralidade de grau, isto é, indegree e outdegree. Consequentemente, indegree é uma contagem do número de ligações direcionadas para o nó e outdegree é o número de ligações que o nó encaminha para outros. Quando os laços estão associados a alguns aspetos positivos, como a amizade ou colaboração, indegree é muitas vezes interpretada como uma forma de popularidade, e outdegree como sociável.

A centralidade de grau de um vértice v, para um dado grafo G:=(V,E) com |V| vértices e |E| arestas, é definido como

C_D(v)= \text{deg}(v)

Calculando a centralidade de grau para todos os nós num grafo \Theta(V^2) em representação da densa matriz de adjacência do grafo, e para as arestas tem \Theta(E) numa representação de uma matriz dispersa.

Por vezes, o interesse está em descobrir a centralidade de um grafo dentro de um grafo. A definição da centralidade no nível do nó pode ser estendida para o grafo inteiro. Deixemos v* ser o nó com maior centralidade de grau em G. Deixemos X:=(Y,Z) seja o Y nó conectado ao grafo que maximiza a seguinte quantidade (Com y* sendo o nó com maior grau de centralidade X):

H= \displaystyle{\sum^{|Y|}_{j=1}{C_D(y*)-C_D(y_j)}}

De um modo correspondente, o grau de centralidade do grafo G é o seguinte:

C_D(G)= \frac{\displaystyle{\sum^{|V|}_{i=1}{[C_D(v*)-C_D(v_i)]}}}{H}

O valor de H é maximizado quando o grafo X contem um nó central ao qual todos os outros nós são ligados (um grafo em estrela), e neste caso H=(n-1)(n-2).

Centralidade de Proximidade[editar | editar código-fonte]

Em grafos conectados existe uma distância natural métrica entre todos os pares de nós, definido pelo comprimento de seus caminhos mais curtos. O afastamento de um nó s é definido como a soma de suas distâncias para todos os outros nós, e sua proximidade é definida como o inverso do afastamento.[3] Assim, quanto mais central é o nó, menor é a distância do seu total para todos os outros nós. Proximidade pode ser considerada como uma medida de rapidez, para determinar a velocidade que ela necessitará para difundir informações de s a todos os outros nós sequencialmente.[4]

Na definição clássica de centralidade de proximidade, a disseminação de informações é modelada através da utilização dos caminhos mais curtos. Este modelo pode não ser o mais realista de todos os tipos de cenários de comunicação. Assim, as definições relacionadas foram discutidas para medir proximidade, como a centralidade de proximidade de caminhos aleatórios introduzida por Noh e Rieger (2004). Mede a velocidade com que as mensagens aleatórias chegam a um vértice de fora da rede, digamos que é uma espécie de versão aleatória das mensagens da centralidade de proximidade.[5]

A centralidade da informação de Stephenson e Zelen (1989) é outra medida de proximidade, que tem alguma semelhança com a de Noh e Rieger. Na sua essência, as medidas da duração média harmônica de caminhos que termina num vértice i, que é menor se i tiver muitos caminhos curtos ligando-o a outros vértices.[6]

Note-se que, por definição de distâncias teóricas do grafo, a centralidade de proximidade clássica de todos os nós de um grafo seria 0. Numa obra de Dangalchev (2006) relacionando a vulnerabilidade da rede, a definição de proximidade é modificada de tal modo, que pode ser calculada mais facilidade e podem ser aplicados também aos grafos que falta conectividade:[7]

C_C(v)=\sum_{t \in V\setminus v}2^{-d_G(v,t)}.

Outra extensão de redes com elementos desconectados foi proposta por Opsahl (2010).[8]

Centralidade de Intermediação[editar | editar código-fonte]

Hue (de vermelho para azul = 0 = max) mostra a intermediação nó.

É uma medida de centralidade de um vértice dentro de um grafo (existe também a intermediação das arestas, que não é discutido aqui). Centralidade de intermediação quantifica o número de vezes que um nó age como ponte ao longo do caminho mais curto entre dois outros nós. Foi introduzido por Linton Freeman.[9] como uma medida para quantificar o controlo de um ser humano sobre a comunicação entre outros seres humanos numa rede social. Na sua conceção, vértices que possuem uma alta probabilidade de ocorrer num caminho mais curto escolhido aleatoriamente entre dois vértices também escolhidos aleatoriamente que possuam uma elevada intermediação.

A intermediação de um vértice v num grafo G:=(V,E) com V vértices é calculado como se segue:

1. Para cada par de vértices (s,t), calcular os caminhos mais curtos entre eles.

2. Para cada par de vértices (s,t), determinar a fração de caminhos mais curtos que passam através do vértice em questão (neste caso, vértice v ).

3. Somar esta fração de todos os pares de vértices (s,t).

De forma mais compacta a intermediação pode ser representada como:[10]

C_B(v)= \sum_{s \neq v \neq t \in V}\frac{\sigma_{st}(v)}{\sigma_{st}}

Onde, \sigma_{st} é o número total de caminhos curtos desde o nó s ao nó t e \sigma_{st}(v) é o número desses caminhos que passam por v. A intermediação pode ser normalizada ao ser dividida pelo número de pares de vértices não incluindo v, que para grafos diretos é (n-1)(n-2) e para grafos indiretos é (n-1)(n-2)/2. or exemplo, um grafo indireto em estrela, o vértice central (que está contido em cada caminho mais curto possível) teria uma intermediação de (n-1)(n-2)/2 (1, se normalizado) enquanto as folhas (as quais não estão presentes em nenhum caminhos mais curtos) teria uma intermediação de 0.

Do ponto de vista de cálculo, tanto a centralidade de intermediação como a de proximidade de todos os vértices de um grafo envolvem o cálculo dos caminhos mais curtos entre todos os pares de vértices de um grafo, que requer um tempo \Theta(V^3) com o algoritmo de Floyd-Warshall.No entanto, em grafos dispersos, o algoritmo de Johnson pode ser mais eficiente, tendo tempo O(V^2 \log V + V E). No caso dos grafos não ponderados os cálculos pode ser feitos com o algoritmo de Brandes[10] o que leva o tempo O(V E). Normalmente, estes algoritmos assumem que os grafos estão sem direção e conectados com a garantia de ciclos e arestas múltiplas. Quando se lidar especificamente com grafos de rede, os grafos estão sem ciclos ou múltiplas arestas para manter relacionamentos simples (onde as arestas representam as ligações entre duas pessoas ou vértices). Neste caso, utilizando o algoritmo de Brandes vai dividir as pontuações finais da centralidade por 2 por 2 e contabilizar cada caminho mais curto duas vezes.[10]

Centralidade de Vetor Próprio[editar | editar código-fonte]

Centralidade de vetor próprio é uma medida da influência de um nó numa rede. Ele atribui pontuações relativas a todos os nós da rede, baseada no conceito de que as ligações para os nós de alta pontuação contribuem mais para a pontuação do nó em questão do que ligações iguais a nós baixa pontuação. O sistema de PageRank do Google é uma variante da medida de centralidade de vetor próprio.[11] Outra medida de centralidade relacionada é a centralidade de Katz.

Utilizando a matriz de adjacência para encontrar a centralidade de vetor próprio[editar | editar código-fonte]

Para um dado grafo G:=(V,E) com |V| o número de vértices e A = (a_{v,t}) a matriz de adjacência, ou seja a_{v,t} = 1 se o vértice v está ligado ao vértice t, e a_{v,t} = 0 de outra forma. A pontuação da centralidade do vértice v pode ser definida como:

x_v = \frac{1}{\lambda} \sum_{t \in M(v)}x_t = \frac{1}{\lambda} \sum_{t \in G} a_{v,t}x_t

Onde M(v) é um conjunto de vizinhos de v e \lambda é uma constante. Com um pequeno rearranjo, esta equação pode ser reescrita em notação vetorial como a equação de vetor próprio.

\mathbf{Ax} = {\lambda}\mathbf{x}

De um modo geral, haverá diversos vetores próprios \lambda para o qual uma solução de vetor próprio existe. No entanto, o requerimento adicional para todas as entradas do vetor próprio sejam positivas, implica (pelo teorema de Perron-Frobenius) que somente os maiores resultados do vetor próprio sejam considerados na medida de centralidade desejada.[12] O componente v^{th} do vetor próprio relacionado dá-nos então a pontuação da centralidade do vértice v na rede. O método das potências é um dos muitos algoritmos do vetor próprio que pode ser usado para encontrar o vetor próprio dominante.[11] Por outro lado, isto pode ser generalizado de modo a que as entradas de A possam ser números reais que representem as forças de ligação, tal como uma matriz de probabilidade.

Centralidade de Katz e sistema de PageRank[editar | editar código-fonte]

A centralidade de Katz[13] é uma generalização da centralidade de grau. Como a centralidade de grau mede o número de vizinhos diretos, a centralidade Katz mede o número de todos os nós que podem ser conectados através de um caminho, enquanto a contribuição de um nó distante é penalizado por um fator de atenuação \alpha\in (0,1). Matematicamente, é definido como x_i = \sum_{k=1}^{\infin}\sum_{j=1}^N \alpha^k (A^k)_{ij}.

Centralidade de Katz pode ser vista como uma variante da centralidade do vetor próprio. Outra forma da centralidade Katz é: x_i = \alpha \sum_{j =1}^N a_{ij}(x_j+1). Comparada com a expressão de centralidade de vetor próprio, x_j é substituída por x_j+1.

Nesta demonstração [14] em que o principal vetor próprio (associado com o maior valor do vetor próprio de A, a matriz adjacente) é o limite da centralidade de Katz como \alpha aborda 1/\lambda por baixo.

O sistema de PageRank satisfaz a seguinte equação: x_i = \alpha \sum_{j } a_{ji}\frac{x_j}{L(j)} + \frac{1-\alpha}{N}, Onde L(j) = \sum_{j} a_{ij} é o número de vizinhos de nó j ou o número de ligações externas num grafo direcionado). Comparando a centralidade de vetor próprio e a centralidade de Katz, a grande diferença é o fator de escala L(j). ). Outra diferença entre o sistema PageRank e centralidade de vetor próprio é de que o vetor PageRank tem os índices invertidos no fator a_{ji}.[15]

Definição e caracterização dos índices de centralidade[editar | editar código-fonte]

Dos índices de centralidade clássicos já mencionados, existem dezenas de outros índices de centralidade mais especializados. Apesar da sua noção intuitiva ainda não há uma definição ou caracterização de índices de centralidade que que seja comum para todos eles.[16] Uma definição um pouco fraca de índice de centralidade é a seguinte:

Um índice de centralidade é uma função real sobre os nós de um grafo. É um índice estrutural, ou seja, se G and H são 2 grafos isomorfos e \Phi é o mapeamento a partir do conjunto de vértices V(G) de G para V(H), então a centralidade do vértice v de G deverá ser a mesmo que a centralidade de \Phi(v) em H. Convencionalmente, quanto maior for o índice da centralidade de um nó, maior será a sua centralidade percebida no grafo.[17] Esta definição inclui todas as medidas de centralidade clássica, mas nem todas as medidas que atendam a esta definição podem ser aceites como índices de centralidade.

Segundo Borgatti e Everett os índices de centralidade medem a posição de um nó ao longo de um conjunto de caminhos predefinido. Eles caracterizam os índices de centralidade ao longo de quatro dimensões: o conjunto de caminhos, se o comprimento ou o número destes caminhos é considerado, a posição do nó nos caminhos (no início = radial; no meio = medial), e como os números atribuídos aos caminhos estão resumidos nas medidas (média, mediana, soma ponderada...).[16] Isto leva a uma caracterização da forma como um índice centralidade é calculado. Numa outra diferente caracterização, Borgatti diferencia os índices de centralidade pelo tipo de caminhos que são considerados e que tipo de fluxo de rede que estes implicam.[18] Este último caracteriza os índices de centralidade pela qualidade com que eles preveem qual o nó mais central para um determinado processo de fluxo de rede. Esta caracterização, portanto, fornece orientação sobre quando usar cada índice de centralidade.

Centralização[editar | editar código-fonte]

A centralização de qualquer rede é uma medida de quão central é o nó mais central, em relação à forma de quão central serão todos os outros nós.[19] A definição geral de centralização para redes não ponderadas foi proposta por Linton Freeman (1979). Centralização mede então: (a) Calcular a soma de diferenças na centralidade entre o nó mais central de uma rede, e todos os outros nós; (b) Dividir esta quantidade pela teoricamente maior soma das diferenças em toda a rede do mesmo grau [19] Assim, a cada medida de centralidade pode ter a sua própria medida de centralização. Definidos formalmente, se C_x(p_i) é uma medida de ponto central qualquer i, se C_x(p_*) é a maior medida na rede, e se max \sum_{j=1}^{N} C_x(p_*)-C_x(p_i) é a maior soma das diferenças do ponto central C_x para qualquer grafo com o mesmo número de nós, em seguida, a centralização da rede é :[19]

C_x=\frac{\sum_{j=1}^{N} C_x(p_*)-C_x(p_i)}{max \sum_{j=1}^{N} C_x(p_*)-C_x(p_i)}

Notas e referências[editar | editar código-fonte]

  1. Newman, M.E.J. 2010. Networks: An Introduction. Oxford, UK: Oxford University Press.
  2. (2010) "Node centrality in weighted networks: Generalizing degree and shortest paths". Social Networks 32 (3): 245. DOI:10.1016/j.socnet.2010.03.006.
  3. Sabidussi, G. (1966) The centrality index of a graph. Psychometrika 31, 581--603.
  4. M.E.J. Newman (2005), A measure of betweenness centrality based on random walks, 27, pp. 39–54, doi:10.1016/j.socnet.2004.11.009 Papercore summary http://papercore.org/Newman2005.
  5. J. D. Noh and H. Rieger, Phys. Rev. Lett. 92, 118701 (2004).
  6. Stephenson, K. A. and Zelen, M., 1989. Rethinking centrality: Methods and examples. Social Networks 11, 1–37.
  7. Dangalchev Ch., Residual Closeness in Networks, Phisica A 365, 556 (2006).
  8. Tore Opsahl. . "Closeness centrality in networks with disconnected components".
  9. (1977) "A set of measures of centrality based upon betweenness". Sociometry 40: 35–41.
  10. a b c (2001) "A faster algorithm for betweenness centrality" (PDF). Journal of Mathematical Sociology 25: 163–177. Paperore summary http://papercore.org/Brandes2001
  11. a b http://www.ams.org/samplings/feature-column/fcarc-pagerank
  12. M. E. J. Newman. . "The mathematics of networks" (PDF).
  13. Katz, L. 1953. A New Status Index Derived from Sociometric Index. Psychometrika, 39-43.
  14. Bonacich, P., 1991. Simultaneous group and individual centralities. Social Networks 13, 155–168.
  15. How does Google rank webpages? 20Q: About Networked Life
  16. a b (2005) "A Graph-Theoretic Perspective on Centrality". Social Networks 28: 466–484. Elsevier. DOI:10.1016/j.socnet.2005.11.005.
  17. Koschützki, Dirk; Katharina A. Lehmann, Leon Peeters, Stefan Richter, Dagmar Tenfelde-Podehl, Oliver Zlotowski (2005). "Centrality Indices". Network Analysis – Methodological Foundations LNCS 3418. Ed. Ulrik Brandes, Thomas Erlebach. Springer Verlag, Heidelberg, Germany. 16–60. ISBN 978-3-540-24979-5 
  18. Stephen P. Borgatti. (2005). "Centrality and Network Flow". Social Networks 27: 55–71. Elsevier.
  19. a b c Freeman, L. C. (1979). Centrality in social networks: Conceptual clarification. Social Networks, 1(3), 215-239.

Leitura adicional[editar | editar código-fonte]

  • Freeman, L. C. (1979). Centrality in social networks: Conceptual clarification. Social Networks, 1(3), 215-239.
  • Sabidussi, G. (1966). The centrality index of a graph. Psychometrika, 31 (4), 581-603.
  • Freeman, L. C. (1977). A set of measures of centrality based on betweenness. Sociometry 40, 35-41.
  • Koschützki, D.; Lehmann, K. A.; Peeters, L.; Richter, S.; Tenfelde-Podehl, D. and Zlotowski, O. (2005) Centrality Indices. In Brandes, U. and Erlebach, T. (Eds.) Network Analysis: Methodological Foundations, pp. 16–61, LNCS 3418, Springer-Verlag.
  • Bonacich, P. (1987). Power and Centrality: A Family of Measures, The American Journal of Sociology, 92 (5), pp 1170–1182.

Ligações externas[editar | editar código-fonte]