Forma normal (teoria dos jogos)

Origem: Wikipédia, a enciclopédia livre.
Ir para: navegação, pesquisa

Na teoria dos jogos, a forma normal é uma forma de descrever um jogo. Distintamente da forma extensa, as representações na forma normal não são grafos, mas matrizes, ditas matrizes de ganhos. Isto pode ser de grande utilidade na hora de identificar estratégias estritamente dominantes e equilíbrios de Nash. Por outro lado, perde-se parte da informação quando comparado a representações na forma extensa, que inclui todas as estratégias de cada jogador junto com suas recompensas.

Em jogos estáticos de informação completa e perfeita, uma forma normal de representação de um jogo é uma especificação dos espaços de estratégia dos jogadores e das funções de recompensa. Um espaço de estratégia de um jogador é o conjunto de estratégias disponíveis para esse jogador, enquanto que uma estratégia é um plano completo de acção para cada situação do jogo, sem ter em conta se essa situação se dá realmente no jogo. Uma função de recompensa de um jogador é uma correspondência entre o produto cruzado dos espaços de estratégia dos jogadores e o conjunto de recompensas do jogador (normalmente, o conjunto dos números reais, onde o número representa uma utilidade ordinal ou cardinal - muitas vezes cardinal) de um jogador, por exemplo a função de recompensa de um jogador toma como entrada um perfil de estratégia (ou seja, a especificação das estratégias de cada jogador) e dá lugar a uma representação da recompensa pela sua saída.

Exemplo[editar | editar código-fonte]

A tabela ao lado é um exemplo de uma matriz de ganhos.

Jogo na forma normal
Jogador 2 escolhe esquerda Jogador 2 escolhe direita
Jogador 1 escolhe cima 4, 3 -1, -1
Jogador 1 escolhe baixo 0, 0 3, 4

A matriz é uma representação na forma normal de um jogo onde os jogadores jogam (tomam a sua decisão) simultaneamente (ou, pelo menos, não conhecem o movimento/decisão do outro jogador) e recebem as recompensas tal como se especifica para a combinação jogada. Por exemplo, se o jogador 1 escolhe cima e o jogador 2 escolhe esquerda, o jogador 1 recebe 4 e o jogador 2 recebe 3. Em cada célula, o primeiro número representa a recompensa do jogador das linhas (neste caso o jogador 1), e o segundo número representa a recompensa do jogador das colunas (neste caso o jogador 2).

Ligações externas[editar | editar código-fonte]