Gramática ambígua

Origem: Wikipédia, a enciclopédia livre.
Ir para: navegação, pesquisa

Em ciência da computação, uma gramática livre de contexto é dita ser uma gramática ambígua se existe uma cadeia que pode ser gerada pela gramática em mais de um caminho (ou seja, a cadeia admite mais de uma árvore sintática ou, equivalentemente, mais de uma derivação mais à esquerda). Uma linguagem livre de contexto é inerentemente ambígua se todas as gramáticas livres de contexto geradoras desta linguagem são ambíguas.

Algumas linguagens de programação têm gramáticas ambíguas; neste caso, a informação semântica é necessária para selecionar a árvore sintática pretendida de uma construção ambígua. Por exemplo, em C o seguinte:

x * y ;

pode ser interpretado como:

  • A declaração de um identificador chamado y do tipo ponteiro para x, ou
  • Uma expressão na qual x é multiplicado por y e então o resultado é descartado.

Para escolher corretamente entre as duas interpretações possíveis, um compilador deve consultar a sua tabela de símbolos para descobrir se x foi declarada como um nome de typedef que é visível neste momento.

Exemplo[editar | editar código-fonte]

A gramática livre de contexto

A → A + A | A − A | a

é ambígua já que existem duas derivações mais à esquerda para a cadeia a + a + a:

     A → A + A      A → A + A
     → a + A      → A + A + A (Primeiro A é substituído por A+A. A substituição do segundo produziria uma derivação similar)
     → a + A + A      → a + A + A
     → a + a + A      → a + a + A
     → a + a + a      → a + a + a

Como outro exemplo, a gramática é ambígua uma vez que 2 existem duas árvores sintáticas para a cadeia a + a − a:

Leftmostderivations jaredwf.png

A linguagem que ele gera, porém, não é inerentemente ambígua, o que se segue é uma gramática não ambígua gerando a mesma linguagem:

A → A + a | A − a | a

Reconhecendo gramáticas ambíguas[editar | editar código-fonte]

A questão geral de saber se um gramática não é ambígua é indecidível. Nenhum algoritmo pode existir para determinar a ambiguidade de uma gramática porque o indecidível Problema da Correspondência de Post pode ser codificado como um problema de ambiguidade. Pelo menos, há ferramentas que implementam algum procedimento de semi-decisão para detectar ambiguidade de gramáticas livres de contexto, ver por exemplo (Axelsson, Heljanko & Lange 2008).

Existe uma evidente dificuldade na análise de uma gramática ambígua por um analisador determinístico (ver gramática livre de contexto determinística) mas a análise não determinística impõe uma penalidade de grande eficiência. A maioria das construções de interesse para análise pode ser reconhecida por gramáticas não ambíguas. Algumas gramáticas ambíguas podem ser convertidas para gramáticas não ambíguas, mas não há um procedimento geral para fazer isto, assim como não existe algoritmo para a detecção de gramáticas ambíguas. Compiladores como o YACC incluem recursos para tornar não ambíguas alguns tipos de ambiguidade, por exemplo, usando as restrições de precedência e de associatividade.

Linguagens inerentemente ambíguas[editar | editar código-fonte]

Ambiguidade inerente foi mostrada pela primeira vez em 1961 por Rohit Parikh em uma pesquisa do relatório MIT {harvtxt|Parikh|1961}} e mais tarde em uma versão da revista Parikh (1966)).

Embora algumas linguagens livres de contexto (o conjunto das cadeias que podem ser geradas por uma gramática) tenham gramáticas ambíguas e não ambíguas, existem linguagens livres de contexto para o qual gramáticas livres de contexto não ambíguas podem existir. Um exemplo de um linguagem inerentemente ambígua é a união de \{a^n b^m c^m d^n | n, m > 0\} com \{a^n b^n c^m d^m | n, m > 0\}. Este conjunto é livre do contexto, já que a união de duas gramáticas livres de contexto é sempre livre de contexto. Mas Hopcroft & Ullman (1979) dão uma prova de que não há maneira de analisar sequências de forma não ambígua subconjunto (não livre de contexto) \{a^n b^n c^n d^n | n > 0\}, que é a interseção destas duas linguagens.

Referências[editar | editar código-fonte]

  • Parikh, Rohit.. In: Rohit.. Language-generating devices. [S.l.]: Quarterly Progress Report, Research Laboratory of Electronics, MIT, January 1961.
  • Gross, Maurice.. In: Maurice.. Inherent ambiguity of minimal linear grammars. [S.l.]: Information and Control, 1964. 366-368 p. vol. 7:3.
  • Parikh, Rohit.. In: Rohit.. On Context Free Languages. [S.l.]: Journal of the Association for Computing Machinery, 1966. 570-81 p. vol. 13.
  • Michael, Harrison.. In: Harrison.. Introduction to Formal Language Theory. [S.l.]: Addison-Wesley, 1978.
  • Hopcroft, John E.; Ullman, Jeffrey D.. In: John E.. Introduction to Automata Theory, Languages, and Computation. 1st ed. [S.l.]: Addison-Wesley, 1979.
  • Hopcroft, John.; Mowani, Rajeev.; Ullman, Jeffrey.. In: John.. Introduction to Automata Theory, Languages and Computation (second edition). [S.l.]: Addison Wesley, 2001. 217 p.

Links Externos[editar | editar código-fonte]

  • dk.brics.grammar - um analisador de ambiguidade de gramática.
  • CFGAnalyzer - ferramenta para analisar gramáticas livres de contexto no que diz respeito à universalidade de linguagem, ambiguidade e propriedades semelhantes.