Léxico-gramática

Origem: Wikipédia, a enciclopédia livre.

O léxico-gramática é simultaneamente um método e uma prática efetiva de descrição formal das línguas,[1] desenvolvidos em paralelo por Maurice Gross a partir do fim dos anos 1960,[2] o método e a prática nutrindo-se mutuamente.

A base teórica que fundamenta o léxico-gramática é o distribucionalismo de Zellig S. Harris,[3] [4] e, em especial, a noção de transformação. As convenções de notação para a apresentação das informações gramaticais são concebidas para ser o mais simples e transparentes possível. A metodologia do léxico-gramática está inspirada nas ciências experimentais [5] e dá enfoque à coleta dos fatos e, consequentemente, à conferição com a realidade dos usos linguísticos, do ponto de vista quantitativo (descrição metódica do léxico) e qualitativo (precauções metodológicas). O léxico-gramática também prevê uma exigência de formalização. Os resultados da descrição devem ser formais o suficiente para que possam ser postos em prática por informatas[6] no processamento automático das línguas, entre outras através da realização de analisadores sintáticos[7]. O modelo conceitual determina que os resultados da descrição tomam a forma de tabelas de dupla entrada, chamadas tabelas ou matrizes, que cruzam itens lexicais com as propriedades sintático-semânticas[8]. Os resultados obtidos constituem uma base de informações sintático-semânticas. As experiências comprovaram que vários indivíduos ou equipes podem alcançar uma cumulatividade de suas descrições.

Base teórica[editar | editar código-fonte]

A base teórica que fundamenta o léxico-gramática é o distribucionalismo de Zellig Harris[3] [4], e, em especial, a noção de transformação no sentido de Zellig Harris. Maurice Gross foi aluno de Zellig Harris. As convenções de notação para a apresentação das informações gramaticais são concebidas para ser o mais simples e transparentes possível. A vigilância sobre essa questão origina-se na teoria de Zellig Harris, que está orientada para a superfície diretamente observável; é uma diferença com a gramática gerativa, que normalmente recorre a estruturas abstratas como as estruturas profundas.

Coleta dos fatos[editar | editar código-fonte]

A metodologia do léxico-gramática está inspirada nas ciências experimentais [5]; dá enfoque à coleta dos fatos [9] e, consequentemente, à conferição com a realidade dos usos linguísticos, do ponto de vista quantitativo e qualitativo.

Quantitativamente: o léxico-gramática inclui um programa de descrição metódica do léxico. Trata-se, necessariamente, de um trabalho em grande escala, realizável por equipes e não por especialistas isolados. A busca exclusiva de regras de sintaxe gerais, independentes do material lexical que manuseiam, é denunciada como um impasse[10]. É uma diferença com a gramática gerativa, que valoriza mais a noção de generalização.

Qualitativamente: precauções metodológicas são aplicadas para garantir uma boa reprodutibilidade das observações e, em especial, para prevenir os riscos ligados aos exemplos construídos[11]. Uma dessas precauções consiste em eleger como unidade mínima de sentido a frase elementar'[12]. Isso é, uma palavra adquire um sentido preciso só dentro de um contexto; além disso, ao inserir uma palavra dentro de uma frase, ganha-se a vantagem de manusear uma sequência passível de ser julgada como aceitável ou inaceitável. É o preço a pagar por poder definir propriedades sintático-semânticas com suficiente precisão para que faça sentido pô-las à prova em confronto com todo o léxico. Essas precauções evoluiram em função das necessidades e do surgimento de novos meios técnicos. Por exemplo, a partir do início dos anos 1990, os contribuidores do léxico-gramática puderam cada vez mais facilmente aproveitar exemplos atestados em corpus[13]. Essa nova precaução acrescentou-se às precedentes, e o léxico-gramática passou a situar-se simultaneamente no âmbito da linguística introspectiva e da linguística de corpus[14], um pouco como preconizava Charles Fillmore[15]. Os projetos americanos FrameNet[16] e VerbNet[17], aliás, apresentam traços que manifestam uma relativa convergência para objetivos próximos dos do léxico-gramática.

Formalização[editar | editar código-fonte]

O léxico-gramática também prevê uma exigência de formalização. Os resultados da descrição devem ser formais o suficiente para que possam ser:

- verificados por conferição com a realidade do uso,

- postos em prática por informatas[6] no processamento automático das línguas, entre outras através da realização de analisadores sintáticos[7].

Essa necessidade de formalização motivou a adoção de um modelo discretizado da sintaxe e da semântica. Por exemplo, a aceitabilidade é representada por uma propriedade binária: para as necessidades da descrição, uma frase é considerada quer como aceitável, quer como inaceitável, como na gramática gerativa e pelas mesmas razões. Além disso, a ambiguidade lexical é representada através de uma cuidadosa separação de uma palavra em um número inteiro de itens lexicais, que são distintos uns dos outros como dois itens relativos a palavras morfologicamente diferentes: por exemplo, os diferentes sentidos de jogar em jogar gamão, jogar moedas na fonte... correspondem a itens distintos. As propriedades sintático-semânticas dos itens (por exemplo, as estruturas de frase em que pode entrar um determinado verbo, ou a distribuição de seu sujeito), formam uma lista que é metodicamente testada com todos os itens. As propriedades são identificadas por títulos relativamente informais, como , que representa uma transformação entre duas estruturas de frases (ou construções sintáticas) que pertencem a um único item. A noção de item lexical, pois, não é confundida com a de construção sintática. Por isso, evita-se o termo "quadro de subcategorização", frequentemente utilizado no contexto de modelos que tendem a considerar que existe uma bijecção entre as duas noções. No quadro do léxico-gramática, as decisões de classificação ("subcategorização") de um item lexical não são baseadas, em geral, em uma única construção ("quadro"), e sim no conjunto das construções sintáticas relacionadas ao item. Enfim, são tomadas em consideração unicamente as propriedades para as quais é possivel encontrar um procedimento que permita determinar de uma forma suficientemente confiável se um determinado item a possui ou não. Tal procedimento é determinado experimentalmente, testando com um vocabulário extenso a reprodutibilidade dos julgamentos. Uma propriedade, portanto, não é representada como um continuum, e sim como binária. Com a adoção deste modelo, uma etapa essencial da descrição de uma língua com o método do léxico-gramática consiste em observar e registrar as propriedades dos itens lexicais. Os resultados da descrição, portanto, tomam naturalmente a forma de tabelas de dupla entrada, chamadas tabelas, tábuas ou matrizes, que cruzam os itens lexicais com as propriedades sintático-semânticas[8]. A descrição da estrutura das frases necessita a identificação de um conjunto de argumentos característico de cada item predicativo; especificamente, põem-se em aplicação princípios para distinguir os argumentos (sujeito e objetos ou complementos essenciais) dos complementos não essenciais (adjuntos adverbiais ou complementos circunstanciais).

Resultados[editar | editar código-fonte]

Os resultados obtidos pela aplicação desse método por algumas dezenas de linguistas durante algumas dezenas de anos são uma base de informações sintático-semânticas para o processamento automático das línguas. Pode-se julgar a qualidade desta base de informações com base:

- no seu volume, avaliado em número de itens,

- na riqueza dos fenômenos linguísticos tomados em conta, avaliada em número de propriedades,

- e no seu grau de formalização.

Em francês, mais de 75 000 itens foram estabelecidos[18]; descrições mais ou menos substanciais, conformes ao mesmo modelo, existem para uma dezena de outras línguas, sendo melhor representados o português[19], o italiano[20], o grego moderno[21] e o coreano[22].

Foram efetuados e publicados estudos no quadro do léxico-gramática sobre substantivos predicativos a partir dos anos 1970[23], e sobre expressões fixas a partir dos anos 1980[24].

A noção de substantivo predicativo procede dos trabalhos de Zellig Harris[25]. Origina-se na ideia de que se, por exemplo, o verbo estudar é analisado como sendo o predicado na frase Luca estuda os eclipses, é natural analisar o substantivo estudo (ou a sequência fazer um estudo) como sendo o predicado na frase Luca faz um estudo sobre os eclipses. Em tal caso, o referido substantivo é qualificado de predicativo. Já o verbo que vem junto, no caso, fazer, é chamado verbo suporte. A ideia foi aplicada metodicamente no quadro do léxico-gramática a partir dos anos 1970[23] [26] [27] [28].

Os contribuidores do léxico-gramática usam o termo de expressão idiomática, fixa ou cristalizada quando uma expressão (por exemplo jogar fora) possui propriedades específicas (no caso, o sentido) que justificam que se lhe dedique um item lexical, embora seja constituída por vários elementos (jogar e fora) que, de uma forma ou de outra, podem ser descritos como palavras[24]. Um programa metódico de descrição dessas expressões foi empreendido no quadro do léxico-gramática a partir dos anos 1980[29] [30] [31] [32].

Cumulatividade[editar | editar código-fonte]

Essas experimentações comprovaram que vários indivíduos ou equipes podem alcançar resultados idênticos. A resultante reprodutibilidade garante a cumulatividade das descrições. Este resultado é crucial para o futuro do processamento automático das línguas: a quantidade de dados que devem ser acumulados e representados dentro de um modelo coerente é tanta que numerosas equipes de pesquisa e desenvolvimento devem cooperar, e deve ser possível fusionar seus resultados sem ter que reescrever partes substanciais da gramática e do léxico de cada língua. Está longe de ser fácil cumprir essa exigência, pois existem poucos exemplos de gramáticas de um tamanho significativo que não sejam a obra de um único especialista.

Notas e referências[editar | editar código-fonte]

  1. (em francês) Ibrahim, Amr Helmy. 2003. Le cadre du lexique-grammaire. Linx 48:101-122.
  2. (em francês) Gross, Maurice. 1968. Grammaire transformationnelle du français. Vol. 1, Syntaxe du verbe. Paris : Larousse (reeditado com o mesmo título, Paris : Cantilène, 1986).
  3. a b (em inglês) Harris, Zellig. 1964. "Transformations in Linguistic Structure", Proceedings of the American Philosophical society 108:5, pp. 418-122.
  4. a b (em francês) Harris, Zellig 1976. Notes du cours de syntaxe, Paris : Seuil.
  5. a b (em francês) Lamiroy, Béatrice. 2003. "In memoriam Maurice Gross", Travaux de linguistique 46:1, pp. 145-158.
  6. a b (em francês) Michel Delamar, Maurice Gross, http://www.univ-paris-diderot.fr/2001/pres011212.htm Arquivado em 6 de dezembro de 2006, no Wayback Machine.
  7. a b (em inglês) Roche, Emmanuel, 1997, "Parsing with Finite-State Transducers", in Finite-State Language Processing, Cambridge, Mass./ London, MIT Press.
  8. a b (em francês) Gross, Maurice. 1975. Méthodes en syntaxe. Le régime des constructions complétives. Paris : Hermann.
  9. (em inglês) Laporte, Eric, 2015, "The Science of Linguistics", Inference. International Review of Science 1(2).
  10. (em inglês) Gross, Maurice. 1979. On the failure of generative grammar. Language 55:4, pp. 859-885.
  11. (em inglês) Gross, Maurice. 1984. "A linguistic environment for comparative Romance syntax", Papers from the XIIth Linguistic Symposium on Romance Languages, pp. 373-446, Amsterdam/Philadelphia: John Benjamins.
  12. (em inglês) Gross, Maurice. 1988. Methods and Tactics in the Construction of a Lexicon-Grammar. In Linguistics in the Morning Calm 2, Selected Papers from SICOL 1986, pp. 177-197, Seoul : Hanshin Pub. Co.
  13. Entre outras coisas, graças ao sistema Intex desenvolvido por Max Silberztein.
  14. Laporte, Éric. 2008. Exemplos atestados e exemplos construídos na prática do Léxico-Gramática. Revista (Con)textos Lingüísticos 2, pp. 26–51. ISSN 1982-291X.
  15. (em inglês) Fillmore, Charles. 1992. "'Corpus linguistics' vs. 'Computer-aided armchair linguistics'". Directions in Corpus Linguistics, Mouton de Gruyter, pp. 35-60. (Atas do Simpósio Nobel 1992 sobre Linguística de Corpus, Stockholm.)
  16. (em inglês) Baker, Collin F., Charles J. Fillmore, Beau Cronin. 2003. "The Structure of the Framenet Database", International Journal of Lexicography 16.3, pp. 281-296.
  17. (em inglês) Kipper-Schuler, Karin, Anna Korhonen, Neville Ryant, Martha Palmer. 2006. "Extending VerbNet with Novel Verb Classes". Proceedings of the International Conference on Language Resources and Evaluation (LREC), Genoa.
  18. (em francês) Gross, Maurice. 2006. État du lexique-grammaire du français et perspectives d'extension. History of the Language Sciences, tome 3, Sylvain Auroux et al. (eds.), Berlin-New York: Walter de Gruyter, pp. 2122-2129.
  19. (em inglês) Ranchhod, Elisabete; P. Carvalho; C. Mota; A. Barreiro, "Portuguese Large-scale Language Resources for NLP Applications". In Proceedings of the 4th LREC, pp. 1755-1758, Lisbon.
  20. (em inglês) D'Agostino, Emilio, Annibale Elia, & Simonetta Vietri. 2004. "Lexicon-Grammar, Electronic Dictionaries and Local Grammars of Italian", Lexique, syntaxe et lexique-grammaire. Papers in honour of Maurice Gross, Coll. Lingvisticae Investigationes Supplementa, 24, Amsterdam/Philadelphia : Benjamins, pp. 125–136.
  21. (em francês) Kyriacopoulou, Tita. 2004. Analyse automatique des textes écrits : le cas du grec moderne. Thessaloniki : University Press.
  22. (em francês) Nam, Jee-sun, 1997, "Lexique grammaire des adjectifs coréens et analyse syntaxique automatique", Langages 126, Paris : Larousse.[ligação inativa]
  23. a b (em francês) Labelle, Jacques. 1974. "Le substantif symétrique". Cahiers de Linguistique 5, pp. 17-49, Montréal: UQAM.
  24. a b (em francês) Gross, Maurice. 1982. Une classification des phrases "figées" du français. Revue Québécoise de Linguistique 11.2, pp. 151-185, Montréal: UQAM.
  25. (em inglês) Harris, Zellig, 1964. "The Elementary transformations", Transformations and Discourse Analysis Papers, 54, Philadelphie, Universidade de Pensilvânia (republicado em Papers in Structural and Transformational Linguistics, 1970, Dordrecht:Reidel).
  26. (em francês) Giry-Schneider, Jacqueline. 1978. Les nominalisations en français. L'opérateur faire dans le lexique. Genève: Droz.
  27. (em francês) Giry-Schneider, Jacqueline. 1987. Les prédicats nominaux en français. Les phrases simples à verbe support. Genève: Droz.
  28. (em francês) Gross, Gaston. 1989. Les constructions converses du français, Genève : Droz.
  29. (em francês) Danlos, Laurence. 1981. La morphosyntaxe des expressions figées. Langages 63, pp. 53-74, Paris : Larousse. pdf Arquivado em 24 de setembro de 2015, no Wayback Machine.
  30. (em inglês) Gross, Maurice. 1986. "Lexicon-Grammar. The Representation of Compound Words". In COLING-1986 Proceedings, Bonn, pp. 1-6. pdf
  31. Ranchhod, Elisabete. 1990. Sintaxe dos Predicados Nominais com Estar. Linguística 1-2, Lisboa: Instituto Nacional de Investigação Científica.
  32. Vale, Oto Araújo. 2001. "Transparência e opacidade de expressões cristalizadas", In Hirata-Vale, Flávia B.M. Anais do IV Seminário Nacional de Literatura e Crítica e do II Seminário Nacional de Lingüística e Língua Portuguesa, Goiânia Gráfica e Editora Vieira, pp. 240-246.


Ver também[editar | editar código-fonte]

Artigos conexos[editar | editar código-fonte]

Ligações externas[editar | editar código-fonte]

Bibliografia[editar | editar código-fonte]