Léxico-gramática
O léxico-gramática é simultaneamente um método e uma prática efetiva de descrição formal das línguas,[1] desenvolvidos em paralelo por Maurice Gross a partir do fim dos anos 1960,[2] o método e a prática nutrindo-se mutuamente.
A base teórica que fundamenta o léxico-gramática é o distribucionalismo de Zellig S. Harris,[3] [4] e, em especial, a noção de transformação. As convenções de notação para a apresentação das informações gramaticais são concebidas para ser o mais simples e transparentes possível. A metodologia do léxico-gramática está inspirada nas ciências experimentais [5] e dá enfoque à coleta dos fatos e, consequentemente, à conferição com a realidade dos usos linguísticos, do ponto de vista quantitativo (descrição metódica do léxico) e qualitativo (precauções metodológicas). O léxico-gramática também prevê uma exigência de formalização. Os resultados da descrição devem ser formais o suficiente para que possam ser postos em prática por informatas[6] no processamento automático das línguas, entre outras através da realização de analisadores sintáticos[7]. O modelo conceitual determina que os resultados da descrição tomam a forma de tabelas de dupla entrada, chamadas tabelas ou matrizes, que cruzam itens lexicais com as propriedades sintático-semânticas[8]. Os resultados obtidos constituem uma base de informações sintático-semânticas. As experiências comprovaram que vários indivíduos ou equipes podem alcançar uma cumulatividade de suas descrições.
Base teórica
[editar | editar código-fonte]A base teórica que fundamenta o léxico-gramática é o distribucionalismo de Zellig Harris[3] [4], e, em especial, a noção de transformação no sentido de Zellig Harris. Maurice Gross foi aluno de Zellig Harris. As convenções de notação para a apresentação das informações gramaticais são concebidas para ser o mais simples e transparentes possível. A vigilância sobre essa questão origina-se na teoria de Zellig Harris, que está orientada para a superfície diretamente observável; é uma diferença com a gramática gerativa, que normalmente recorre a estruturas abstratas como as estruturas profundas.
Coleta dos fatos
[editar | editar código-fonte]A metodologia do léxico-gramática está inspirada nas ciências experimentais [5]; dá enfoque à coleta dos fatos [9] e, consequentemente, à conferição com a realidade dos usos linguísticos, do ponto de vista quantitativo e qualitativo.
Quantitativamente: o léxico-gramática inclui um programa de descrição metódica do léxico. Trata-se, necessariamente, de um trabalho em grande escala, realizável por equipes e não por especialistas isolados. A busca exclusiva de regras de sintaxe gerais, independentes do material lexical que manuseiam, é denunciada como um impasse[10]. É uma diferença com a gramática gerativa, que valoriza mais a noção de generalização.
Qualitativamente: precauções metodológicas são aplicadas para garantir uma boa reprodutibilidade das observações e, em especial, para prevenir os riscos ligados aos exemplos construídos[11]. Uma dessas precauções consiste em eleger como unidade mínima de sentido a frase elementar'[12]. Isso é, uma palavra adquire um sentido preciso só dentro de um contexto; além disso, ao inserir uma palavra dentro de uma frase, ganha-se a vantagem de manusear uma sequência passível de ser julgada como aceitável ou inaceitável. É o preço a pagar por poder definir propriedades sintático-semânticas com suficiente precisão para que faça sentido pô-las à prova em confronto com todo o léxico. Essas precauções evoluiram em função das necessidades e do surgimento de novos meios técnicos. Por exemplo, a partir do início dos anos 1990, os contribuidores do léxico-gramática puderam cada vez mais facilmente aproveitar exemplos atestados em corpus[13]. Essa nova precaução acrescentou-se às precedentes, e o léxico-gramática passou a situar-se simultaneamente no âmbito da linguística introspectiva e da linguística de corpus[14], um pouco como preconizava Charles Fillmore[15]. Os projetos americanos FrameNet[16] e VerbNet[17], aliás, apresentam traços que manifestam uma relativa convergência para objetivos próximos dos do léxico-gramática.
Formalização
[editar | editar código-fonte]O léxico-gramática também prevê uma exigência de formalização. Os resultados da descrição devem ser formais o suficiente para que possam ser:
- verificados por conferição com a realidade do uso,
- postos em prática por informatas[6] no processamento automático das línguas, entre outras através da realização de analisadores sintáticos[7].
Essa necessidade de formalização motivou a adoção de um modelo discretizado da sintaxe e da semântica. Por exemplo, a aceitabilidade é representada por uma propriedade binária: para as necessidades da descrição, uma frase é considerada quer como aceitável, quer como inaceitável, como na gramática gerativa e pelas mesmas razões. Além disso, a ambiguidade lexical é representada através de uma cuidadosa separação de uma palavra em um número inteiro de itens lexicais, que são distintos uns dos outros como dois itens relativos a palavras morfologicamente diferentes: por exemplo, os diferentes sentidos de jogar em jogar gamão, jogar moedas na fonte... correspondem a itens distintos. As propriedades sintático-semânticas dos itens (por exemplo, as estruturas de frase em que pode entrar um determinado verbo, ou a distribuição de seu sujeito), formam uma lista que é metodicamente testada com todos os itens. As propriedades são identificadas por títulos relativamente informais, como , que representa uma transformação entre duas estruturas de frases (ou construções sintáticas) que pertencem a um único item. A noção de item lexical, pois, não é confundida com a de construção sintática. Por isso, evita-se o termo "quadro de subcategorização", frequentemente utilizado no contexto de modelos que tendem a considerar que existe uma bijecção entre as duas noções. No quadro do léxico-gramática, as decisões de classificação ("subcategorização") de um item lexical não são baseadas, em geral, em uma única construção ("quadro"), e sim no conjunto das construções sintáticas relacionadas ao item. Enfim, são tomadas em consideração unicamente as propriedades para as quais é possivel encontrar um procedimento que permita determinar de uma forma suficientemente confiável se um determinado item a possui ou não. Tal procedimento é determinado experimentalmente, testando com um vocabulário extenso a reprodutibilidade dos julgamentos. Uma propriedade, portanto, não é representada como um continuum, e sim como binária. Com a adoção deste modelo, uma etapa essencial da descrição de uma língua com o método do léxico-gramática consiste em observar e registrar as propriedades dos itens lexicais. Os resultados da descrição, portanto, tomam naturalmente a forma de tabelas de dupla entrada, chamadas tabelas, tábuas ou matrizes, que cruzam os itens lexicais com as propriedades sintático-semânticas[8]. A descrição da estrutura das frases necessita a identificação de um conjunto de argumentos característico de cada item predicativo; especificamente, põem-se em aplicação princípios para distinguir os argumentos (sujeito e objetos ou complementos essenciais) dos complementos não essenciais (adjuntos adverbiais ou complementos circunstanciais).
Resultados
[editar | editar código-fonte]Os resultados obtidos pela aplicação desse método por algumas dezenas de linguistas durante algumas dezenas de anos são uma base de informações sintático-semânticas para o processamento automático das línguas. Pode-se julgar a qualidade desta base de informações com base:
- no seu volume, avaliado em número de itens,
- na riqueza dos fenômenos linguísticos tomados em conta, avaliada em número de propriedades,
- e no seu grau de formalização.
Em francês, mais de 75 000 itens foram estabelecidos[18]; descrições mais ou menos substanciais, conformes ao mesmo modelo, existem para uma dezena de outras línguas, sendo melhor representados o português[19], o italiano[20], o grego moderno[21] e o coreano[22].
Foram efetuados e publicados estudos no quadro do léxico-gramática sobre substantivos predicativos a partir dos anos 1970[23], e sobre expressões fixas a partir dos anos 1980[24].
A noção de substantivo predicativo procede dos trabalhos de Zellig Harris[25]. Origina-se na ideia de que se, por exemplo, o verbo estudar é analisado como sendo o predicado na frase Luca estuda os eclipses, é natural analisar o substantivo estudo (ou a sequência fazer um estudo) como sendo o predicado na frase Luca faz um estudo sobre os eclipses. Em tal caso, o referido substantivo é qualificado de predicativo. Já o verbo que vem junto, no caso, fazer, é chamado verbo suporte. A ideia foi aplicada metodicamente no quadro do léxico-gramática a partir dos anos 1970[23] [26] [27] [28].
Os contribuidores do léxico-gramática usam o termo de expressão idiomática, fixa ou cristalizada quando uma expressão (por exemplo jogar fora) possui propriedades específicas (no caso, o sentido) que justificam que se lhe dedique um item lexical, embora seja constituída por vários elementos (jogar e fora) que, de uma forma ou de outra, podem ser descritos como palavras[24]. Um programa metódico de descrição dessas expressões foi empreendido no quadro do léxico-gramática a partir dos anos 1980[29] [30] [31] [32].
Cumulatividade
[editar | editar código-fonte]Essas experimentações comprovaram que vários indivíduos ou equipes podem alcançar resultados idênticos. A resultante reprodutibilidade garante a cumulatividade das descrições. Este resultado é crucial para o futuro do processamento automático das línguas: a quantidade de dados que devem ser acumulados e representados dentro de um modelo coerente é tanta que numerosas equipes de pesquisa e desenvolvimento devem cooperar, e deve ser possível fusionar seus resultados sem ter que reescrever partes substanciais da gramática e do léxico de cada língua. Está longe de ser fácil cumprir essa exigência, pois existem poucos exemplos de gramáticas de um tamanho significativo que não sejam a obra de um único especialista.
Notas e referências
[editar | editar código-fonte]- ↑ (em francês) Ibrahim, Amr Helmy. 2003. Le cadre du lexique-grammaire. Linx 48:101-122.
- ↑ (em francês) Gross, Maurice. 1968. Grammaire transformationnelle du français. Vol. 1, Syntaxe du verbe. Paris : Larousse (reeditado com o mesmo título, Paris : Cantilène, 1986).
- ↑ a b (em inglês) Harris, Zellig. 1964. "Transformations in Linguistic Structure", Proceedings of the American Philosophical society 108:5, pp. 418-122.
- ↑ a b (em francês) Harris, Zellig 1976. Notes du cours de syntaxe, Paris : Seuil.
- ↑ a b (em francês) Lamiroy, Béatrice. 2003. "In memoriam Maurice Gross", Travaux de linguistique 46:1, pp. 145-158.
- ↑ a b (em francês) Michel Delamar, Maurice Gross, http://www.univ-paris-diderot.fr/2001/pres011212.htm Arquivado em 6 de dezembro de 2006, no Wayback Machine.
- ↑ a b (em inglês) Roche, Emmanuel, 1997, "Parsing with Finite-State Transducers", in Finite-State Language Processing, Cambridge, Mass./ London, MIT Press.
- ↑ a b (em francês) Gross, Maurice. 1975. Méthodes en syntaxe. Le régime des constructions complétives. Paris : Hermann.
- ↑ (em inglês) Laporte, Eric, 2015, "The Science of Linguistics", Inference. International Review of Science 1(2).
- ↑ (em inglês) Gross, Maurice. 1979. On the failure of generative grammar. Language 55:4, pp. 859-885.
- ↑ (em inglês) Gross, Maurice. 1984. "A linguistic environment for comparative Romance syntax", Papers from the XIIth Linguistic Symposium on Romance Languages, pp. 373-446, Amsterdam/Philadelphia: John Benjamins.
- ↑ (em inglês) Gross, Maurice. 1988. Methods and Tactics in the Construction of a Lexicon-Grammar. In Linguistics in the Morning Calm 2, Selected Papers from SICOL 1986, pp. 177-197, Seoul : Hanshin Pub. Co.
- ↑ Entre outras coisas, graças ao sistema Intex desenvolvido por Max Silberztein.
- ↑ Laporte, Éric. 2008. Exemplos atestados e exemplos construídos na prática do Léxico-Gramática. Revista (Con)textos Lingüísticos 2, pp. 26–51. ISSN 1982-291X.
- ↑ (em inglês) Fillmore, Charles. 1992. "'Corpus linguistics' vs. 'Computer-aided armchair linguistics'". Directions in Corpus Linguistics, Mouton de Gruyter, pp. 35-60. (Atas do Simpósio Nobel 1992 sobre Linguística de Corpus, Stockholm.)
- ↑ (em inglês) Baker, Collin F., Charles J. Fillmore, Beau Cronin. 2003. "The Structure of the Framenet Database", International Journal of Lexicography 16.3, pp. 281-296.
- ↑ (em inglês) Kipper-Schuler, Karin, Anna Korhonen, Neville Ryant, Martha Palmer. 2006. "Extending VerbNet with Novel Verb Classes". Proceedings of the International Conference on Language Resources and Evaluation (LREC), Genoa.
- ↑ (em francês) Gross, Maurice. 2006. État du lexique-grammaire du français et perspectives d'extension. History of the Language Sciences, tome 3, Sylvain Auroux et al. (eds.), Berlin-New York: Walter de Gruyter, pp. 2122-2129.
- ↑ (em inglês) Ranchhod, Elisabete; P. Carvalho; C. Mota; A. Barreiro, "Portuguese Large-scale Language Resources for NLP Applications". In Proceedings of the 4th LREC, pp. 1755-1758, Lisbon.
- ↑ (em inglês) D'Agostino, Emilio, Annibale Elia, & Simonetta Vietri. 2004. "Lexicon-Grammar, Electronic Dictionaries and Local Grammars of Italian", Lexique, syntaxe et lexique-grammaire. Papers in honour of Maurice Gross, Coll. Lingvisticae Investigationes Supplementa, 24, Amsterdam/Philadelphia : Benjamins, pp. 125–136.
- ↑ (em francês) Kyriacopoulou, Tita. 2004. Analyse automatique des textes écrits : le cas du grec moderne. Thessaloniki : University Press.
- ↑ (em francês) Nam, Jee-sun, 1997, "Lexique grammaire des adjectifs coréens et analyse syntaxique automatique", Langages 126, Paris : Larousse.[ligação inativa]
- ↑ a b (em francês) Labelle, Jacques. 1974. "Le substantif symétrique". Cahiers de Linguistique 5, pp. 17-49, Montréal: UQAM.
- ↑ a b (em francês) Gross, Maurice. 1982. Une classification des phrases "figées" du français. Revue Québécoise de Linguistique 11.2, pp. 151-185, Montréal: UQAM.
- ↑ (em inglês) Harris, Zellig, 1964. "The Elementary transformations", Transformations and Discourse Analysis Papers, 54, Philadelphie, Universidade de Pensilvânia (republicado em Papers in Structural and Transformational Linguistics, 1970, Dordrecht:Reidel).
- ↑ (em francês) Giry-Schneider, Jacqueline. 1978. Les nominalisations en français. L'opérateur faire dans le lexique. Genève: Droz.
- ↑ (em francês) Giry-Schneider, Jacqueline. 1987. Les prédicats nominaux en français. Les phrases simples à verbe support. Genève: Droz.
- ↑ (em francês) Gross, Gaston. 1989. Les constructions converses du français, Genève : Droz.
- ↑ (em francês) Danlos, Laurence. 1981. La morphosyntaxe des expressions figées. Langages 63, pp. 53-74, Paris : Larousse. pdf Arquivado em 24 de setembro de 2015, no Wayback Machine.
- ↑ (em inglês) Gross, Maurice. 1986. "Lexicon-Grammar. The Representation of Compound Words". In COLING-1986 Proceedings, Bonn, pp. 1-6. pdf
- ↑ Ranchhod, Elisabete. 1990. Sintaxe dos Predicados Nominais com Estar. Linguística 1-2, Lisboa: Instituto Nacional de Investigação Científica.
- ↑ Vale, Oto Araújo. 2001. "Transparência e opacidade de expressões cristalizadas", In Hirata-Vale, Flávia B.M. Anais do IV Seminário Nacional de Literatura e Crítica e do II Seminário Nacional de Lingüística e Língua Portuguesa, Goiânia Gráfica e Editora Vieira, pp. 240-246.
Ver também
[editar | editar código-fonte]Artigos conexos
[editar | editar código-fonte]Ligações externas
[editar | editar código-fonte]- Visualisação de tabelas de léxico-gramática (seguir Données linguistiques, Lexique-grammaire).
Bibliografia
[editar | editar código-fonte]- Boons, Jean-Paul ; Alain Guillet ; Christian Leclère. 1976. La structure des phrases simples en français. 1. Constructions intransitives, Genève : Droz.
- Guillet, Alain ; Christian Leclère. 1992. La structure des phrases simples en français. 2. Constructions transitives locatives, Genève : Droz.
- Gross, Maurice. 1994. Constructing Lexicon-grammars, in Computational Approaches to the Lexicon, Atkins and Zampolli (eds.), Oxford University Press, pp. 213-263.
- Leclère, Christian. 2005. The lexicon-grammar of French verbs: a syntactic database, in Linguistic Informatics - State of the Art and the Future. Amsterdam/Philadelphia : Benjamins. pp. 29–45. Tokyo University of Foreign Studies, UBLI 1.