Indexação por Semântica Latente

Origem: Wikipédia, a enciclopédia livre.

A Indexação por Semântica Latente[1], conhecida como LSI, do inglês Latent Semantic Indexing, é uma forma de redução de dimensionalidade aplicada a matriz de termo documentos de um sistema de recuperação da informação[2] ou de mineração de texto[3].

Ela é feita por meio do algoritmo SVD, Decomposição em valores singulares, onde após obtida a matriz de valores singulares, é feito um corte na matrizes, obtendo-se uma matriz menor e muito mais densa.

Referências

  1. Handbook of latent semantic analysis. Thomas K. Landauer. New York: [s.n.] 2011. OCLC 1366299802 
  2. Baeza-Yates, R. (2011). Modern information retrieval : the concepts and technology behind search. Berthier Ribeiro-Neto Second edition ed. New York: Addison Wesley. OCLC 683591535 
  3. Žižka, Jan (2021). Text mining with machine learning : principles and techniques. František Dařena, Arnošt Svoboda. Boca Raton: [s.n.] OCLC 1259525971 

 

Este artigo é um esboço. Você pode ajudar a Wikipédia expandindo-o. Editor: considere marcar com um esboço mais específico.