Indexação por Semântica Latente
Aspeto
A Indexação por Semântica Latente[1], conhecida como LSI, do inglês Latent Semantic Indexing, é uma forma de redução de dimensionalidade aplicada a matriz de termo documentos de um sistema de recuperação da informação[2] ou de mineração de texto[3].
Ela é feita por meio do algoritmo SVD, Decomposição em valores singulares, onde após obtida a matriz de valores singulares, é feito um corte na matrizes, obtendo-se uma matriz menor e muito mais densa.
Referências
- ↑ Handbook of latent semantic analysis. Thomas K. Landauer. New York: [s.n.] 2011. OCLC 1366299802
- ↑ Baeza-Yates, R. (2011). Modern information retrieval : the concepts and technology behind search. Berthier Ribeiro-Neto Second edition ed. New York: Addison Wesley. OCLC 683591535
- ↑ Žižka, Jan (2021). Text mining with machine learning : principles and techniques. František Dařena, Arnošt Svoboda. Boca Raton: [s.n.] OCLC 1259525971