Apache Lucene

Origem: Wikipédia, a enciclopédia livre.
Ir para: navegação, pesquisa



Lucene
Logotipo
Desenvolvedor Apache Software Foundation
Versão estável 4.10.2 (31 de outubro de 2014; há 6 semanas e 5 dias)
Escrito em Java
Sistema operacional Multiplataforma
Gênero(s) Busca e Indexação
Licença Apache License 2.0
Estado do desenvolvimento Ativo
Página oficial lucene.apache.org

O Apache Lucene, ou simplesmente Lucene, é um software de busca e uma API de indexação de documentos, escrito na linguagem de programação Java. É um software de código aberto da Apache Software Foundation licenciado através da licença Apache.

O Lucene contém apenas o núcleo do "motor" de busca. Por isso, ele não inclui um Web crawler ou um parser para diferentes formatos de documentos. O usuário do Lucene deve adicionar estas funcionalidades.

Para o Lucene não importa a origem dos dados, seu formato ou mesmo a linguagem em que foi escrito, desde que esses dados possam ser convertido para texto. Isto significa que o Lucene pode ser utilizado para indexar e buscar dados gravados em: arquivos, páginas web em servidores remotos, documentos gravados no sistema de arquivos local, arquivos textos, documentos Microsoft Word, documentos HTML ou arquivos PDF, ou qualquer outro formato do qual possa ser extraído informação textual.

Softwares que utilizam o Lucene[editar | editar código-fonte]

  • Beagle utiliza uma versão do Lucene escrita em C# (DotLucene) como indexador.
  • CNET utiliza o Lucene para buscar os seus produtos.
  • LjFind utiliza o Lucene para buscas num universo de 110,000,000 posts no LiveJournal.
  • Nutch é um motor de busca completo que utiliza o Lucene.
  • A ElasticSearch motor de busca baseado no Lucene.
  • A Wikipedia utiliza o Lucene para buscas textuais.

Lucene em outras linguagens[editar | editar código-fonte]

Foram construídas versões do Lucene para outras linguagens além do Java:

Ligações externas[editar | editar código-fonte]