Apache Solr: alguém disse mecanismo de pesquisa?

Apache Solr

Solr é a popular plataforma de pesquisa empresarial de código aberto, extremamente rápida. É uma das maneiras mais fáceis de desenvolver aplicativos de pesquisa sofisticados e de alto desempenho. Baseado em outro produto Apache Lucene, o Solr fornece aos desenvolvedores recursos como recursos avançados de pesquisa de texto completo, escalabilidade, fácil monitoramento e muito mais. Este blog tem como objetivo ajudá-lo a começar a usar o Solr e ajudá-lo a interagir com um servidor Solr.

O Solr é basicamente uma plataforma de pesquisa corporativa. Mas o que isso significa? Deixe-me tentar explicar isso com a ajuda de um exemplo. Suponha que você trabalhe para uma equipe de vendas e seu chefe queira que você ligue para os desenvolvedores de software que pertencem à faixa etária de 20 a 40 anos para lhes oferecer um plano. Para isso, você pode precisar das seguintes informações:
– A idade da pessoa
– A especialização profissional de uma pessoa
– O número de contato de uma pessoa

Todas essas informações podem ser de difícil acesso, pois podem estar disponíveis em diferentes locais (nuvens). Um software de pesquisa corporativa pode resolver esse problema indexando todos os diferentes locais de dados em um registro (um índice) e transformando esse registro em um local central para buscar dados relevantes.

Agora que você tem uma pequena ideia sobre como o Solr pode ser usado, vamos mergulhar um pouco mais fundo. Em primeiro lugar, você precisará instalar o Solr em seus sistemas para usá-lo. Consulte Instalar Apache Solr para obter um procedimento detalhado para o mesmo.

Vamos nos familiarizar com alguns termos-chave:
Solr servidor: este é o servidor de pesquisa corporativa executado em seu host local. Todos os núcleos e coleções estão presentes neste servidor.

Core: o termo core é usado para se referir a um único índice e arquivos de configuração associados. Um único servidor pode ter vários núcleos.

– Coleção: os servidores Solr podem ser autônomos ou no modo de nuvem. Para o modo de nuvem, temos coleções que nada mais são do que múltiplos núcleos sob o capô.

Índice: é como um índice no início de um livro, que torna mais fácil para o leitor acessar o capítulo que deseja. Todo o processo de adicionar qualquer documento a um núcleo Solr é chamado de indexação.

Documento: como o nome sugere, é um conjunto de dados que descreve algo. É a unidade básica de informação no Solr. Em mais granularidade, os documentos são compostos por campos. Isso é semelhante a uma tabela de DBMS e seus respectivos atributos.

Essa quantidade de informações será suficiente para nos ajudar a começar. Vamos continuar e iniciar o servidor Solr. Abra o terminal e vá para o diretório que hospeda seu Solr e depois vá para o diretório bin. Para iniciar o tipo de servidor

Isso iniciará o servidor Solr na porta padrão 8393. Para verificar isso, abra o link

em seus navegadores. O servidor Solr também pode ser iniciado em qualquer porta específica usando o seguinte comando

Assim que o servidor estiver ativo, precisamos criar um núcleo. Já que estamos interessados ​​em colocar a mão na massa, vamos criar um núcleo com todas as configurações padrão. Digite