Quels sont les outils simlaires ?¶
Il existe une mulititude de solutions aujourd’hui, que nous pouvons classer en deux catégories :
les moteurs de recherche simple-composant
les moteurs de recherche multi-composants
La différence entre les deux peut se résumer ainsi : les multi-composants peuvent utiliser les moteurs simple-composant pour construire des systèmes plus complexes. Les multi-composants sont naturellement moins nombreux et beaucoup plus récents.
Un dernière remarque, d’après nos recherches, la plupart des moteurs simple sont basés sur la même technologie : Lucene. Ils diffèrent donc par leur implémentation et les features développées autour de cette brique fondamentale.
Certains moteurs intègrent de l’IA (on les qualifera de dense) tandis que d’autres ne font que de l’indexation (on les qualifera de clairsemé). La différence visible qui en découle, c’est une compréhension “profonde” de la syntaxe, comme les synonymes.
Voici donc une liste des principaux moteurs que nous avons identifiés.
1. simple-composant¶
Apache Solr
lien
clairsemé
open-source
blazing-fast, open source enterprise search platformElasticsearch
lien
clairsemé (mais la nouvelle version semble aller vers le dense)
open-source
integration possible
Most popular for enterprise after SolrMeiliSearch
lien
clairsemé
open-source
Next generation search API. blazingly fast and hyper relevant search-engine that will improve your search experience.Algolia
lien
dense (AI search) + clairsemé (search API)
pas open-source
connu pour simplifier le travail des développeurs
Tarifs: 1.5$ pour 1,000 requests & INDEX up to 1,000 recordsAWS Kendra
lien
clairsemé et dense (y compris QA)
pas open-source
Tarifs: 5000€/mois pour 40k requests/jour et 500k documents.Coveo
lien
dense ?
pas open-source
Avantage: integrations a d’autre source de contenus des entreprises comme Salesforce…
Tarifs: 1100$/mois pour 100k requestsGoogle Cloud Search
lien
pas open-source
pour de la recherche dans la galaxie google uniquement Gmail and Drive to Docs, Sheets, Slides, Calendar, and more
il existe aussi ces solutions que je n’ai pas integré.
2. multi-composants¶
Haystack