Rapport de recherche sur l'état de la recherche sur site dans l'enseignement supérieur avec The Chronicle of Higher Education | Télécharger le rapport
La solution SearchStax Site Search offre aux spécialistes du marketing l'agilité dont ils ont besoin pour optimiser les résultats du site Web.
Présentation du produitSearchStax Managed Search décharge la gestion de Solr, offrant aux équipes informatiques une agilité opérationnelle accrue.
Présentation du produit18 février 2024
Dipsy Kapoor
|
Recherche gérée SearchStax est une solution Solr-as-a-Service gérée qui facilite la configuration, la gestion et la maintenance Apache SolrSolr est une plate-forme de recherche d'entreprise open source du projet Apache Lucene qui est écrite en Java.
Un problème avec les applications Java est qu'elles rencontrent parfois des erreurs de mémoire insuffisante, un problème courant également avec les déploiements Solr. Lorsque Solr est à court de mémoire, nous nous attendons intuitivement à ce que l'index est trop grand ou l'application est accablé par un taux d’indexation très élevé. Bien que ces problèmes soient courants, ils ne constituent peut-être pas les véritables ou les seules raisons.
Ci-dessous, nous examinons comment vous pouvez reconnaître un problème de manque de mémoire Solr (OOM) et explorons les quatre principales raisons pour lesquelles votre déploiement Solr peut générer une exception OOM et ce que vous pouvez faire pour résoudre les erreurs.
Votre serveur s'est arrêté de manière inattendue. Était-ce un erreur de mémoire insuffisante?
Si vous utilisez SearchStax Managed Search, vous pouvez ouvrir l'écran de surveillance et consulter le graphique de la mémoire du tas. Si la mémoire a atteint le sommet du graphique puis s'est plantée, il s'agit probablement d'une situation de manque de mémoire.
La liste des fichiers journaux affichera un journal catastrophique. Le nom du fichier inclut l'horodatage du plantage. Notez que la liste des fichiers dans SearchStax Managed Search n'est mise à jour qu'une fois par heure ; le journal peut donc ne pas apparaître immédiatement.
Les requêtes demandant un grand nombre de lignes peuvent faire manquer de mémoire au système.
Lors de l'analyse des problèmes de performances dans les déploiements clients, nous constatons souvent que les requêtes demandent plus d'un million de lignes ! Bien que Solr ne renvoie pas nécessairement autant de documents, il alloue en interne de la mémoire pour le nombre de résultats demandés par la requête.
Vous devez configurer votre application pour qu'elle ne demande que le nombre de lignes affichées dans les résultats de recherche. Même avec le facettage, une demande portant sur seulement 10 ou 20 lignes calculera les facettes sur l'ensemble des résultats.
Les requêtes commençant par un grand nombre de pages utilisent des quantités de mémoire inattendues. Un problème de performance similaire se produit lorsque les requêtes effectuent une pagination profonde en utilisant un grand nombre de pages. commencer paramètre. Solr doit récupérer tous les résultats jusqu'à la valeur du commencer paramètre, ce qui entraîne une utilisation importante de la mémoire.
Si votre application ne peut pas être restructurée pour éviter une pagination trop poussée, vous pouvez utiliser des « Curseurs » pour obtenir des résultats plus volumineux. Pour en savoir plus, consultez la page Documentation sur la pagination Solr.
Les requêtes de facettage, de tri et de regroupement utilisent beaucoup de mémoire, surtout si elles sont effectuées sur des champs qui ne sont pas docValuesEn général, les requêtes de facettage, de tri et de regroupement sont coûteuses et nécessitent une utilisation élevée de la mémoire. docValues=true dans la définition du champ de schéma, les exigences du tas Java sont réduites en mappant les données du champ en mémoire.
Si vous rencontrez des problèmes de mémoire insuffisante, vous devez examiner les champs utilisés pour le facettage, le regroupement et le tri, et vous assurer que leur schéma définit docValues=true.
(Remarque : si vous modifiez un docValues (paramètre dans le schéma, vous devrez réindexer votre contenu.)
La mise en cache rend Solr rapide et fiable en échangeant vitesse et mémoire. Des caches volumineux peuvent être l'une des causes de vos problèmes de mémoire insuffisante.
Il existe différents types de caches configurés dans solrconfig.xml :
Les paramètres de chaque cache définissent sa taille initiale, sa taille maximale et sa comptage automatique de la chaleur – qui correspond au nombre d’éléments copiés d’un ancien moteur de recherche vers le nouveau.
En consultant les plugins et les statistiques du tableau de bord Solr, vous pouvez vérifier le taux de réussite des caches pour voir s'ils sont utilisés. Si le taux de réussite est trop faible, les caches ne sont pas réellement utilisés. Vous pouvez réduire la taille des caches pour réduire l'empreinte mémoire.
De plus, si le nombre d'évictions est trop important, il est probable que les entrées en cache soient supprimées sans être utilisées. Il serait peut-être judicieux de réduire la taille du cache pour éviter les problèmes de mémoire insuffisante.
Notez également que ces caches sont gérés par cœur/collection. Les besoins en mémoire seront multipliés par le nombre de collections. Si votre application utilise un grand nombre de collections, l'impact mémoire de la mise en cache sera amplifié.
Si vous utilisez SearchStax Managed Search pour héberger vos déploiements Solr et avez besoin de plus de mémoire, voyez comment vous pouvez mettez à niveau votre déploiement SearchStax.
Confiez-nous la gestion des aspects techniques de votre infrastructure Solr. Vous n'êtes pas seul pour mettre en œuvre ces bonnes pratiques. Discutez avec l'un de nos experts Solr pour découvrir comment nous pouvons vous simplifier la tâche.
Recherche gérée SearchStax est une solution SaaS entièrement gérée qui automatise, gère, maintient et fait évoluer l'infrastructure de recherche Solr dans des clouds publics ou privés. Nous prenons en charge Solr et veillons à ce que vous disposiez d'une configuration fiable, sécurisée et conforme, afin que vous puissiez vous concentrer sur des tâches à plus forte valeur ajoutée.
Planifier une démo ou démarrer un essai gratuit pour voir comment SearchStax Managed Search peut faciliter la gestion et la maintenance de Solr.
The Stack est livré tous les deux mois avec des tendances du secteur, des informations, des produits et plus encore