Rapport de recherche sur l'état de la recherche sur site dans l'enseignement supérieur avec The Chronicle of Higher Education | Télécharger le rapport
Rapport de recherche sur l'état de la recherche sur site dans l'enseignement supérieur avec The Chronicle of Higher Education | Télécharger le rapport
10 Best Practices for Taking Solr to Production

8 février 2023

Karan Jeet Singh

|

7 min de lecture

Suivre les meilleures pratiques Solr est essentiel lorsque vous déplacez votre Apache Solr Infrastructure, du développement à la production, que vous utilisiez Sitecore, AEM, Drupal ou votre propre application personnalisée. Il est très simple de installer Solr sur votre machine locale et chargez une collection ; cependant, lorsque vous commencez à vous préparer pour la production, vous découvrez à quel point cela peut être intimidant. 

Top 10 des meilleures pratiques Solr

Déplacer votre Apache Solr L'infrastructure, du développement à la production, est une étape cruciale, que vous utilisiez Sitecore, AEM, Drupal ou votre propre application personnalisée. C'est assez simple. installer Solr sur votre machine locale et chargez une collection ; cependant, lorsque vous commencez à vous préparer pour la production, vous découvrez à quel point cela peut être intimidant. 

Voici nos 10 meilleures pratiques Solr pour préparer votre système à la production que Solr n'imprime pas sur son « étiquette d'instructions ».

  1. Mettre en œuvre Zookeeper 
  2. Atteindre une haute disponibilité
  3. Suivez les protocoles de sécurité avec TLS
  4. Maintenir les restrictions d'accès
  5. Distribuer les requêtes avec un équilibreur de charge
  6. Déterminer quoi et quand enregistrer
  7. Surveillez la santé de votre déploiement Solr 
  8. Créer une stratégie de sauvegarde
  9. Déterminer quand étendre le stockage
  10. Restez informé des correctifs de vulnérabilité

1. Ne négligez pas votre gardien de zoo

Zookeeper est une application de gestion de configuration pré-packagée avec Solr. Elle fonctionne bien en environnement local, mais à mesure que le trafic ou le nombre de nœuds augmente, la version pré-packagée de Zookeeper ne parvient plus à fournir un support adéquat à votre cluster Solr.

Lorsque vous mettez votre Solr en production :

  • Zookeeper doit être installé séparément.
  • Modifiez les configurations Solr afin qu'il utilise ce Zookeeper distinct.
  • Vous devez avoir un Zookeeper par nœud Solr, sauf si vous en avez deux. Dans ce cas, vous devez avoir trois nœuds Zookeeper.

En faisant tout cela, vous vous assurez que tous les rouages internes de Solr peuvent continuer à fonctionner sans problème, même dans les conditions de trafic les plus intenses.

Vous pouvez en savoir plus sur les applications Zookeeper ici :

2. Construisez des mesures de protection contre les temps d'arrêt

Vous ne voulez jamais que votre système de production tombe en panne, c'est pourquoi il est si important que votre configuration Solr prenne en charge haute disponibilitéCela peut être fait en :

  • Déploiement de Solr sur plusieurs nœuds
  • Placer une réplique de chaque collection sur au moins 2 nœuds.

Cela garantira que même si l’un des nœuds tombe en panne, vous aurez toujours accès à toutes vos données.

Consultez ces ressources pour en savoir plus sur la protection de l’intégrité de votre système de production :

3. Suivez les protocoles de sécurité TLS

Lors de la configuration de votre environnement Solr de production, il est essentiel de respecter tous les protocoles de sécurité disponibles. Le premier est TLS (Transport Layer Security). Il assure un chiffrement de bout en bout entre Solr et votre application. Vous pouvez :

  • Mettez à jour vos configurations Solr et activez TLS, ou
  • Ajoutez une couche d’équilibreur de charge et activez TLS à cet endroit.

Vous devez également activer le cryptage du disque sur votre disque de données afin que toutes les données stockées par Solr soient cryptées.

Pour en savoir plus sur les protocoles de sécurité, vous pouvez consulter ces articles utiles :

4. Maintenir les restrictions d'accès de sécurité

Après avoir chiffré votre connexion à Solr, il est essentiel de restreindre tout accès indésirable. Solr vous permet d'activer l'authentification de base pour votre système et d'y ajouter plusieurs utilisateurs. Les utilisateurs peuvent avoir différents niveaux d'accès à Solr.

Un autre excellent moyen de sécuriser votre instance Solr est d'appliquer un filtrage IP à votre instance. Cela vous permet de restreindre l'accès à tous les ports, sauf ceux utilisés par Solr et Zookeeper. Cela vous permet également de contrôler le trafic entrant en autorisant l'accès uniquement à partir de plages IP/CIDR spécifiques. Donc :

  • Activer l'authentification de base pour Solr.
  • Ajoutez le filtrage IP/CIDR dans votre groupe de sécurité.

Pour en savoir plus sur l’accès sécurisé, lisez ces ressources utiles :

5. Distribuer les requêtes avec un équilibreur de charge

Un équilibreur de charge répartit les requêtes entrantes entre les nœuds Solr. Installer un équilibreur de charge sur votre cluster Solr vous permet d'obtenir une architecture véritablement distribuée et hautement disponible.

Certains clients utilisent une combinaison de SolrCloud et de Zookeeper pour accéder à Solr de manière distribuée. La bibliothèque cliente récupère les adresses IP des nœuds Solr auprès de Zookeeper, puis les interroge de manière aléatoire. Cette méthode est déconseillée, car elle n'est pas universellement prise en charge et nécessite un accès direct aux nœuds Solr. Un équilibreur de charge, en revanche, ajoute une couche de sécurité à votre cluster Solr et constitue un moyen universellement pris en charge d'accéder à votre cluster Solr de manière distribuée.

Voici quelques équilibreurs de charge que vous pouvez déployer :

  • Équilibreur de charge fourni par votre fournisseur de cloud
  • Nginx

Pour en savoir plus sur l’équilibrage de charge, lisez ces ressources utiles :

6. Déterminez ce qu'il faut enregistrer

La journalisation vous informe de l'état de Solr. Solr offre un contrôle très précis des niveaux de journalisation pour chaque composant. Il est essentiel de :

  • Parcourez cette liste complète pour déterminer quelles informations vous sont utiles.
  • Définissez le niveau de journalisation souhaité pour chaque composant.
  • Assurez-vous que les politiques de rotation des journaux sont définies conformément à vos besoins :
    • Faire tourner les journaux en fonction du temps
    • Faire pivoter les journaux en fonction de leur taille

 

Pour en savoir plus sur la configuration de la journalisation, consultez le Guide de référence d'Apache Solr pour la configuration de la journalisation

7. Surveillez régulièrement vos déploiements Solr

Il est essentiel de surveiller régulièrement et systématiquement tous les aspects de votre déploiement Solr. Une vision claire des indicateurs de santé du système, tels que la mémoire, la charge système moyenne et le tas JVM, vous permet d'éviter la surcharge du processeur et les erreurs de mémoire insuffisante. Les indicateurs au niveau de la collection, tels que les performances d'indexation, la latence de recherche et les erreurs survenant lors de la recherche et de l'indexation, sont utiles pour optimiser le comportement dynamique de votre système.

Vous pouvez le faire en :

  • Utilisation des métriques fournies par votre fournisseur de cloud
  • Disposer d’un ensemble d’API capables de lire et de signaler les statistiques du système. 

 

Les fournisseurs de solutions, tels que SearchStax, activent ces fonctionnalités prêtes à l'emploi et fournissent leurs Documentation de suivi pour que d'autres puissent découvrir ce à quoi ils peuvent s'attendre. Ces fonctionnalités sont essentielles à un déploiement fluide. SearchStax a également publié un article de blog présentant les quatre indicateurs critiques pour surveiller la santé de Solr.

8. Sauvegardez régulièrement les données Solr

Il est essentiel de protéger vos données Solr. Effectuez des sauvegardes régulières de vos données afin de pouvoir restaurer votre système rapidement et efficacement en cas de panne.

Il est important que vous :

  • Planifiez une sauvegarde au moins une fois par jour.
  • Stockez les sauvegardes dans un compte de stockage en dehors de votre déploiement.
  • Définissez une politique de conservation pour nettoyer les sauvegardes obsolètes.
  • Effectuez des vérifications de sauvegarde périodiques.

De plus, la sauvegarde d'un système multi-nœuds peut s'avérer complexe. Il faut monter un lecteur partagé sur tous les nœuds, puis déclencher les sauvegardes via l'API BACKUP.

Si vous souhaitez en savoir plus, lisez ces articles utiles.

9. Augmentez votre espace de stockage à mesure que vous grandissez

Il est difficile de prévoir la taille de votre collection Solr au début. Il est toujours conseillé de modifier le répertoire de données de votre déploiement Solr pour un périphérique de stockage dédié, extensible à mesure que vos données augmentent. Tous les principaux fournisseurs de cloud vous permettent d'ajouter un périphérique de stockage supplémentaire à votre instance. Sa taille pourra être augmentée ultérieurement si nécessaire.

  • Ajoutez un disque de données distinct à votre instance.
  • Modifiez le répertoire de données de Solr par défaut vers le disque ajouté.
  • Modifiez la taille du disque selon vos besoins.

10. Corrigez vos vulnérabilités

Un déploiement Solr typique repose sur un ou plusieurs serveurs accessibles via des adresses IP/URL et des ports. Les paramètres réseau peuvent parfois créer des vulnérabilités dans votre architecture. Il est important de surveiller les accès Internet et les exploits potentiels que vous pourriez provoquer. Par exemple, il suffit de modifier la taille de l'en-tête. jetty.xml pourrait conduire à un exploit DDoS potentiel.

Lorsque vous déployez Solr en production, veillez à ne mettre à jour que les paramètres indispensables. Il est recommandé d'effectuer régulièrement une analyse des vulnérabilités de vos serveurs afin de détecter d'éventuelles vulnérabilités spécifiques nécessitant une correction. De plus, il est conseillé de se tenir informé des dernières mises à jour. dernières vulnérabilités découvertes et surveillez les listes de diffusion Apache Solr. Une fois que vous avez découvert une vulnérabilité pour la version de Solr que vous utilisez, il est préférable d'appliquer le correctif rapidement.

Mettez en pratique les meilleures pratiques Solr

Connaître les meilleures pratiques est une chose, les mettre en pratique en est une autre. Si vous n'avez pas encore essayé de les mettre en œuvre dans le cadre de vos opérations quotidiennes d'infrastructure Solr, attendez-vous à de nombreuses itérations avant d'obtenir le résultat escompté. Cependant, vous pouvez raccourcir la courbe d'apprentissage en collaborant avec un partenaire, comme SearchStax, qui maîtrise déjà les défis que vous pourriez rencontrer. Vous obtiendrez ainsi une solution adaptée à vos besoins et pourrez vous concentrer sur l'amélioration d'autres aspects de vos opérations.

Suivez nos meilleures pratiques Solr… ou faites confiance à SearchStax pour gérer votre Solr à votre place.

Confiez-nous la gestion des aspects techniques de votre infrastructure Solr. Vous n'êtes pas seul pour mettre en œuvre ces bonnes pratiques. Discutez avec l'un de nos experts Solr pour découvrir comment nous pouvons vous simplifier la tâche. 

 

Recherche gérée SearchStax est une solution SaaS entièrement gérée qui automatise, gère, maintient et fait évoluer l'infrastructure de recherche Solr dans des clouds publics ou privés. Nous prenons en charge Solr et veillons à ce que vous disposiez d'une configuration fiable, sécurisée et conforme, afin que vous puissiez vous concentrer sur des tâches à plus forte valeur ajoutée.

Planifier une démo ou démarrer un essai gratuit aujourd'hui.

Par Karan Jeet Singh

Ingénieur en solutions

« …SearchStax a ajouté la prise en charge de Sitecore 10.4 à notre connecteur de recherche gérée SearchStax pour Sitecore… »

Vous aimerez peut-être aussi :

fr_CAFrançais du Canada