Rapport de recherche sur l'état de la recherche sur site dans l'enseignement supérieur avec The Chronicle of Higher Education | Télécharger le rapport
Rapport de recherche sur l'état de la recherche sur site dans l'enseignement supérieur avec The Chronicle of Higher Education | Télécharger le rapport
Data Ingestion for SearchStax Studio

11 juillet 2024

Tom Humbarger

|

7 min de lecture

Si vous envisagez Recherche sur le site SearchStax Si vous avez récemment acheté une solution de recherche sur site, vous envisagez probablement l'ingestion de données. L'ingestion de données est souvent un élément clé du bon fonctionnement de la recherche sur site. Développer une approche rigoureuse de l'importation de données est essentiel, car elle a un impact direct sur la qualité et la pertinence des résultats de recherche.

Dans le contexte de la recherche sur site, l'ingestion de données consiste à importer et à charger des données provenant d'une ou plusieurs sources, puis à les rendre disponibles dans un format structuré, indexable et consultable par un moteur de recherche. Ces données peuvent inclure le contenu d'un site web, des informations sur un programme, des recherches, des documents, etc. L'ingestion de données implique également l'extraction répétée de données en temps réel ou par lots réguliers.

L'objectif de l'ingestion de données pour la recherche sur site est de garantir que le moteur de recherche peut récupérer rapidement et avec précision des informations pertinentes pour la requête de recherche d'un utilisateur et améliorer l'expérience utilisateur globale.

Intégration de données dans SearchStax Site Search

Avec SearchStax Site Search, l'ingestion de données consiste à insérer des données dans un index de recherche afin qu'elles soient accessibles via une requête de recherche sur un site web ou une application personnalisée. Cet article examine les différentes manières d'intégrer des données dans Site Search, identifie les sources et les types de données que nous prenons en charge et fournit des recommandations de bonnes pratiques.

Il existe trois manières principales de charger des données dans SearchStax Site Search :

  • Robot d'exploration SearchStax
  • Connecteurs CMS pour Sitecore et Drupal
  • Ingérer des API

SearchStax Crawler pour la recherche sur site

Robot de recherche de site SearchStax (Crawler) Facilite et accélère la prise en main de la recherche sur site. Crawler est compatible avec tous les systèmes de gestion de contenu (CMS) et plateformes d'expérience numérique (DXP).

Le robot d'indexation peut automatiquement découvrir et indexer le contenu de l'ensemble de votre site web sans aucune modification de code. Vous pouvez lancer votre recherche en quelques minutes grâce à l'extraction de champs personnalisés, à la configuration de la recherche et au réglage de la pertinence, le tout facilement accessible depuis le tableau de bord de recherche.

Comment fonctionne Crawler ?

Le robot d'exploration commence par une URL d'entrée ou une URL de plan de site. À partir de là, il découvre automatiquement les pages supplémentaires de votre site en recherchant les entrées de navigation, les liens et le plan de site pour chaque page. Une fois chaque page découverte et explorée, elle est indexée et prête à être utilisée pour la recherche.

SearchStax Site Search Crawler effectue une exploration quotidienne pour maintenir vos résultats de recherche à jour à mesure que votre contenu évolue au fil du temps.

Connecteurs CMS pour Sitecore et Drupal

Si vous utilisez Sitecore ou Drupal pour votre système de gestion de contenu CMS, SearchStax dispose de modules d'intégration qui automatisent le processus d'indexation des données et offrent l'avantage supplémentaire de mises à jour en temps réel de votre index de recherche à chaque ajout, modification ou suppression de contenu.

Intégration Sitecore

Le Connecteur de recherche de site SearchStax pour Sitecore est disponible pour les versions Sitecore de la version 9 à la version 10.3. Le connecteur s'intègre à Sitecore Indexing Manager et indexe automatiquement tous les éléments de contenu Sitecore dès sa configuration initiale. Pour plus d'informations, consultez le Documentation du produit Sitecore Connector.

Intégration Drupal

Le Connecteur de recherche de site SearchStax pour Drupal Suivi automatique de tous les résultats de recherche connus de l'API de recherche Drupal. Une fois le connecteur Drupal installé et configuré, il indexe automatiquement tout contenu nouveau ou mis à jour dans l'environnement Drupal. Ce module ajoute des fonctionnalités de recherche sans nécessiter de modifications importantes du site web Drupal. L'intégration Drupal a été développée par Thomas Seidl (singe ivre), le créateur et le mainteneur du API de recherche Drupal, et respecte toutes les directives du code open source Drupal. Des informations complémentaires sont disponibles dans le Documentation du produit Drupal Connector ou du Page du module Connecteur Drupal sur Drupal.org.

API d'ingestion SearchStax

Le API d'ingestion de données SearchStax est un service qui vous permet d'indexer et de rechercher des données structurées dans votre service de recherche SearchStax. L'API vous permet d'envoyer des données à votre service de recherche en temps réel, les rendant ainsi immédiatement consultables par les utilisateurs. Les clients peuvent également utiliser l'API d'ingestion SearchStax pour charger des documents dans leur application de recherche sur site. Sur la page Paramètres, le point de terminaison d'ingestion est le point de terminaison /update et utilise les identifiants de l'API de recherche en lecture-écriture.

Les API d'ingestion simplifient le processus d'ingestion de données en permettant à un client ou à un partenaire d'implémentation de créer un petit morceau de code pour extraire des données de n'importe quelle source et les transférer vers SearchStax Site Search. Vous pouvez indexer des documents JSON individuels, plusieurs documents JSON ou un fichier JSON contenant un tableau d'objets JSON. Vous pouvez également indexer des documents XML en envoyant une ou plusieurs balises. Pour plus d'informations sur l'utilisation des API d'ingestion, consultez le site Web SearchStax. trouvé dans la documentation du produit Site Search.

Sources et types de données pour la recherche sur le site SearchStax

Les principaux cas d'utilisation de SearchStax Site Search impliquent l'ajout de capacités de recherche à tout système de gestion de contenu tel que Sitecore, Drupal, Acquia, Adobe AEM, WordPress, Hubspot, Optimizely, Coremedia, Hannon Hill, Magnolia, Salesforce DXP, tout site Web HTML et applications personnalisées.

Si vous travaillez avec Sitecore ou Drupal, la plupart de nos clients utiliseront les connecteurs SearchStax pour ces solutions CMS. Pour les autres sources de contenu, vous utiliserez notre robot d'indexation ou demanderez aux développeurs d'utiliser les API d'ingestion pour indexer votre contenu.

En ce qui concerne le contenu, les types de données suivants peuvent être gérés par SearchStax Site Search : pages Web HTML, PDF, documents Word, feuilles de calcul Excel, fichiers Powerpoint, fichiers texte, format de texte enrichi (RTF) et fichiers de dessin Visio (VSD).

Recherche sur le site SearchStax permet aux spécialistes du marketing et aux développeurs de proposer une recherche de site puissante à grande échelle. Planifier une démonstration de produit avec nos experts en recherche pour voir comment la recherche peut améliorer l'expérience du visiteur et obtenir des informations exploitables pour optimiser rapidement l'expérience de recherche.

FAQ sur l'ingestion de données pour la recherche sur site

Qu'est-ce que Site Search Crawler ?

SearchStax Crawler est un outil d'exploration web conçu pour aider les propriétaires de sites web à indexer et à rechercher le contenu de leurs sites web ou applications web. Il analyse les pages d'un site web, en extrait le contenu et les métadonnées, puis les rend consultables via SearchStax Site Search. Les utilisateurs configurent les paramètres d'exploration selon leurs besoins spécifiques, notamment en définissant les champs à explorer et en spécifiant des exclusions. Il prend en charge divers types de fichiers, notamment les documents HTML, PDF et Microsoft Office.

Contacter SearchStax pour en savoir plus sur SearchStax Crawler et ses tarifs.

Est-ce que Crawler fonctionnera sur mon site ?

Crawler est conçu pour une exploration flexible sur différents CMS et formats de contenu. Il est capable de trouver et d'indexer le contenu de tout site web public. Il utilise les liens sur les pages et le plan de site XML de votre site pour trouver toutes les pages de votre domaine et peut également extraire des données de formats de fichiers courants tels que les PDF, PowerPoint, feuilles de calcul Excel, documents Word et autres formats de texte enrichi similaires.

Qu'est-ce que la recherche sur site ?

La recherche sur site désigne la fonctionnalité d'un site web qui permet aux utilisateurs de rechercher du contenu ou des informations spécifiques. Elle comprend généralement un champ de recherche et une page de résultats, qui peuvent afficher des pages, des documents, des produits ou d'autres contenus pertinents en fonction de la requête de l'utilisateur. La recherche sur site peut améliorer l'expérience utilisateur en aidant les visiteurs à trouver ce qu'ils cherchent rapidement et efficacement.

Recherche sur le site SearchStax est notre solution de recherche de site qui facilite la recherche puissante avec une expérience de premier ordre, des informations de recherche exploitables, des outils de marketing en libre-service et une mise en œuvre rapide pour accélérer les projets de transformation numérique.

Qu'est-ce que l'ingestion de données pour la recherche sur site ?

Dans le contexte de la recherche sur site, l'ingestion de données consiste à importer et à charger des données provenant d'une ou plusieurs sources, puis à les rendre disponibles dans un format structuré, indexable et consultable par un moteur de recherche. Ces données peuvent inclure : contenu du site Web, informations sur les produits, données sur le comportement des utilisateurs, documents et plus encore.

Qu'est-ce que l'API SearchStax Ingest ?

Le API d'ingestion de données SearchStax est un service qui vous permet d'indexer et de rechercher des données structurées dans votre moteur de recherche SearchStax. L'API vous permet d'envoyer des données à votre moteur de recherche en temps réel, les rendant ainsi immédiatement consultables par les utilisateurs.

Grâce à l'API d'ingestion de données SearchStax, vous pouvez créer, mettre à jour et supprimer des documents dans votre index de recherche. Vous pouvez également configurer des mappages personnalisés pour définir le mode d'indexation et de recherche de vos données. L'API prend en charge divers formats de données, notamment JSON, XML et CSV, et vous pouvez choisir d'envoyer les données à votre service de recherche par lots ou individuellement.

Grâce à l'API d'ingestion de données SearchStax, vous pouvez garantir que votre service de recherche est toujours à jour avec les données les plus récentes de votre application. Cela contribue à améliorer la pertinence des résultats de recherche et à offrir une meilleure expérience de recherche à vos utilisateurs.

Qu'est-ce que le connecteur Drupal SearchStax ?

Connecteur Drupal SearchStax est un module du système de gestion de contenu Drupal qui vous permet d'intégrer la fonctionnalité de recherche de votre site web au moteur de recherche SearchStax. Le module Drupal SearchStax vous permet de configurer et de personnaliser facilement l'expérience de recherche pour les utilisateurs de votre site web. Vous pouvez l'utiliser pour créer des formulaires de recherche personnalisés, configurer les paramètres de recherche et gérer les résultats. Le module offre plusieurs fonctionnalités avancées telles que la recherche à facettes, la saisie semi-automatique et les suggestions orthographiques.

Qu'est-ce que le connecteur SearchStax Sitecore ?

Le Connecteur SearchStax Sitecore est un module Sitecore que les développeurs Sitecore peuvent installer pour exploiter toutes les fonctionnalités de recherche offertes par SearchStax Studio pour les pages de recherche destinées aux utilisateurs. Le connecteur inclut un connecteur d'index Sitecore permettant d'indexer vos éléments Sitecore grâce au gestionnaire d'indexation intégré de Sitecore. Facile à installer et à intégrer à une solution Sitecore, le connecteur SearchStax Sitecore offre une interface conviviale pour configurer les options de recherche et gérer les index. Il prend également en charge le contenu multilingue pour les sites web destinés à un public international.

Par Tom Humbarger

Responsable principal des programmes de marketing

« …L'ingestion de données est souvent un défi majeur pour la mise en place et le fonctionnement de la recherche sur site, et le développement d'une approche solide de l'importation de données est essentiel… »

Vous aimerez peut-être aussi :

fr_CAFrançais du Canada