|
Le filtre de zone de l'outil de recherche
Verity extrait des zones et des champs dans des documents structurés
de sorte qu'ils puissent être parcourus. Napoleonica définit
au préalable les zones et les champs pouvant être extraits.
Qu'est-ce qu'une zone ?
Les zones de document sont des parties
précises auxquelles on peut limiter la recherche. Avec le filtre
de zone, l'outil de recherche Verity crée de l'information
de zone dans l'index de mots complets de la collection, ce qui permet
une recherche rapide et efficace dans les zones.
Vous pouvez effectuer des recherches dans
des zones pour deux types de documents précis :
Les documents en langage composé de marqueurs, dont le SGML,
comme les inventaires et
les données structurées et le HTML.
Le filtre de zone comprend un support intégré pour le langage
HTML.
Qu'est-ce qu'un champ ?
Les champs sont extraits du document
et sont stockés dans la collection pour la récupération
des documents et la recherche, et ils peuvent être retournés
dans une liste des résultats.
Une partie de texte doit d'abord être
définie comme une zone avant d'être définie comme
un champ. Certains champs peuvent être affichés mais sont
non recherchables, d'autres, en revanche, sont des champs de recherche
mais ne sont pas affichés.
|