Feature #3052

TXT Search engine

Ajouté par Matthieu Decorde il y a plus de 4 ans. Mis à jour il y a plus de 2 ans.

Statut:New Début:09/04/2021
Priorité:Normal Echéance:
Assigné à:- % réalisé:

40%

Catégorie:SearchEngine Temps passé: -
Version cible:TXM 0.8.4

Description

Add a TXT search engine with simple queries : https://groupes.renater.fr/wiki/txm-info/public/specs_dev_moteurs/txt

Documentation

Ce format de requête est destiné aux recherches simples qui ne requiert pas beaucoup d'apprentissage d'utilisation.

La requête sera systématiquement tokenisée selon les règles de la langue du corpus et assouplie pour sélectionner plus largement les mots pour produire une requête CQL.

Par exemple, la requête :

je n'ai pas faim.
donnera la requête CQL corrigée
"je"%cd "n'"%cd "ai"%cd "pas"%cd "faim"%cd "."%cd

Le joker * peut être utilisé :

 je * suis * là

donnera la requête CQL corrigée
"je"%cd []* "suis"%cd []* "là"%cd

Historique

#1 Mis à jour par Matthieu Decorde il y a plus de 4 ans

  • % réalisé changé de 0 à 70

works fine except for queries like "some*" are translated to CQL query = "some"%cd ".*" instead of "some.*"%cd

#2 Mis à jour par Matthieu Decorde il y a plus de 2 ans

  • Description mis à jour (diff)
  • Version cible changé de TXM 0.8.2 à TXM 0.8.4

Search Engine disabled since the CQP Search Engine is no tokenizing the query.

#3 Mis à jour par Matthieu Decorde il y a plus de 2 ans

  • Description mis à jour (diff)
  • % réalisé changé de 70 à 40

Formats disponibles : Atom PDF