Feature #3052

TXT Search engine

Added by Matthieu Decorde about 2 years ago. Updated about 1 month ago.

Status:New Start date:04/09/2021
Priority:Normal Due date:
Assignee:- % Done:

40%

Category:SearchEngine Spent time: -
Target version:TXM 0.8.4

Description

Add a TXT search engine with simple queries : https://groupes.renater.fr/wiki/txm-info/public/specs_dev_moteurs/txt

Documentation

Ce format de requête est destiné aux recherches simples qui ne requiert pas beaucoup d'apprentissage d'utilisation.

La requête sera systématiquement tokenisée selon les règles de la langue du corpus et assouplie pour sélectionner plus largement les mots pour produire une requête CQL.

Par exemple, la requête :

je n'ai pas faim.
donnera la requête CQL corrigée
"je"%cd "n'"%cd "ai"%cd "pas"%cd "faim"%cd "."%cd

Le joker * peut être utilisé :

 je * suis * là

donnera la requête CQL corrigée
"je"%cd []* "suis"%cd []* "là"%cd

History

#1 Updated by Matthieu Decorde about 2 years ago

  • % Done changed from 0 to 70

works fine except for queries like "some*" are translated to CQL query = "some"%cd ".*" instead of "some.*"%cd

#2 Updated by Matthieu Decorde about 1 month ago

  • Description updated (diff)
  • Target version changed from TXM 0.8.2 to TXM 0.8.4

Search Engine disabled since the CQP Search Engine is no tokenizing the query.

#3 Updated by Matthieu Decorde about 1 month ago

  • Description updated (diff)
  • % Done changed from 70 to 40

Also available in: Atom PDF