Bug #871

RCP: 0.7, Under Windows, TXM does not work with accented paths

Ajouté par Matthieu Decorde il y a presque 5 ans. Mis à jour il y a plus de 2 ans.

Statut:New Début:18/06/2014
Priorité:Urgent Echéance:
Assigné à:- % réalisé:

80%

Catégorie:SearchEngine Temps passé: -
Version cible:TXM 0.7.8

Description

When using the search engine in 'memory mode', CQP cannot access corpora with paths composed of accented or special characters.

A) Document the problem: See (FR) https://groupes.renater.fr/wiki/txm-users/public/faq#sous_windows_txm_07_et_versions_ulterieures_aucune_requete_cql_ne_fonctionne_sur_aucun_corpus

B) Temporary Solution:
  • under Windows, check if the corpus directory path obeys current CQP character constraints (accented or special characters)
  • if not, ask the user to change the 'TXM User Home directory' preference to something compatible with the current CQP constraints
  • corpus directory path must be checked at installation and when the 'TXM User Home directory' preference is changed
  • TXM should not give the impression to the user that it works until the 'TXM User Home directory' complies with the current CQP constraints

C) Definitive Solution

Change CQP registry directory access code to comply with current operating systems pathnames constraints.

Solution

  • Replace FileSystem IO functions with glib FileSystem IO functions (fopen -> g_fopen, etc.)
  • change registry files encoding to UTF-8 : On Windows and Mac OS X the system encoding is no UTF-8 and these files contain the DATA path to the index files.

see changes : https://groupes.renater.fr/wiki/txm-info/specs_search_engine

Validation test

In a Windows TXM session:
  • if necessary, create an account with accented characters
  • if necessary, install TXM
  • run TXM (from C:/Program files/TXM/TXM.bat if installed with another user)
  • when selecting the VOEUX corpus, the corpus size must be shown in TXM status bar.

Historique

#1 Mis à jour par Serge Heiden il y a presque 5 ans

  • Sujet changé de With Windows, corpus queries don't work when the user home directory contains special characters à Under Windows, CQL queries don't work when the user home directory contains accented or special characters

#2 Mis à jour par Matthieu Decorde il y a presque 5 ans

  • Catégorie mis à SearchEngine

When using the memory mode of CQi, registry paths with accents (or special characters) are not well encoded and CQi fails to find the corpus registry files

#3 Mis à jour par Serge Heiden il y a plus de 4 ans

  • Sujet changé de Under Windows, CQL queries don't work when the user home directory contains accented or special characters à Under Windows, impossible to use search engine (CQL queries) when the user home directory contains accented or special characters
  • Description mis à jour (diff)

#4 Mis à jour par Serge Heiden il y a plus de 4 ans

  • Tracker changé de Support à Bug
  • Description mis à jour (diff)
  • Version cible changé de Known bugs à TXM 0.7.7

#5 Mis à jour par Serge Heiden il y a plus de 4 ans

  • Priorité changé de Normal à High

#6 Mis à jour par Matthieu Decorde il y a plus de 4 ans

  • Sujet changé de Under Windows, impossible to use search engine (CQL queries) when the user home directory contains accented or special characters à RCP: 0.7, Under Windows, impossible to use search engine with accented registry directory path
  • Description mis à jour (diff)
  • % réalisé changé de 0 à 60

#7 Mis à jour par Matthieu Decorde il y a plus de 4 ans

  • Sujet changé de RCP: 0.7, Under Windows, impossible to use search engine with accented registry directory path à RCP: 0.7, Under Windows, TXM does not work with accented paths

#8 Mis à jour par Matthieu Decorde il y a plus de 4 ans

  • Description mis à jour (diff)

#9 Mis à jour par Matthieu Decorde il y a plus de 3 ans

  • Priorité changé de High à Urgent
  • Version cible changé de TXM 0.7.7 à TXM 0.8.0a (split/restructuration)
  • % réalisé changé de 60 à 50

#10 Mis à jour par Matthieu Decorde il y a presque 3 ans

  • Description mis à jour (diff)
  • Version cible changé de TXM 0.8.0a (split/restructuration) à TXM 0.7.8
  • % réalisé changé de 50 à 80

#11 Mis à jour par Matthieu Decorde il y a plus de 2 ans

  • Description mis à jour (diff)

Formats disponibles : Atom PDF