Task #2917

AFVOIXOFF, dash characters in words

Ajouté par Matthieu Decorde il y a presque 5 ans. Mis à jour il y a presque 5 ans.

Statut:New Début:12/10/2020
Priorité:Normal Echéance:
Assigné à:- % réalisé:

0%

Catégorie:Corpus Temps passé: -
Version cible:TXM - Antract 3.0

Description

remove the "-" at the end of words.

Index of ".+-" [] gives :

eux-    mêmes
...
ex-    dictateur
...
mi-    sur
...
porte-    data
porte-    avions
...

Such words are encoded in the TRS files with spaces eg. "porte- data", "ex- dictateur"

Solution

Fix the TRS files

Solution 2

implement tokenizing rules to merge the necessary tokens

Apply spell checker software on TRS files.

The spell checker must manage a dictionary of compound words, with '-' inside.

Historique

#1 Mis à jour par Matthieu Decorde il y a presque 5 ans

  • Sujet changé de AFVOIXOFF, dot in words à AFVOIXOFF, dash characters in words

#2 Mis à jour par Matthieu Decorde il y a presque 5 ans

  • Description mis à jour (diff)

#3 Mis à jour par Matthieu Decorde il y a presque 5 ans

  • Description mis à jour (diff)

#4 Mis à jour par Matthieu Decorde il y a presque 5 ans

  • Version cible changé de TXM 0.8.2 - Antract à TXM - Antract 3.0

#5 Mis à jour par Serge Heiden il y a presque 5 ans

  • Description mis à jour (diff)

Formats disponibles : Atom PDF