Task #2917
AFVOIXOFF, dash characters in words
Statut: | New | Début: | 12/10/2020 | |
---|---|---|---|---|
Priorité: | Normal | Echéance: | ||
Assigné à: | - | % réalisé: | 0% |
|
Catégorie: | Corpus | Temps passé: | - | |
Version cible: | TXM - Antract 3.0 |
Description
remove the "-" at the end of words.
Index of ".+-" [] gives :
eux- mêmes ... ex- dictateur ... mi- sur ... porte- data porte- avions ...
Such words are encoded in the TRS files with spaces eg. "porte- data", "ex- dictateur"
Solution¶
Fix the TRS files
Solution 2¶
implement tokenizing rules to merge the necessary tokens
Apply spell checker software on TRS files.
The spell checker must manage a dictionary of compound words, with '-' inside.
Historique
#1 Mis à jour par Matthieu Decorde il y a presque 5 ans
- Sujet changé de AFVOIXOFF, dot in words à AFVOIXOFF, dash characters in words
#2 Mis à jour par Matthieu Decorde il y a presque 5 ans
- Description mis à jour (diff)
#3 Mis à jour par Matthieu Decorde il y a presque 5 ans
- Description mis à jour (diff)
#4 Mis à jour par Matthieu Decorde il y a presque 5 ans
- Version cible changé de TXM 0.8.2 - Antract à TXM - Antract 3.0
#5 Mis à jour par Serge Heiden il y a presque 5 ans
- Description mis à jour (diff)