Bug #878

TBX: X.X, English apostrophe tokenization rules

Ajouté par Matthieu Decorde il y a plus de 11 ans. Mis à jour il y a plus de 4 ans.

Statut:Closed Début:19/06/2014
Priorité:Normal Echéance:
Assigné à:- % réalisé:

100%

Catégorie:Import Temps passé: -
Version cible:TXM 0.7.7

Description

The current apostrophe tokenization rules fail to segment correctly English words such as "he's", "it's", etc.

Historique

#1 Mis à jour par Serge Heiden il y a plus de 11 ans

  • Sujet changé de TBX: X.X, english apostrophe tokenize rules à TBX: X.X, English apostrophe tokenization rules
  • Description mis à jour (diff)

#2 Mis à jour par Matthieu Decorde il y a plus de 10 ans

  • Version cible changé de TXM 0.X.X à TXM 0.7.7

#3 Mis à jour par Matthieu Decorde il y a plus de 10 ans

  • % réalisé changé de 0 à 70

#4 Mis à jour par Matthieu Decorde il y a plus de 4 ans

  • Statut changé de New à Closed
  • % réalisé changé de 70 à 100

the english tokenisation rules have been set in the TokenizerClasses class

Formats disponibles : Atom PDF