Feature #3005
Import, new typographic class to manage french "tirets"
Status: | New | Start date: | 01/22/2021 | |
---|---|---|---|---|
Priority: | Normal | Due date: | ||
Assignee: | - | % Done: | 0% |
|
Category: | Import | Spent time: | - | |
Target version: | TXM 0.8.2 |
Description
est-ce -> ect + ce est-il -> est + il avez-vous -> avec + vous peut-on -> peut + on semble-t-il -> semble + il allez-y -> allez + y excusez-moi -> excusez + moi mois-ci -> mois + ci moment-là -> moment + là moi-même -> moi + même nous-mêmes -> nous + même jour-même -> jour + même
note : what TreeTagger tokenizer does with the "tirets"
Solution¶
Find extensive or intentional linguistic classes&rules
History
#1 Updated by Matthieu Decorde about 1 month ago
- Description updated (diff)