Feature #3005

Import, new typographic class to manage french "tirets"

Added by Matthieu Decorde over 1 year ago. Updated 12 months ago.

Status:New Start date:01/22/2021
Priority:Normal Due date:
Assignee:- % Done:

0%

Category:Import Spent time: -
Target version:TXM 0.8.3

Description

est-ce -> ect + ce
est-il -> est + il
avez-vous -> avec + vous
peut-on -> peut + on
semble-t-il -> semble + il
allez-y -> allez + y
excusez-moi -> excusez + moi
mois-ci -> mois + ci
moment-là -> moment + là
moi-même -> moi + même
nous-mêmes -> nous + même
jour-même -> jour + même

note : what TreeTagger tokenizer does with the "tirets"

Solution

Find extensive or intentional linguistic classes&rules

History

#1 Updated by Matthieu Decorde over 1 year ago

  • Description updated (diff)

#2 Updated by Matthieu Decorde 12 months ago

  • Target version changed from TXM 0.8.2 to TXM 0.8.3

Also available in: Atom PDF