Task #2998
Mis à jour par Matthieu Decorde il y a plus de 4 ans
Transcriptions fixes:
* convert asterisked word sequences to turns ("*abc ... xyz*") with:
** @who=interviewee code OR other code
*** if the spk **does not** matches the prioritySpeakerIdRegex parameter, then @who must be set with the priority speaker id
**** priority speaker id <- using the file name and the prioritySpeakerIdRegex regex
** @orig-who=<locutor of the original containing turn>
* -split tokens ending with punctuations ("abc,")- -> #3004
* XXX -> event ponctuel dont desc = XXX
* " -> "rapp1" & "rapp2" events
Fix-set the tokenizer to manage:
<pre>
réintroduire les règles que nous appliquons usuellement dans TXM, notamment les cas particuliers sur les apostrophes (aujourd'hui, quelqu'un...), et les tirets d'interrogations/exclamations (est-ce, est-il, avez-vous, peut-on, semble-t-il, allez-y, excusez-moi) ou autres (mois-ci, moment-là, moi-même, nous-mêmes, jour-même).
</pre>
h3. Solution
see macros projects/13nov/FixTranscriptions
* convert asterisked word sequences to turns ("*abc ... xyz*") with:
** @who=interviewee code OR other code
*** if the spk **does not** matches the prioritySpeakerIdRegex parameter, then @who must be set with the priority speaker id
**** priority speaker id <- using the file name and the prioritySpeakerIdRegex regex
** @orig-who=<locutor of the original containing turn>
* -split tokens ending with punctuations ("abc,")- -> #3004
* XXX -> event ponctuel dont desc = XXX
* " -> "rapp1" & "rapp2" events
Fix-set the tokenizer to manage:
<pre>
réintroduire les règles que nous appliquons usuellement dans TXM, notamment les cas particuliers sur les apostrophes (aujourd'hui, quelqu'un...), et les tirets d'interrogations/exclamations (est-ce, est-il, avez-vous, peut-on, semble-t-il, allez-y, excusez-moi) ou autres (mois-ci, moment-là, moi-même, nous-mêmes, jour-même).
</pre>
h3. Solution
see macros projects/13nov/FixTranscriptions