Task #2998
Mis à jour par Matthieu Decorde il y a plus de 4 ans
Transcriptions fixes:
* add the otherNonPrimaryLocutor parameter -> used to create the other turn of the primary locutor
* convert asterisked marks word sequences to 'other' turns ("*abc ... xyz*") with:
** example cases : <word>*start</word>, <word>*start-end*</word>, <word>before *start-end* after</word>
** @who=interviewee code OR other code
*** if the spk **does not** matches the primarySpeakerIdRegex parameter, then @who must be set with the primary speaker id
*** primary speaker id <- **first speaker ID** matching the primarySpeakerIdRegex regex
** @orig-who=<locutor of the original containing turn>
* -split tokens ending with punctuations ("abc,")- -> #3004
* XXX -> event ponctuel dont desc = XXX
* " -> "rapp1" & "rapp2" events
Fix-set the tokenizer to manage:
<pre>
réintroduire les règles que nous appliquons usuellement dans TXM, notamment les cas particuliers sur les apostrophes (aujourd'hui, quelqu'un...), et les tirets d'interrogations/exclamations (est-ce, est-il, avez-vous, peut-on, semble-t-il, allez-y, excusez-moi) ou autres (mois-ci, moment-là, moi-même, nous-mêmes, jour-même).
</pre>
h3. Solution
see macros projects/13nov/FixTranscriptions
* add the otherNonPrimaryLocutor parameter -> used to create the other turn of the primary locutor
* convert asterisked marks word sequences to 'other' turns ("*abc ... xyz*") with:
** example cases : <word>*start</word>, <word>*start-end*</word>, <word>before *start-end* after</word>
** @who=interviewee code OR other code
*** if the spk **does not** matches the primarySpeakerIdRegex parameter, then @who must be set with the primary speaker id
*** primary speaker id <- **first speaker ID** matching the primarySpeakerIdRegex regex
** @orig-who=<locutor of the original containing turn>
* -split tokens ending with punctuations ("abc,")- -> #3004
* XXX -> event ponctuel dont desc = XXX
* " -> "rapp1" & "rapp2" events
Fix-set the tokenizer to manage:
<pre>
réintroduire les règles que nous appliquons usuellement dans TXM, notamment les cas particuliers sur les apostrophes (aujourd'hui, quelqu'un...), et les tirets d'interrogations/exclamations (est-ce, est-il, avez-vous, peut-on, semble-t-il, allez-y, excusez-moi) ou autres (mois-ci, moment-là, moi-même, nous-mêmes, jour-même).
</pre>
h3. Solution
see macros projects/13nov/FixTranscriptions