Bug #2413

RCP: 0.8.0, Sending edition text selection to concordance doesn't work if the selection contains punctuation marks

Ajouté par Sebastien Jacquot il y a plus de 7 ans. Mis à jour il y a plus d'un an.

Statut:Feedback Début:15/06/2018
Priorité:Normal Echéance:
Assigné à:- % réalisé:

80%

Catégorie:UI / Link / Command Temps passé: -
Version cible:TXM 0.8.4

Description

Sending edition text selection to concordance doesn't work if the selection contains punctuation.

There's also a problem with "spaces" that can lead to this kind of query {"donc" ""} that does nothing in concordance.

May need to fix "more" the query to extract the punctuation chars.

New location after split:
/org.txm.edition.rcp/src/org/txm/edition/rcp/handlers/SendEditionTo.java

Solution

SLH: edition text characters selection should really be edition text words selection, that is the internal CQP tokens matching the surface 'browser text characters selection' representing the CQP tokens word forms.

So it is more a matter of matching and selecting the correct word tokens under the surface than cleaning selected characters.

See the URS Annotation extension code to see how to select the token IDs under the browser characters selection, and how to extend the character selection to the characters corresponding to the real graphical form boundaries of the words.

Solution 2

  1. define the wanted behavior for multiple words/token selection
    1. sequential or not sequential query? -> SLH: always sequential. If the characters sequence denotes a sequence of words, the query must search for a sequence of words.
  2. fix the query according to the above choice, eg. [word = "domaines"][word = "politiques"] or [word = "domaines"]|[word = "politique"]

NOTE: sequential queries behavior is different according to current CQP matching strategy, by default concordance doesn't build the pivot with all te sequence

Historique

#1 Mis à jour par Sebastien Jacquot il y a plus de 7 ans

  • Description mis à jour (diff)

#2 Mis à jour par Sebastien Jacquot il y a plus de 7 ans

  • Version cible changé de TXM 0.8.0a (split/restructuration) à TXM 0.8.0

#3 Mis à jour par Sebastien Jacquot il y a presque 7 ans

  • Description mis à jour (diff)
  • Version cible changé de TXM 0.8.0 à TXM 0.8.2

#4 Mis à jour par Serge Heiden il y a presque 7 ans

  • Description mis à jour (diff)

#5 Mis à jour par Matthieu Decorde il y a plus de 5 ans

  • % réalisé changé de 0 à 80

fixed by #2295

#6 Mis à jour par Matthieu Decorde il y a plus de 5 ans

  • Sujet changé de Sending edition text selection to concordance doesn't work if the selection contains punctuation marks à RCP: 0.8.0, Sending edition text selection to concordance doesn't work if the selection contains punctuation marks

#7 Mis à jour par Sebastien Jacquot il y a plus de 5 ans

  • Statut changé de New à Feedback

#8 Mis à jour par Sebastien Jacquot il y a plus de 5 ans

  • Version cible changé de TXM 0.8.2 à TXM 0.8.1

#9 Mis à jour par Sebastien Jacquot il y a plus d'un an

  • Version cible changé de TXM 0.8.1 à TXM 0.8.4

Formats disponibles : Atom PDF