Task #3386
Index, Conconcordance link, multiple selection of multiword expression
Status: | New | Start date: | 05/11/2023 | |
---|---|---|---|---|
Priority: | Normal | Due date: | ||
Assignee: | - | % Done: | 0% |
|
Category: | - | Spent time: | - | |
Target version: | - |
Description
EN
When an INDEX is computed on multiword patterns, and when several results are sent to a concordance view, then the query used is not correctly set.
Its structure is like this:
[set of possible first words] [set of possible second words] [set of possible third word] etc.
instead of like this:
first multiword expression OR second multiword expression OR third multiword expression etc.
FR
Le bug concerne le lien INDEX->CONCORDANCE lorsque
- la sélection porte sur plusieurs lignes,
- dont au moins une a plusieurs tokens.
La requête alors générée pour la CONCORDANCE fait un genre de factorisation qui ne convient pas car la requête n'est plus aussi précise que la sélection initiale.
Exemple : sur le corpus VOEUX, demander un INDEX en frlemma avec Fmin=8 de
[frpos="NOM"][frpos="ADJ"]
-> cela concerne 61 occurrences
Sélectionner toutes les lignes et envoyer vers la concordance :
au lieu que la requête soit de la forme
([frlemma="personne"] [frlemma="âgé"]) | ([frlemma="année"] [frlemma="nouveau"]) | etc.
la requête utilisée est "factorisée", de façon excessive :
[frlemma="personne|année|intérêt|partenaire|progrès|protection|service"] [frlemma="âgé|nouveau|particulier|social|social|social|public"]
Elle récolte 62 résultats : elle considère une occurrence de "intérêt public" qui n'était pas dans la sélection de l'INDEX.