Bug #2760

Specificity, scores are all between -1 and 1

Added by Matthieu Decorde 5 months ago. Updated 5 months ago.

Status:New Start date:02/03/2020
Priority:Normal Due date:
Assignee:- % Done:

0%

Category:- Spent time: -
Target version:-

Description

Mail #1 BP, 02/05/2019, FR:

Je viens de découvrir que la Table lexicale semble buggée en 0.7.9, mais que cela semble corrigé en 0.8.

Il s'agit de la table lexicale directement calculée sur une partition :
- observer déjà, avant tout tri, les mots : on lit quasiment le début du corpus ;
- trier les lignes par F *croissant* et comparer avec le résultat d'un index [] Vmax=200 sur la même partition : dans la TL les plus basses fréquences sont au niveau du seuil (2, 3, 4... si on a laissé le seuil Fmin de 2 par défaut) alors que dans l'INDEX on ne descend évidemment pas si bas au 200e rang. 

Mail #2 JM, 31/01/2020, FR:

Suite à un échange sur la liste txm-users, je vous écris au sujet d'une question sur le calcul de spécificités que me propose TXM (version 0.7.9, sous linux ubuntu 18.04). Les scores se situent exclusivement entre -1 et 1, ce qui n'est pas le cas dans les exemples du manuel d'utilisateurs. De plus, une grande partie des scores sont à -1 et 1, ce qui rend les spécificités très peu lisibles.

steps to reproduce

- load the corpus
- create the partition
- create the lexical table
- create the specificity

Hypothesis

Solution

History

#1 Updated by Serge Heiden 5 months ago

  • Description updated (diff)

Also available in: Atom PDF