Bug #2760

Specificity, scores are all between -1 and 1

Ajouté par Matthieu Decorde il y a plus de 5 ans. Mis à jour il y a plus de 5 ans.

Statut:New Début:03/02/2020
Priorité:Normal Echéance:
Assigné à:- % réalisé:

0%

Catégorie:- Temps passé: -
Version cible:-

Description

Mail #1 BP, 02/05/2019, FR:

Je viens de découvrir que la Table lexicale semble buggée en 0.7.9, mais que cela semble corrigé en 0.8.

Il s'agit de la table lexicale directement calculée sur une partition :
- observer déjà, avant tout tri, les mots : on lit quasiment le début du corpus ;
- trier les lignes par F *croissant* et comparer avec le résultat d'un index [] Vmax=200 sur la même partition : dans la TL les plus basses fréquences sont au niveau du seuil (2, 3, 4... si on a laissé le seuil Fmin de 2 par défaut) alors que dans l'INDEX on ne descend évidemment pas si bas au 200e rang. 

Mail #2 JM, 31/01/2020, FR:

Suite à un échange sur la liste txm-users, je vous écris au sujet d'une question sur le calcul de spécificités que me propose TXM (version 0.7.9, sous linux ubuntu 18.04). Les scores se situent exclusivement entre -1 et 1, ce qui n'est pas le cas dans les exemples du manuel d'utilisateurs. De plus, une grande partie des scores sont à -1 et 1, ce qui rend les spécificités très peu lisibles.

steps to reproduce

- load the corpus
- create the partition
- create the lexical table
- create the specificity

Hypothesis

Solution

Historique

#1 Mis à jour par Serge Heiden il y a plus de 5 ans

  • Description mis à jour (diff)

Formats disponibles : Atom PDF