Bug #2760
Mis à jour par Serge Heiden il y a plus de 5 ans
Mail #1 BP, 02/05/2019, FR:
<pre>
Je viens de découvrir que la Table lexicale semble buggée en 0.7.9, mais que cela semble corrigé en 0.8.
Il s'agit de la table lexicale directement calculée sur une partition :
- observer déjà, avant tout tri, les mots : on lit quasiment le début du corpus ;
- trier les lignes par F *croissant* et comparer avec le résultat d'un index [] Vmax=200 sur la même partition : dans la TL les plus basses fréquences sont au niveau du seuil (2, 3, 4... si on a laissé le seuil Fmin de 2 par défaut) alors que dans l'INDEX on ne descend évidemment pas si bas au 200e rang.
</pre>
Mail #2 JM, 31/01/2020, FR:
<pre>
Suite à un échange sur la liste txm-users, je vous écris au sujet d'une question sur le calcul de spécificités que me propose TXM (version 0.7.9, sous linux ubuntu 18.04). Les scores se situent exclusivement entre -1 et 1, ce qui n'est pas le cas dans les exemples du manuel d'utilisateurs. De plus, une grande partie des scores sont à -1 et 1, ce qui rend les spécificités très peu lisibles.
</pre>
h3. steps to reproduce
- load the corpus
- create the partition
- create the lexical table
- create the specificity
h3. Hypothesis
h3. Solution
<pre>
Je viens de découvrir que la Table lexicale semble buggée en 0.7.9, mais que cela semble corrigé en 0.8.
Il s'agit de la table lexicale directement calculée sur une partition :
- observer déjà, avant tout tri, les mots : on lit quasiment le début du corpus ;
- trier les lignes par F *croissant* et comparer avec le résultat d'un index [] Vmax=200 sur la même partition : dans la TL les plus basses fréquences sont au niveau du seuil (2, 3, 4... si on a laissé le seuil Fmin de 2 par défaut) alors que dans l'INDEX on ne descend évidemment pas si bas au 200e rang.
</pre>
Mail #2 JM, 31/01/2020, FR:
<pre>
Suite à un échange sur la liste txm-users, je vous écris au sujet d'une question sur le calcul de spécificités que me propose TXM (version 0.7.9, sous linux ubuntu 18.04). Les scores se situent exclusivement entre -1 et 1, ce qui n'est pas le cas dans les exemples du manuel d'utilisateurs. De plus, une grande partie des scores sont à -1 et 1, ce qui rend les spécificités très peu lisibles.
</pre>
h3. steps to reproduce
- load the corpus
- create the partition
- create the lexical table
- create the specificity
h3. Hypothesis
h3. Solution