Feature #870
TBX: X.X, Add texts start positions to the R object produced by the Corpus SendToR command
Statut: | Closed | Début: | 18/06/2014 | |
---|---|---|---|---|
Priorité: | Normal | Echéance: | ||
Assigné à: | - | % réalisé: | 100% |
|
Catégorie: | Stats / R | Temps passé: | - | |
Version cible: | TXM 0.7.7 |
Description
We can add 'text' structure start-end positions to the R object (Dataframe) created.
Solution¶
- add a 'struct' vector of structure vectors OK
- add a vector per text structure in the 'struct vector of name 'text' OK
- add a 'lex' vector of lexicons (lexicons must loose their 'lex' string in their name) OK
- each vector element is a vector of [start, end] Integer positions OK the start positions are in
$structs$text$start
and the end position in$struct$text$end
- position values start at 0 for the first word of a corpus and a sub-corpus OK for subcorpus with no hole. For non-contiguous sub-corpus see #1048
Other structures can be transfered later see ticket #1031
Validation test¶
- start TXM
- select DISCOURS corpus
- call SendToR command
- the R command displays the 2 "start" and "end" lists:
print(Corpus1$struct$text)
MD: *OK Linux64 and Mac OS X
Historique
#1 Mis à jour par Serge Heiden il y a plus de 11 ans
- Sujet changé de TBX: X.X, Add corpus structure start-end positions to the result of the SendToR command à TBX: X.X, Add texts (or other structures) start-end positions to the R object produced by the Corpus SendToR command
- Description mis à jour (diff)
#2 Mis à jour par Matthieu Decorde il y a environ 11 ans
- Description mis à jour (diff)
#3 Mis à jour par Matthieu Decorde il y a environ 11 ans
- Sujet changé de TBX: X.X, Add texts (or other structures) start-end positions to the R object produced by the Corpus SendToR command à TBX: X.X, Add texts start positions to the R object produced by the Corpus SendToR command
- Description mis à jour (diff)
- % réalisé changé de 0 à 70
#4 Mis à jour par Matthieu Decorde il y a environ 11 ans
- Catégorie mis à Stats / R
#5 Mis à jour par Matthieu Decorde il y a presque 11 ans
- Description mis à jour (diff)
#6 Mis à jour par Matthieu Decorde il y a presque 11 ans
- Version cible changé de TXM 0.7.7 à TXM 0.7.6
#7 Mis à jour par Matthieu Decorde il y a presque 11 ans
- Description mis à jour (diff)
- % réalisé changé de 70 à 80
#8 Mis à jour par Matthieu Decorde il y a presque 11 ans
- Description mis à jour (diff)
#9 Mis à jour par Matthieu Decorde il y a presque 11 ans
- Description mis à jour (diff)
#10 Mis à jour par Matthieu Decorde il y a presque 11 ans
- % réalisé changé de 80 à 70
#11 Mis à jour par Matthieu Decorde il y a presque 11 ans
- Description mis à jour (diff)
- % réalisé changé de 70 à 80
#12 Mis à jour par Sebastien Jacquot il y a presque 11 ans
- Version cible changé de TXM 0.7.6 à TXM 0.7.7
#13 Mis à jour par Matthieu Decorde il y a presque 11 ans
- Statut changé de New à Feedback
#14 Mis à jour par Matthieu Decorde il y a presque 11 ans
- Description mis à jour (diff)
#15 Mis à jour par Matthieu Decorde il y a plus de 10 ans
- Description mis à jour (diff)
- % réalisé changé de 80 à 90
#16 Mis à jour par Sebastien Jacquot il y a plus de 10 ans
I didn't understand the validation test last step, at least here is the log when doing the first steps:
Reval : Corpus1 <- matrix(ncol=7, nrow=105191) INT_VECTOR_ADDED_TO_WORKSPACE[Ljava.lang.Object;@26109640 Reval : Corpus1[,1] <- tmp INT_VECTOR_ADDED_TO_WORKSPACE[Ljava.lang.Object;@3629ba4a Reval : Corpus1[,2] <- tmp INT_VECTOR_ADDED_TO_WORKSPACE[Ljava.lang.Object;@5ad49518 Reval : Corpus1[,3] <- tmp INT_VECTOR_ADDED_TO_WORKSPACE[Ljava.lang.Object;@3a88893e Reval : Corpus1[,4] <- tmp INT_VECTOR_ADDED_TO_WORKSPACE[Ljava.lang.Object;@59ea6377 Reval : Corpus1[,5] <- tmp INT_VECTOR_ADDED_TO_WORKSPACE[Ljava.lang.Object;@2b2847bf Reval : Corpus1[,6] <- tmp INT_VECTOR_ADDED_TO_WORKSPACE[Ljava.lang.Object;@617e62bb Reval : Corpus1[,7] <- tmp CHAR_VECTOR_ADDED_TO_WORKSPACE[Ljava.lang.Object;@308414fe Reval : colnames(Corpus1) <- tmpcol Reval : Corpus1 <- list(data=Corpus1) LexiqueDISCOURS Lexique du sous-corpus {0} calculé en {1} msDISCOURS dans42 CHAR_VECTOR_ADDED_TO_WORKSPACE[Ljava.lang.Object;@2f7e4894 Reval : Corpus1$lex$word <- tmp LexiqueDISCOURS Lexique du sous-corpus {0} calculé en {1} msDISCOURS dans23 CHAR_VECTOR_ADDED_TO_WORKSPACE[Ljava.lang.Object;@bcf04e8 Reval : Corpus1$lex$id <- tmp LexiqueDISCOURS Lexique du sous-corpus {0} calculé en {1} msDISCOURS dans19 CHAR_VECTOR_ADDED_TO_WORKSPACE[Ljava.lang.Object;@444b2166 Reval : Corpus1$lex$sid <- tmp LexiqueDISCOURS Lexique du sous-corpus {0} calculé en {1} msDISCOURS dans0 CHAR_VECTOR_ADDED_TO_WORKSPACE[Ljava.lang.Object;@207dd291 Reval : Corpus1$lex$pid <- tmp LexiqueDISCOURS Lexique du sous-corpus {0} calculé en {1} msDISCOURS dans15 CHAR_VECTOR_ADDED_TO_WORKSPACE[Ljava.lang.Object;@248b3e41 Reval : Corpus1$lex$pos <- tmp LexiqueDISCOURS Lexique du sous-corpus {0} calculé en {1} msDISCOURS dans15 CHAR_VECTOR_ADDED_TO_WORKSPACE[Ljava.lang.Object;@31a43025 Reval : Corpus1$lex$func <- tmp LexiqueDISCOURS Lexique du sous-corpus {0} calculé en {1} msDISCOURS dans32 CHAR_VECTOR_ADDED_TO_WORKSPACE[Ljava.lang.Object;@1254e699 Reval : Corpus1$lex$lemma <- tmp INT_VECTOR_ADDED_TO_WORKSPACE[Ljava.lang.Object;@5a1f3ec6 Reval : Corpus1$structs$text$start <- text_limits INT_VECTOR_ADDED_TO_WORKSPACE[Ljava.lang.Object;@39526763 Reval : Corpus1$structs$text$end <- text_limits DISCOURS >> Corpus1
#17 Mis à jour par Matthieu Decorde il y a plus de 4 ans
- % réalisé changé de 90 à 100
#18 Mis à jour par Matthieu Decorde il y a plus de 4 ans
- Statut changé de Feedback à Closed