Statistics
| Revision:

root / tmp / org.txm.groovy.core / src / groovy / org / txm / scripts / prototypes / mesuresBP.groovy @ 1000

History | View | Annotate | Download (2.5 kB)

1
package org.txm.scripts.test;
2
import org.txm.functions.mesures.*;
3
import org.txm.searchengine.cqp.corpus.Corpus;
4
import org.txm.Toolbox
5
import org.txm.searchengine.cqp.corpus.*
6
import org.txm.searchengine.cqp.corpus.query.*
7

    
8
def corpus1 = CorpusManager.getCorpusManager().getCorpus("MESURES")
9

    
10
Mesures mesures = new Mesures([corpus1]);
11
// Taille en mot des textes
12
mesures.add(new Magnitude('<text> [] expand to text', "word", false, Synthese.SUM));
13
// Qurtiles des discours direct
14
mesures.add(new Magnitude('<q> [_.q_type="DD"] expand to q', "word", true, Synthese.QUARTILE));
15
// Quartiles des paragraphes (ici div1, j'ai pas de paragraphes -_-)
16
mesures.add(new Magnitude('<div1> [] expand to div1', "word", true, Synthese.QUARTILE));
17
// moyenne de la taille en mot des paragraphes
18
//mesures.add(new Magnitude('<p> [] expand to p', "word", true, Synthese.MOYENNE));
19

    
20
// proportion des ! et ? dans le discours direct
21
mesures.add(new Proportion('[_.q_type="DD"]', "word", true, Synthese.COUNTMATCHES, '[word=".*[.!?].*"]', ['[word=".*\\?*"]', '[word=".*!.*"]']));
22
// proportion de discours direct avec tiret ou guillemet
23
mesures.add(new Proportion(null, "word", true, Synthese.COUNTMATCHES, '[_.q_type="DD"] expand to q', ['[_.q_type="DD" & _.q_rend="tiret"] expand to q', '[_.q_type="DD" & _.q_rend="guillemet"] expand to q']));
24
// Proportion de discours direct avec incise de dire / verbe introducteur
25
mesures.add(new Proportion(null, "word", true, Synthese.COUNTMATCHES, '[_.q_type="DD"] expand to q', ['[_.q_type="DD" & _.seg_ana="incise_di"] expand to q', '[_.seg_ana="int_DD"] </seg> []{0,10} <q> [_.q_type="DD"]']));
26
//mesures.add(new Proportion('"j.*"%c expand to text', "word", true, Synthese.SUM, '"j.*" expand to text', ['"j.....*"%c expand to text', '"j........*"%c expand to text']));
27

    
28
// Taux de présence linéaire de ponctuation forte dans le DD
29
mesures.add(new PresenceRate('[_.q_type="DD"] expand to q', "word", true, Synthese.SUM, '[word=".*[;!?].*"]'));
30
// Taux de présence linéaire de DD
31
mesures.add(new PresenceRate(null, "word", true, Synthese.SUM, '[_.q_type="DD"]'));
32
// Taux de présence Linéaire de PR 
33
mesures.add(new PresenceRate(null, "word", true, Synthese.SUM, '<pr> [] expand to pr'));
34

    
35
// Diversité (en lemmes) des verbes introducteurs
36
mesures.add(new Diversity(null, "word", true, Synthese.SUM, '[_.seg_ana="int.*" & frpos="V.*"]', "frlemma"));
37
//mesures.add(new Diversity('[_.q_type="DD"] expand to q', "word", true, Synthese.SUM, '"j.*"', "frpos"));
38

    
39
mesures.prettyPrint();