/ - Diff - Plateforme TXM - Forge du Centre Blaise Pascal

Révision 2032

     def xpathProperties = new Properties()
     xpathProperties.load(IOUtils.getReader(xpathFile))
     // add default xpaths for measures
     for (def s : ["number of words", "number of coreference chains", "number of referring chains", "number of referring expressions"]) {
     	if (!xpathProperties.containsKey(s)) {
     		xpathProperties.put(s,"/tei:TEI/tei:teiHeader/tei:fileDesc/tei:extent/tei:measure[@unit=\"$s\"]/@quantity")
+    	}
+    }
     println "xpath properties: "+xpathProperties.keySet()
-...
     	println " compute measures..."
     	def data = new ComputeDemocratMeasureMetadata().getStats(corpus)
     	def data = new ComputeDemocratMeasureMetadata().getStats(corpus, xpathProperties)
     	Metadata2TEiHeader mthm = new Metadata2TEiHeader(debug);
     	for (def h : header) data[h] = csvReader.get(h)

     package org.txm.macro.urs.democrat
     import org.txm.searchengine.cqp.CQPSearchEngine
     import org.txm.searchengine.cqp.corpus.MainCorpus
     import org.txm.searchengine.cqp.corpus.StructuralUnit
     import org.txm.searchengine.cqp.corpus.query.CQLQuery
     import visuAnalec.donnees.Corpus
     import org.txm.annotation.urs.URSCorpora
     import org.txm.properties.core.functions.*
     class ComputeDemocratMeasureMetadata {
     	def getStats(MainCorpus corpus) {
     	def ignored = ["txmcorpus", "text", "body"]
     	def getStats(MainCorpus corpus, def xpathProperties) {
     		def data = [:]
     		data["number of words"] = corpus.query(new CQLQuery("[]"), "TMP", false).getNMatch();
-...
     		data["number of referring chains"] = refchaines.size()
     		data["number of referring expressions"] = analecCorpus.getUnites("MENTION").size()
     		// add default xpaths for measures
     		for (String s : ["number of words", "number of coreference chains", "number of referring chains", "number of referring expressions"]) {
     			if (!xpathProperties.containsKey(s)) {
     				xpathProperties.put(s,"/tei:TEI/tei:teiHeader/tei:fileDesc/tei:extent/tei:measure[@unit=\"$s\"]/@quantity")
+    			}
+    		}
     		// add structure measures
     		for (StructuralUnit su : corpus.getStructuralUnits()) {
     			if (!ignored.contains(su.getName())) {
     				String s = "structure "+su.getName()
     				data[s] = corpus.query(new CQLQuery("<"+su.getName()+">[]"), "TMP", false).getNMatch();
     				if (!xpathProperties.containsKey(s)) {
     					xpathProperties.put(s,"/tei:TEI/tei:teiHeader/tei:fileDesc/tei:extent/tei:measure[@unit=\"$s\"]/@quantity")
+    				}
+    			}
+    		}
     		return data
+    	}
+    }

Formats disponibles : Unified diff

Laboratoire ICAR » Plateforme TXM

Révision 2032