/ - Diff - Plateforme TXM - Forge du Centre Blaise Pascal

Révision 2354

     import javax.xml.stream.*
     import org.txm.importer.ApplyXsl2
     import org.txm.metadatas.MetadataGroup
     import org.txm.metadatas.Metadatas
     import org.txm.utils.io.FileCopy;
-...
     		writer.writeAttribute("http-equiv", "Content-Type");
     		writer.writeAttribute("content", "text/html");
     		writer.writeAttribute("charset", "UTF-8");
     		writer.writeEndElement();
     		writer.writeEndElement(); // meta
     		writer.writeStartElement("head");
     		//<link rel="stylesheet" type="text/css" href="class.css" />
     		writer.writeStartElement("link");
     		writer.writeAttribute("rel", "stylesheet");
     		writer.writeAttribute("type", "text/css");
     		writer.writeAttribute("href", "transcriber.css");
     		writer.writeEndElement();
     		writer.writeEndElement();
     		writer.writeEndElement(); // link
     		writer.writeEndElement(); // head
     		nbBreak++
     		writer.writeStartElement("body");
-...
     					switch (localname) {
     						case "text":
     							writer.writeStartElement("h2");
     							writer.writeStartElement("h1");
     							writer.writeAttribute("class","title");
     							String title = parser.getAttributeValue(null, "title");
-...
     								writer.writeCharacters("Transcription "+txmfile.getName().substring(0, txmfile.getName().length() - 4));
+    							}
     							writer.writeEmptyElement("br");
     							writer.writeStartElement("a");
     							writer.writeAttribute("onclick", "txmcommand('id', 'org.txm.backtomedia.commands.function.BackToMedia', 'corpus', '"+corpusname+"', 'text', '"+txtname+"', 'time', '0.0')");
     							writer.writeAttribute("style", "cursor: pointer;")
     							writer.writeAttribute("class", "play-media")
     							writer.writeCharacters(" ♪♪");
     							writer.writeEndElement(); // a
     							writeMediaAccess("0.0")
     							writer.writeEndElement(); // h2
     							writer.writeEndElement(); // h1
     							String subtitle = parser.getAttributeValue(null, "subtitle");
     							if (subtitle != null && subtitle.length() > 0) {
     								writer.writeStartElement("h3");
     								writer.writeStartElement("h2");
     								writer.writeAttribute("class", "subtitle");
     								writer.writeCharacters(subtitle);
     								writer.writeEndElement(); // h3
     								writer.writeEndElement(); // h2
+    							}
     //							println "metadatas != null: "+(metadatas != null)
     //							if (metadatas != null) {
     								writer.writeStartElement("table");
     								boolean grey = false;
     								for (int i = 0 ; i < parser.getAttributeCount() ; i++) {
     									String name = parser.getAttributeName(i);
     									String value = parser.getAttributeValue(i);
     									if ("title" == name) {
     										continue; // ignore "title" metadata
+    									}
     									grey = !grey;
     									writer.writeStartElement("tr");
     									if (grey) {
     										writer.writeAttribute("style","background-color:lightgrey;")
+    									}
     									if (value != null) {
     										writer.writeStartElement("td");
     										writer.writeCharacters(name);
     										writer.writeEndElement();
     										writer.writeStartElement("td");
     										writer.writeCharacters(value);
     										writer.writeEndElement();
+    									}
     									//get enqueteur to style their names
     									if (name.startsWith("enq")) {
     										interviewers.add(value)
+    									}
     									writer.writeEndElement();
     							writer.writeStartElement("table");
     							writer.writeAttribute("class", "transcription-table");
     							boolean grey = false;
     							for (int i = 0 ; i < parser.getAttributeCount() ; i++) {
     								String name = parser.getAttributeName(i);
     								String value = parser.getAttributeValue(i);
     								if ("title" == name) {
     									continue; // ignore "title" metadata
+    								}
     								writer.writeEndElement();
     //							}
     								grey = !grey;
     								writer.writeStartElement("tr");
     								if (grey) {
     									writer.writeAttribute("style","background-color:lightgrey;")
+    								}
     								if (value != null) {
     									writer.writeStartElement("td");
     									writer.writeCharacters(name);
     									writer.writeEndElement(); // td
     									writer.writeStartElement("td");
     									writer.writeCharacters(value);
     									writer.writeEndElement(); // td
+    								}
     								//get enqueteur to style their names
     								if (name.startsWith("enq")) {
     									interviewers.add(value)
+    								}
     								writer.writeEndElement(); // tr
+    							}
     							writer.writeEndElement(); // table
     						//							}
     							break;
     						case "Topics":
     						/*writer.writeStartElement("h2");
-...
     							String type = parser.getAttributeValue(null, "type")
     							writer.writeAttribute("type", ""+type)
     							String desc = parser.getAttributeValue(null, "topic")
     							if (type != null || desc != null) {
     								writer.writeStartElement("h2");
     							if (type != null && type.length() > 0) {
     								writer.writeStartElement("h1");
     								writer.writeAttribute("class", "section-title")
     								if (type != null || type.length() == 0) {
     									writer.writeCharacters(type+": "+desc);
     								} else {
     									writer.writeCharacters(desc)
+    								}
     								writer.writeCharacters(type);
     								if (parser.getAttributeValue(null,"startTime") != null) {
     									writer.writeEmptyElement("br");
     									writer.writeStartElement("a")
     									writer.writeAttribute("onclick", "txmcommand('id', 'org.txm.backtomedia.commands.function.BackToMedia', 'corpus', '"+corpusname+"', 'text', '"+txtname+"', 'time', '"+parser.getAttributeValue(null,"startTime")+"')");
     									writer.writeAttribute("style", "cursor: pointer;")
     									writer.writeAttribute("class", "play-media")
     									writer.writeCharacters(" ♪♪")
     									writer.writeEndElement() // a
     									writeMediaAccess(parser.getAttributeValue(null,"startTime"))
+    								}
     								writer.writeEndElement(); // h1
+    							}
     							if (desc != null && desc.length() > 0) {
     								writer.writeStartElement("h2");
     								writer.writeAttribute("class", "section-desc")
     								writer.writeCharacters(desc)
     								writer.writeEndElement(); // h2
+    							}
     							String metadata = parser.getAttributeValue(null, "metadata")
     							if (metadata != null && metadata.length() > 0) { // the metadata to show
     								writer.writeStartElement("ul")
     								//println "metadata=$metadata"
     								for (def m : metadata.split("<li>")) {
     									writer.writeStartElement("li")
     									writer.writeCharacters(m)
     									writer.writeEndElement() // li
     							def metadata = new LinkedHashMap<String, String>() // temp to store attributes
     							def metadataGroups = ["metadata":[]] // default metadata group
     							def metadataDeclared = false
     							if (parser.getAttributeValue(null, "metadata") != null && parser.getAttributeValue(null, "metadata_groups") != null) {
     								def l1 = parser.getAttributeValue(null, "metadata").split("\\|");
     								def l2 = parser.getAttributeValue(null, "metadata_groups").split("\\|");
     								for (int i = 0 ; i < l1.size() ; i++) {
     									def m = l1[i]
     									def g = l2[i]
     									metadata[m] = "" // forcing order of metadata by pre-declaring
     									if (!metadataGroups.containsKey(g)) metadataGroups[g] = []
     									metadataGroups[g] << m // declaring a metadata type
+    								}
     								writer.writeEndElement() // ul
     							} else if (parser.getAttributeCount() > 1) { // process all attributes
     								writer.writeStartElement("ul")
     								for (int i = 0 ; i < parser.getAttributeCount() ; i++) {
     									String name = parser.getAttributeLocalName(i)
     									if (!"type".equals(name)
     									&& !"topic".equals(name)
     									&& !"startTime".equals(name)
     									&& !"endTime".equals(name)) {
     										writer.writeStartElement("li")
     										writer.writeCharacters(""+name+": "+parser.getAttributeValue(i))
     										writer.writeEndElement() // li
     								metadataDeclared = true
+    							}
     							for (int i = 0 ; i < parser.getAttributeCount() ; i++) {
     								String name = parser.getAttributeLocalName(i)
     								if (!"type".equals(name)
     								&& !"topic".equals(name)
     								&& !"startTime".equals(name)
     								&& !"endTime".equals(name)) {
     									if (metadataDeclared && !metadata.containsKey(name)) {
     										continue; // ignoring metadata since not in declared metadata
     									} else {
     										metadataGroups["metadata"] << name
+    									}
     									metadata[name] = parser.getAttributeValue(i)
+    								}
     								writer.writeEndElement(); // ul
+    							}
     							writer.writeStartElement("p")
     							writer.writeAttribute("class", "section-all-metadata");
     							for (String groupName : metadataGroups.keySet()) {
     								def group = metadataGroups[groupName]
     								if (group.size() > 0) {
     									if (groupName.equals("text")) {
     										writer.writeStartElement("p")
     										writer.writeAttribute("class", "section-"+groupName);
     										for (String k : group) {
     											writer.writeStartElement("p")
     											writer.writeAttribute("class", ""+groupName)
     											writer.writeStartElement("h4")
     											writer.writeCharacters(k)
     											writer.writeEndElement() // li
     											writer.writeCharacters(metadata[k])
     											writer.writeEndElement() // li
+    										}
     									} else {
     										writer.writeStartElement("ul")
     										writer.writeAttribute("class", "section-"+groupName);
     										for (String k : group) {
     											writer.writeStartElement("li")
     											writer.writeAttribute("class", ""+groupName)
     											writer.writeCharacters(""+k+": "+metadata[k])
     											writer.writeEndElement() // li
+    										}
+    									}
     									writer.writeEndElement(); // ul or p
+    								}
+    							}
     							writer.writeEndElement(); // p
     							break;
     						case "sp":
     							endBoldIfNeeded()
-...
+    					}
     					previousElem = localname;
     					break;
     				case XMLStreamConstants.END_ELEMENT:
     					localname = parser.getLocalName();
     					switch(localname)
+    					{
     					switch(localname) {
     						case "text":
     							break;
     						case "Topics":
-...
     					break;
+    			}
+    		}
     		writer.writeEndElement();
     		writer.writeEndElement(); // body
     		writer.writeEmptyElement("pb");
     		nbBreak++
     		writer.writeAttribute("id", ""+nbBreak);
     		writer.writeEndElement();
     		writer.writeEndElement(); // html
     		writer.close();
     		output.close();
     		if (parser != null) parser.close();
-...
     		writer.writeAttribute("class", "sync");
     		writer.writeCharacters(currentTime);
     		writeMediaAccess(currentTime)
     		writer.writeEndElement(); // span
+    	}
     	private void writeMediaAccess(def time) {
     		writer.writeStartElement("a");
     		writer.writeAttribute("onclick", "txmcommand('id', 'org.txm.backtomedia.commands.function.BackToMedia', 'corpus', '"+corpusname+"', 'text', '"+txtname+"', 'time', '"+currentTime+"')");
     		writer.writeAttribute("onclick", "txmcommand('id', 'org.txm.backtomedia.commands.function.BackToMedia', 'corpus', '"+corpusname+"', 'text', '"+txtname+"', 'time', '"+time+"')");
     		writer.writeAttribute("style", "cursor: pointer;")
     		writer.writeAttribute("class", "play-media")
     		writer.writeCharacters(" ???♪");
     		writer.writeCharacters(" ???");
     		writer.writeEndElement(); // a
     		writer.writeEndElement();
+    	}
     	private void writeSpeaker(String spk, boolean overlapping) {

     import java.nio.charset.Charset
     import org.txm.utils.AsciiUtils
     import org.txm.utils.ConsoleProgressBar
     import org.txm.utils.CsvReader
     import java.time.LocalTime
     import java.time.format.DateTimeFormatter
     import org.txm.utils.*
     File metadataFile = new File("/home/mdecorde/TEMP/ANTRACT/AF/metadata.tsv")
     File metadataFile = new File("/home/mdecorde/TEMP/ANTRACT/AF/sujets.xlsx")
     File trsDirectory = new File("/home/mdecorde/TEMP/ANTRACT/AF/trs")
     def idTRSColumn = "Lien notice principale"
     def typeColumns = ["Identifiant de la notice"]
     def topicColumns = ["Titre propre", "Notes du titre"]
     def joinTRSColumn = "Lien notice principale"
     def typeColumns = ["Date de diffusion"]
     def topicColumns = ["Titre propre"]
     def startTimeColumn = "antract_debut"
     def endTimeColumn = "antract_fin"
     //def metadataColumns = ["Identifiant de la notice", "Titre propre", "antract_debut", "antract_fin"]
     def metadataColumns = ["Date de diffusion", "Descripteurs (Aff. Col.)", "Durée", "Générique (Aff. Col.)", "Genre", "Identifiant de la notice", "Langue VO / VE ", "Lien notice principale", "Nature de production ", "Nom fichier segmenté (info)", "Notes du titre ", "Producteurs (Aff.)", "Résumé", "Séquences", "Thématique", "Titre propre", "Type de date", "Type de notice"]
     def metadataColumns = [
     				"Titre propre", "Date de diffusion", "Identifiant de la notice", "Notes du titre", "Type de date", "Durée", "Genre", "Langue VO / VE", "Nature de production", "Producteurs (Aff.)", "Thématique",
     				"Nom fichier segmenté (info)", "antract_video", "antract_debut","antract_fin","antract_duree","antract_tc_type","antract_tc_date",
     				"Résumé", "Séquences", "Descripteurs (Aff. Lig.)", "Générique (Aff. Lig.)"]
     def metadataColumnsGroups = [
     	"metadata", "metadata", "metadata", "metadata", "metadata", "metadata", "metadata", "metadata", "metadata", "metadata", "metadata",
     	"secondary", "secondary", "secondary","secondary","secondary","secondary","secondary",
     	"text", "text", "text", "text"]
     if (metadataColumns.size() != metadataColumnsGroups.size()) {
     	println "ERROR in metadata declarations&groups:"
     	println "COLUMNS: "+metadataColumns
     	println "GROUPS : "+metadataColumnsGroups
     	return
+    }
     if (!trsDirectory.exists()) {
     	println "$trsDirectory not found"
     	return
+    }
     println "Loading data from $metadataFile..."
     CsvReader reader = new CsvReader(metadataFile.getAbsolutePath(), "\t".charAt(0), Charset.forName("UTF-8"))
     TableReader reader = new TableReader(metadataFile)//, "\t".charAt(0), Charset.forName("UTF-8")
     reader.readHeaders()
     def header = reader.getHeaders()
     if (!header.contains(idTRSColumn)) {
     	println "No TRS ID $idTRSColumn column found"
     if (!header.contains(joinTRSColumn)) {
     	println "No TRS ID $joinTRSColumn column found"
     	return
+    }
     if (!header.contains(startTimeColumn)) {
-...
     def sectionGroupsToInsert = [:]
     println "Reading data..."
     while (reader.readRecord()) {
     	String id = reader.get(idTRSColumn).trim()
     	String id = reader.get(joinTRSColumn).trim()
     	if (id.endsWith(".mp4")) id = id.substring(0, id.length()-4)
     	if (id.length() == 0) continue;
-...
+    	}
     	def section = sectionGroupsToInsert[id]
     	if (reader.get(startTimeColumn) != null && reader.get(startTimeColumn).length() > 0) { // ignore non timed sections
     		def m = [:]
-...
     			def data = []
     			for (def col : todo.value) {
     				if (reader.get(col).trim().length() > 0) {
     					data << col+": "+reader.get(col).trim().replace("\n", "")
     					data << reader.get(col).trim().replace("\n", "")
+    				}
+    			}
     			m[todo.key] = data.join("\t")
+    		}
     		for (def col : metadataColumns) {
     			m[AsciiUtils.buildAttributeId(col)] = reader.get(col)
     		def metadataList = []
     		def metadataGroupList = []
     		for (int i = 0 ;  i < metadataColumns.size() ; i++) {
     			def col = metadataColumns[i]
     			String c = AsciiUtils.buildAttributeId(col)
     			m[c] = reader.get(col)
     			metadataList << c
     			metadataGroupList << metadataColumnsGroups[i]
+    		}
     		m["metadata"] = metadataList.join("|")
     		m["metadata_groups"] = metadataGroupList.join("|")
     		m["startTime"] = strTotime(reader.get(startTimeColumn))
     		m["endTime"] = strTotime(reader.get(endTimeColumn))
-...
+    	}
+    }
     cpb.done()
     reader.close()
     println "Done."

     int wordsPerPage = project.getEditionDefinition("default").getWordsPerPage()
     String page_element = project.getEditionDefinition("default").getPageElement()
     boolean build_edition = project.getEditionDefinition("default").getBuildEdition()
     boolean update = project.getDoUpdate()
     File srcDir = new File(rootDir);
     File binDir = project.getProjectDirectory();
-...
+    }
     File txmDir = new File(binDir,"txm/$corpusname");
     txmDir.deleteDir();
     if (!update) txmDir.deleteDir();
     txmDir.mkdirs();
     //get metadata values from CSV
-...
     else {
     	println "no metadata file: "+allMetadataFile
+    }
     final HashMap<String, String> textordersInfo = new HashMap<String, String>();
     for (String t : metadatas.keySet()) {
     	def ti = metadatas.get(t)
     	for (org.txm.metadatas.Entry e : ti) {
     		if ("textorder".equals(e.getId())) {
     			textordersInfo[t+".trs"] = ti.value()
+    		}
+    	}
+    }
     File propertyFile = new File(srcDir, "import.properties")//default
     Properties props = new Properties();
-...
     	FileInputStream input = new FileInputStream(propertyFile);
     	props.load(input);
     	input.close();
     	if (props.getProperty("removeInterviewer") != null)
     		removeInterviewer = Boolean.parseBoolean(props.get("removeInterviewer").toString());
     	if (props.getProperty("ignoreTranscriberMetadata") != null)
-...
     		csvHeaderNumber = props.get("csvHeaderNumber").toString().split("|");
     	//if (props.getProperty("includeComments") != null)
     	//	includeComments = props.get("includeComments").toString();
     	println "import properties: "
     	println " removeInterviewer: "+removeInterviewer
     	println " ignoreTranscriberMetadata: "+ignoreTranscriberMetadata
-...
     // Apply XSL
     if (MONITOR != null && MONITOR.isCanceled()) { return MONITOR.done(); }
     if (MONITOR != null) MONITOR.worked(1, "XSL")
     if (xsl != null && xsl.trim().length() > 0) {
     	if (ApplyXsl2.processImportSources(new File(xsl), srcDir, new File(binDir, "src")))
     		srcDir = new File(binDir, "src");
     	println ""
+    }
     try {
     	// select only trs files
     	String ext = "trs";
     	ArrayList<File> trsfiles = srcDir.listFiles(); //find all trs files
     	if (trsfiles  == null) {
     		println ("No files in "+srcDir.getAbsolutePath())
     		return false;
+    	}
     	for (int i = 0 ; i < trsfiles.size() ; i++) {
     		File f = trsfiles.get(i);
     		if (!f.getName().endsWith(ext) || !f.canRead() || f.isHidden()) {
     			trsfiles.remove(i)
     			i--;
+    		}
+    	}
     	if (trsfiles.size() == 0) {
     		println ("No transcription file (*.trs) found in "+srcDir.getAbsolutePath()+". Aborting.")
     		return false;
+    	}
     	if (MONITOR != null) MONITOR.worked(1, "IMPORTER")
     	if (MONITOR != null && MONITOR.isCanceled()) { return MONITOR.done(); }
     	println "-- IMPORTER"
     	def imp = new importer(trsfiles, binDir, txmDir, metadatas, lang) //put result in the txm folder of binDir
     	if (!imp.run()) {
     		println "Failed to prepare files - Aborting";
     		return;
+    	}
     	if (MONITOR != null) MONITOR.worked(20)
     	println "-- Xml Validation"
     	if (MONITOR != null && MONITOR.isCanceled()) { return MONITOR.done(); }
     	for (File infile : txmDir.listFiles()) {
     		if (!ValidateXml.test(infile)) {
     			println "$infile : Validation failed";
     			infile.delete();
     try {
     	if (!update) {
     		// Apply XSL
     		if (MONITOR != null && MONITOR.isCanceled()) { return MONITOR.done(); }
     		if (MONITOR != null) MONITOR.worked(1, "XSL")
     		if (xsl != null && xsl.trim().length() > 0) {
     			if (ApplyXsl2.processImportSources(new File(xsl), srcDir, new File(binDir, "src")))
     				srcDir = new File(binDir, "src");
     			println ""
+    		}
     		// select only trs files
     		String ext = "trs";
     		ArrayList<File> trsfiles = srcDir.listFiles(); //find all trs files
     		if (trsfiles  == null) {
     			println ("No files in "+srcDir.getAbsolutePath())
     			return false;
+    		}
+    	}
     	if (MONITOR != null) MONITOR.worked(5)
     	if (MONITOR != null && MONITOR.isCanceled()) { return MONITOR.done(); }
     	println "-- Remove interviewer: "+removeInterviewer
     	if (removeInterviewer) 	{
     		if (metadatas == null) {
     			println "Can't remove interviewer without a metadata.csv file defining who are the interviewers."
     		} else {
     			println "Removing some speakers in "+txmDir.listFiles().length+" file(s)"
     			for (File infile : txmDir.listFiles()) {
     				String filename = infile.getName();
     				int idx = filename.indexOf(".xml");
     				if (idx > 0)
     					filename = filename.substring(0, idx);
     				ArrayList<Pair<String, String>> metas = metadatas.get(filename)
     				//println "filename=$filename metas= $metas"
     				for (Pair p : metas) {
     					if (p.getFirst().startsWith("enq")) {
     						new RemoveSpeaker(infile, infile, p.getFirst())
     		for (int i = 0 ; i < trsfiles.size() ; i++) {
     			File f = trsfiles.get(i);
     			if (!f.getName().endsWith(ext) || !f.canRead() || f.isHidden()) {
     				trsfiles.remove(i)
     				i--;
+    			}
+    		}
     		if (trsfiles.size() == 0) {
     			println ("No transcription file (*.trs) found in "+srcDir.getAbsolutePath()+". Aborting.")
     			return false;
+    		}
     		if (MONITOR != null) MONITOR.worked(1, "IMPORTER")
     		if (MONITOR != null && MONITOR.isCanceled()) { return MONITOR.done(); }
     		println "-- IMPORTER"
     		def imp = new importer(trsfiles, binDir, txmDir, metadatas, lang) //put result in the txm folder of binDir
     		if (!imp.run()) {
     			println "Failed to prepare files - Aborting";
     			return;
+    		}
     		if (MONITOR != null) MONITOR.worked(20)
     		println "-- Xml Validation"
     		if (MONITOR != null && MONITOR.isCanceled()) { return MONITOR.done(); }
     		for (File infile : txmDir.listFiles()) {
     			if (!ValidateXml.test(infile)) {
     				println "$infile : Validation failed";
     				infile.delete();
+    			}
+    		}
     		if (MONITOR != null) MONITOR.worked(5)
     		if (MONITOR != null && MONITOR.isCanceled()) { return MONITOR.done(); }
     		println "-- Remove interviewer: "+removeInterviewer
     		if (removeInterviewer) 	{
     			if (metadatas == null) {
     				println "Can't remove interviewer without a metadata.csv file defining who are the interviewers."
     			} else {
     				println "Removing some speakers in "+txmDir.listFiles().length+" file(s)"
     				for (File infile : txmDir.listFiles()) {
     					String filename = infile.getName();
     					int idx = filename.indexOf(".xml");
     					if (idx > 0)
     						filename = filename.substring(0, idx);
     					ArrayList<Pair<String, String>> metas = metadatas.get(filename)
     					//println "filename=$filename metas= $metas"
     					for (Pair p : metas) {
     						if (p.getFirst().startsWith("enq")) {
     							new RemoveSpeaker(infile, infile, p.getFirst())
+    						}
+    					}
+    				}
+    				}
+    			}
+    		}
     		if (MONITOR != null && MONITOR.isCanceled()) { return MONITOR.done(); }
     		if (MONITOR != null) MONITOR.worked(20, "ANNOTATE")
     		boolean annotationSuccess = false;
     		if (annotate) {
     			println "-- ANNOTATE - Running NLP tools"
     			def engine = Toolbox.getEngineManager(EngineType.ANNOTATION).getEngine("TreeTagger")
     			if (engine.processDirectory(txmDir, binDir, ["lang":model])) {
     				annotationSuccess = true;
+    			}
+    		}
+    	}
+    	}
     	trsfiles = new ArrayList<File>(Arrays.asList(txmDir.listFiles()));
     	if (metadatas != null && metadatas.getPropertyNames().contains("textorder")) {
     		Collections.sort(trsfiles, new Comparator<File>() {
     					public int compare(File f1, File f2) {
     						String o1 = textorder[f1.getName()];
     						String o2 = textorder[f2.getName()];
     						if (o1 == null && o2 == null) {
     							return f1.compareTo(f2);
     						} else if (o1 == null) {
     							return 1
     						} else if (o2 == null) {
     							return -1
     						} else {
     							int c = o1.compareTo(o2);
     							if (c == 0) return f1.compareTo(f2);
     							else return c;
+    						}
+    					}
     				});
     	} else {
     		Collections.sort(trsfiles);
+    	}
     	if (MONITOR != null && MONITOR.isCanceled()) { return MONITOR.done(); }
     	if (MONITOR != null) MONITOR.worked(20, "ANNOTATE")
     	boolean annotationSuccess = false;
     	if (annotate) {
     		println "-- ANNOTATE - Running NLP tools"
     		def engine = Toolbox.getEngineManager(EngineType.ANNOTATION).getEngine("TreeTagger")
     		if (engine.processDirectory(txmDir, binDir, ["lang":model])) {
     			annotationSuccess = true;
+    		}
+    	}
     	if (MONITOR != null && MONITOR.isCanceled()) { return MONITOR.done(); }
     	if (MONITOR != null) MONITOR.worked(25, "COMPILING")
     	println "--COMPILING - Building Search Engine indexes"
     	trsfiles = txmDir.listFiles();
     	def comp = new compiler()
     	if(debug) comp.setDebug();
     	comp.removeInterviewers(removeInterviewer);
     	comp.setIgnoreTranscriberMetadata(ignoreTranscriberMetadata);
     	comp.setAnnotationSucces(annotationSuccess)
     	if (!comp.run(project, trsfiles, corpusname, "default", binDir)) {
     		println "Failed to compile files";
     		return;
+    	}
     	if (MONITOR != null && MONITOR.isCanceled()) { return MONITOR.done(); }
     	File htmlDir = new File(binDir,"HTML/$corpusname");
     	htmlDir.deleteDir()
     	htmlDir.mkdirs();
     	if (build_edition) {
     		if (MONITOR != null) MONITOR.worked(20, "EDITION")
     		println "-- EDITION - Building editions"
     		List<File> filelist = txmDir.listFiles();
     		Collections.sort(filelist);
     		def second = 0
     		println "Paginating "+filelist.size()+" texts"
     		ConsoleProgressBar cpb = new ConsoleProgressBar(filelist.size());
     		for (File txmFile : filelist) {
     		println "Paginating "+trsfiles.size()+" texts"
     		ConsoleProgressBar cpb = new ConsoleProgressBar(trsfiles.size());
     		for (File txmFile : trsfiles) {
     			cpb.tick()
     			String txtname = txmFile.getName();
     			int i = txtname.lastIndexOf(".");
     			if(i > 0) txtname = txtname.substring(0, i);
     			List<String> NoSpaceBefore = LangFormater.getNoSpaceBefore(lang);
     			List<String> NoSpaceAfter = LangFormater.getNoSpaceAfter(lang);
     			Text t = new Text(project);
     			t.setName(txtname);
     			t.setSourceFile(txmFile)
     			t.setTXMFile(txmFile)
     			Text t = project.getText(txtname)
     			if (t == null) {
     				new Text(project);
     				t.setName(txtname);
     				t.setSourceFile(txmFile)
     				t.setTXMFile(txmFile)
+    			}
     			def ed = new pager(txmFile, htmlDir, txtname, NoSpaceBefore, NoSpaceAfter, wordsPerPage, basename, page_element, metadatas);
     			Edition edition = new Edition(t);
     			edition.setName("default");
-...
+    			}
+    		}
     		cpb.done()
     		//copy transcriber.css
     		File cssfile = new File(Toolbox.getTxmHomePath(), "css/transcriber.css")
     		File cssTXMFile = new File(Toolbox.getTxmHomePath(), "css/txm.css")
-...
+    		}
     		//copy media files
     		println "Copying media files if any (mp3, wav, mp4 or avi) "+filelist.size()+" texts"
     		cpb = new ConsoleProgressBar(filelist.size());
     		for (File txmFile : filelist) {
     		println "Copying media files if any (mp3, wav, mp4 or avi) "+trsfiles.size()+" texts"
     		cpb = new ConsoleProgressBar(trsfiles.size());
     		for (File txmFile : trsfiles) {
     			cpb.tick()
     			String txtname = txmFile.getName();
     			int i = txtname.lastIndexOf(".");
-...
     			if (!mediaFile.exists()) mediaFile = new File(project.getSrcdir(), txtname + ".wav")
     			if (!mediaFile.exists()) mediaFile = new File(project.getSrcdir(), txtname + ".mp4")
     			if (!mediaFile.exists()) mediaFile = new File(project.getSrcdir(), txtname + ".avi")
     			if (mediaFile.exists()) {
     				File copy = new File(binDir, "media/"+mediaFile.getName())
     				copy.getParentFile().mkdirs()

     	/** The debug. */
     	boolean debug = false;
     	/** The annotation succes. */
     	boolean annotationSucces = false;
     	/** The removeinterviewers. */
     	boolean removeinterviewers = false;
-...
     		println("Compiling "+xmlfiles.size()+" files")
     		ConsoleProgressBar cpb = new ConsoleProgressBar(xmlfiles.size())
     		for (File f :xmlfiles) {
     			if (f.exists()) {
     		for (File txmFile :xmlfiles) {
     			if (txmFile.exists()) {
     				cpb.tick()
     				if (!process(f)) {
     					println("Failed to compile "+f)
     				if (!process(txmFile)) {
     					println("Failed to compile "+txmFile)
+    				}
+    			}
+    		}
-...
     		debug = true;
+    	}
     	/**
     	 * Sets the annotation success.
+    	 *
     	 * @param val the new annotation success
     	 */
     	public void setAnnotationSuccess(boolean val) {
     		annotationSucces = val
+    	}
+    }

Formats disponibles : Unified diff

Laboratoire ICAR » Plateforme TXM

Révision 2354