Révision 2900

tmp/org.txm.analec.rcp/src/org/txm/annotation/urs/export/ExportToGlozzMacro.java (revision 2900)
1 1
package org.txm.annotation.urs.export;
2 2

  
3
// @author: Bruno Oberlé
4
// v1.0.0 2017-08-28
5
// included in TXM by mdecorde
6
/*
7
 Cette macro exporte le corpus sélectionné et ses annotations vers deux fichiers de format Glozz:
8
 - un fichier .ac contenant le corpus brut,
9
 - un fichier .aa contenant les annotations au format XML utilisé par Glozz.
10
 Le corpus sélectionné dans TXM devrait contenir une structure Analec avec au moins un type d'unité défini (e.g. MENTION, maillon, etc.). S'il n'y a pas de structure,
11
 ce n'est pas grave: le fichier est exporter, mais aucune annotation n'est créer. Cela permet d'exporter n'importe quel corpus au format Glozz.
12
 Pour exporter un texte au format Glozz *sans* les annotations qu'il contient, simplement mettre un unit_type qui n'existe pas (e.g. "foobar" au lieu de "MENTION").
13
 La macro ne produit pour l'instant pas automatiquement de modèle Glozz (fichier .aam).  Cela n'est pas un problème pour ouvrir le résultat dans Glozz ou Analec.
14
 */
15

  
16
// STANDARD DECLARATIONS
17

  
18 3
import java.io.File;
19 4
import java.io.IOException;
20 5
import java.io.PrintWriter;
......
35 20
import visuAnalec.donnees.Structure;
36 21
import visuAnalec.elements.Unite;
37 22
import visuAnalec.fichiers.FichiersGlozz.ModelGlozzPrinter;
23
/**
24
 * @author: Bruno Oberlé
25
 * 
26
 * v1.0.0 2017-08-28
27
 * 
28
 * adapted and included in TXM by mdecorde
38 29

  
30
 * Cette macro exporte le corpus sélectionné et ses annotations vers deux fichiers de format Glozz:
31
 * - un fichier .ac contenant le corpus brut,
32
 * - un fichier .aa contenant les annotations au format XML utilisé par Glozz,
33
 * - un fichier .aam contenant la structure d'annotation.
34
 * 
35
 * Le corpus sélectionné dans TXM devrait contenir une structure Analec avec au moins un type d'unité défini (e.g. MENTION, maillon, etc.). S'il n'y a pas de structure,
36
 * ce n'est pas grave: le fichier est exporter, mais aucune annotation n'est créer. Cela permet d'exporter n'importe quel corpus au format Glozz.
37
 * 
38
 * Pour exporter un texte au format Glozz *sans* les annotations qu'il contient, simplement mettre un unit_type qui n'existe pas (e.g. "foobar" au lieu de "MENTION").
39
 * 
40
 * deprecated: La macro ne produit pour l'instant pas automatiquement de modèle Glozz (fichier .aam). Cela n'est pas un problème pour ouvrir le résultat dans Glozz ou Analec.
41
 **/
39 42
public class ExportToGlozzMacro {
40 43

  
41 44
	public void doExport(MainCorpus corpus, String unit_type, String filename) throws NumberFormatException, IOException, CqiServerError, CqiClientException {
......
59 62
			if (model!=null) model.close();
60 63
			System.out.println(NLS.bind("Corpus written to ''{0}''.", fichierModel));
61 64
		}
62
		
65

  
63 66
		int size = corpus.getSize(); // you may also use:
64 67
		// corpus.getTextEndLimits() (= index of
65 68
		// last token = size-1)

Formats disponibles : Unified diff