Révision 2900
tmp/org.txm.analec.rcp/src/org/txm/annotation/urs/export/ExportToGlozzMacro.java (revision 2900) | ||
---|---|---|
1 | 1 |
package org.txm.annotation.urs.export; |
2 | 2 |
|
3 |
// @author: Bruno Oberlé |
|
4 |
// v1.0.0 2017-08-28 |
|
5 |
// included in TXM by mdecorde |
|
6 |
/* |
|
7 |
Cette macro exporte le corpus sélectionné et ses annotations vers deux fichiers de format Glozz: |
|
8 |
- un fichier .ac contenant le corpus brut, |
|
9 |
- un fichier .aa contenant les annotations au format XML utilisé par Glozz. |
|
10 |
Le corpus sélectionné dans TXM devrait contenir une structure Analec avec au moins un type d'unité défini (e.g. MENTION, maillon, etc.). S'il n'y a pas de structure, |
|
11 |
ce n'est pas grave: le fichier est exporter, mais aucune annotation n'est créer. Cela permet d'exporter n'importe quel corpus au format Glozz. |
|
12 |
Pour exporter un texte au format Glozz *sans* les annotations qu'il contient, simplement mettre un unit_type qui n'existe pas (e.g. "foobar" au lieu de "MENTION"). |
|
13 |
La macro ne produit pour l'instant pas automatiquement de modèle Glozz (fichier .aam). Cela n'est pas un problème pour ouvrir le résultat dans Glozz ou Analec. |
|
14 |
*/ |
|
15 |
|
|
16 |
// STANDARD DECLARATIONS |
|
17 |
|
|
18 | 3 |
import java.io.File; |
19 | 4 |
import java.io.IOException; |
20 | 5 |
import java.io.PrintWriter; |
... | ... | |
35 | 20 |
import visuAnalec.donnees.Structure; |
36 | 21 |
import visuAnalec.elements.Unite; |
37 | 22 |
import visuAnalec.fichiers.FichiersGlozz.ModelGlozzPrinter; |
23 |
/** |
|
24 |
* @author: Bruno Oberlé |
|
25 |
* |
|
26 |
* v1.0.0 2017-08-28 |
|
27 |
* |
|
28 |
* adapted and included in TXM by mdecorde |
|
38 | 29 |
|
30 |
* Cette macro exporte le corpus sélectionné et ses annotations vers deux fichiers de format Glozz: |
|
31 |
* - un fichier .ac contenant le corpus brut, |
|
32 |
* - un fichier .aa contenant les annotations au format XML utilisé par Glozz, |
|
33 |
* - un fichier .aam contenant la structure d'annotation. |
|
34 |
* |
|
35 |
* Le corpus sélectionné dans TXM devrait contenir une structure Analec avec au moins un type d'unité défini (e.g. MENTION, maillon, etc.). S'il n'y a pas de structure, |
|
36 |
* ce n'est pas grave: le fichier est exporter, mais aucune annotation n'est créer. Cela permet d'exporter n'importe quel corpus au format Glozz. |
|
37 |
* |
|
38 |
* Pour exporter un texte au format Glozz *sans* les annotations qu'il contient, simplement mettre un unit_type qui n'existe pas (e.g. "foobar" au lieu de "MENTION"). |
|
39 |
* |
|
40 |
* deprecated: La macro ne produit pour l'instant pas automatiquement de modèle Glozz (fichier .aam). Cela n'est pas un problème pour ouvrir le résultat dans Glozz ou Analec. |
|
41 |
**/ |
|
39 | 42 |
public class ExportToGlozzMacro { |
40 | 43 |
|
41 | 44 |
public void doExport(MainCorpus corpus, String unit_type, String filename) throws NumberFormatException, IOException, CqiServerError, CqiClientException { |
... | ... | |
59 | 62 |
if (model!=null) model.close(); |
60 | 63 |
System.out.println(NLS.bind("Corpus written to ''{0}''.", fichierModel)); |
61 | 64 |
} |
62 |
|
|
65 |
|
|
63 | 66 |
int size = corpus.getSize(); // you may also use: |
64 | 67 |
// corpus.getTextEndLimits() (= index of |
65 | 68 |
// last token = size-1) |
Formats disponibles : Unified diff