Révision 2900
| tmp/org.txm.analec.rcp/src/org/txm/annotation/urs/export/ExportToGlozzMacro.java (revision 2900) | ||
|---|---|---|
| 1 | 1 |
package org.txm.annotation.urs.export; |
| 2 | 2 |
|
| 3 |
// @author: Bruno Oberlé |
|
| 4 |
// v1.0.0 2017-08-28 |
|
| 5 |
// included in TXM by mdecorde |
|
| 6 |
/* |
|
| 7 |
Cette macro exporte le corpus sélectionné et ses annotations vers deux fichiers de format Glozz: |
|
| 8 |
- un fichier .ac contenant le corpus brut, |
|
| 9 |
- un fichier .aa contenant les annotations au format XML utilisé par Glozz. |
|
| 10 |
Le corpus sélectionné dans TXM devrait contenir une structure Analec avec au moins un type d'unité défini (e.g. MENTION, maillon, etc.). S'il n'y a pas de structure, |
|
| 11 |
ce n'est pas grave: le fichier est exporter, mais aucune annotation n'est créer. Cela permet d'exporter n'importe quel corpus au format Glozz. |
|
| 12 |
Pour exporter un texte au format Glozz *sans* les annotations qu'il contient, simplement mettre un unit_type qui n'existe pas (e.g. "foobar" au lieu de "MENTION"). |
|
| 13 |
La macro ne produit pour l'instant pas automatiquement de modèle Glozz (fichier .aam). Cela n'est pas un problème pour ouvrir le résultat dans Glozz ou Analec. |
|
| 14 |
*/ |
|
| 15 |
|
|
| 16 |
// STANDARD DECLARATIONS |
|
| 17 |
|
|
| 18 | 3 |
import java.io.File; |
| 19 | 4 |
import java.io.IOException; |
| 20 | 5 |
import java.io.PrintWriter; |
| ... | ... | |
| 35 | 20 |
import visuAnalec.donnees.Structure; |
| 36 | 21 |
import visuAnalec.elements.Unite; |
| 37 | 22 |
import visuAnalec.fichiers.FichiersGlozz.ModelGlozzPrinter; |
| 23 |
/** |
|
| 24 |
* @author: Bruno Oberlé |
|
| 25 |
* |
|
| 26 |
* v1.0.0 2017-08-28 |
|
| 27 |
* |
|
| 28 |
* adapted and included in TXM by mdecorde |
|
| 38 | 29 |
|
| 30 |
* Cette macro exporte le corpus sélectionné et ses annotations vers deux fichiers de format Glozz: |
|
| 31 |
* - un fichier .ac contenant le corpus brut, |
|
| 32 |
* - un fichier .aa contenant les annotations au format XML utilisé par Glozz, |
|
| 33 |
* - un fichier .aam contenant la structure d'annotation. |
|
| 34 |
* |
|
| 35 |
* Le corpus sélectionné dans TXM devrait contenir une structure Analec avec au moins un type d'unité défini (e.g. MENTION, maillon, etc.). S'il n'y a pas de structure, |
|
| 36 |
* ce n'est pas grave: le fichier est exporter, mais aucune annotation n'est créer. Cela permet d'exporter n'importe quel corpus au format Glozz. |
|
| 37 |
* |
|
| 38 |
* Pour exporter un texte au format Glozz *sans* les annotations qu'il contient, simplement mettre un unit_type qui n'existe pas (e.g. "foobar" au lieu de "MENTION"). |
|
| 39 |
* |
|
| 40 |
* deprecated: La macro ne produit pour l'instant pas automatiquement de modèle Glozz (fichier .aam). Cela n'est pas un problème pour ouvrir le résultat dans Glozz ou Analec. |
|
| 41 |
**/ |
|
| 39 | 42 |
public class ExportToGlozzMacro {
|
| 40 | 43 |
|
| 41 | 44 |
public void doExport(MainCorpus corpus, String unit_type, String filename) throws NumberFormatException, IOException, CqiServerError, CqiClientException {
|
| ... | ... | |
| 59 | 62 |
if (model!=null) model.close(); |
| 60 | 63 |
System.out.println(NLS.bind("Corpus written to ''{0}''.", fichierModel));
|
| 61 | 64 |
} |
| 62 |
|
|
| 65 |
|
|
| 63 | 66 |
int size = corpus.getSize(); // you may also use: |
| 64 | 67 |
// corpus.getTextEndLimits() (= index of |
| 65 | 68 |
// last token = size-1) |
Formats disponibles : Unified diff