Task #964

DOC: Groovy script environment

Ajouté par Matthieu Decorde il y a environ 11 ans. Mis à jour il y a plus d'un an.

Statut:New Début:01/08/2014
Priorité:Normal Echéance:
Assigné à:- % réalisé:

0%

Catégorie:Documentation Temps passé: -
Version cible:TXM 0.8.4

Description

FR SLH A) pour pouvoir proposer qlqpart d' "ouvrir le script ~/TXM-0.8.1/scripts/groovy/user/org/txm/scripts/importer/txt/importer.groovy"
un paragraphe qui décrit la politique mise à jour d'architecture et de maintenance des scripts en 0.8.1 : chemins, séparation user et system, priorités dans la recherche de scripts, ce que l'utilisateur peut faire, ce qu'il ne doit pas faire (changer les scripts system ?)
- un paragraphe d'introduction à l'architecture des scripts de modules d'import : les noms des scripts, leur succession, leur paramètres ?, leurs sorties ?

B) pour pouvoir proposer qlqpart de "modifier le fichier ~/TXM-0.8.1/scripts/groovy/user/org/txm/scripts/filters/Tokeniser/SimpleTokenizerXml.groovy"
- une documentation qlqpart (javadoc ou ailleurs) du script importer.groovy et son usage de filtres (jusqu'à éventuellement la possibilité d'intégrer un filtre écrit en Perl ou en Python voire en XSLT)
- une documentation qlqpart (javadoc ou ailleurs) du script SimpleTokenizerXml.groovy et de sa méthode processWord en particulier

Avec tout ça je devrais pouvoir concocter une section de manuel pour aider à adapter un module d'import à des sources particulières.
Si cette adaptation passe par la copie et le renommage d'une hiérarchie de scripts d'un module existant, il me faut peut-être également un documentation d'un mécanisme ou script me permettant d'appeler un nouveau module d'import (doc de imports/OpenImportFormMacro.groovy ?, doc de prototypes/RunImport ?)

Solution

FR

Les macros et scripts Groovy utilisés directement par TXM se trouvent dans le répertoire "HOME/TXM-X.Y.Z/scripts/groovy/user". Le répertoire "HOME/TXM-X.Y.Z/scripts/groovy/system" est une sauvegarde du répertoire "user" à l'état initial de l'installation de TXM. Cette sauvegarde permet de restaurer les macros en cas de mauvaise manipulation.

Dans le répertoire "user" , on trouve les arborescences des packages Groovy :
  • org.txm.macros : contient toutes les macros visibles de la vue Macro + les fichiers de paramétrage et quelques scripts Groovy utiliser en interne par les macro
  • org.txm.scripts : les scripts Groovy et notamment les scripts Groovy utilisés par les modules d'import
Dans les sous-packages de "org.txm.scripts.importer", on trouvera les scripts des modules d'import de TXM. Pour chaque module d'import "xyz", on trouvera un script point d'entrée org.txm.scripts.importer.xyz.xyzLoader.groovy. Ce script prépare entre autres (en fonction du module) l'appel des scripts des étapes d'import :
  • importer.groovy : prend les sources d'origine et vise le format XML-TXM en transformant le format d'origine en XML, puis tokenise puis construit le format XML-TXM
  • annotate : cette étape ne se trouve pas dans un fichier Groovy, elle applique éventuellement un modèle TreeTagger
  • compiler.groovy : prends les fichiers XML-TXM pour construire les indexes CQP des textes
  • pager.groovy : prendre les fichiers XML-TXM pour construire les pages HTML des éditions

Historique

#1 Mis à jour par Matthieu Decorde il y a environ 11 ans

  • Sujet changé de DOC: calling a macro from Groovy script à DOC: Groovy script environment

#2 Mis à jour par Sebastien Jacquot il y a presque 11 ans

  • Version cible changé de TXM 0.7.7 à TXM 0.7.8

#3 Mis à jour par Matthieu Decorde il y a environ 10 ans

  • Version cible changé de TXM 0.7.8 à TXM 0.8.0a (split/restructuration)

#4 Mis à jour par Sebastien Jacquot il y a plus de 7 ans

  • Version cible changé de TXM 0.8.0a (split/restructuration) à TXM 0.8.0

#5 Mis à jour par Matthieu Decorde il y a plus de 6 ans

  • Version cible changé de TXM 0.8.0 à TXM 0.X.X

#6 Mis à jour par Matthieu Decorde il y a plus de 5 ans

  • Description mis à jour (diff)
  • Version cible changé de TXM 0.X.X à TXM 0.8.2

#7 Mis à jour par Matthieu Decorde il y a plus de 5 ans

  • Description mis à jour (diff)

#8 Mis à jour par Matthieu Decorde il y a environ 2 ans

  • Description mis à jour (diff)

#9 Mis à jour par Matthieu Decorde il y a environ 2 ans

  • Description mis à jour (diff)
  • Version cible changé de TXM 0.8.2 à TXM 0.8.3

#10 Mis à jour par Sebastien Jacquot il y a plus d'un an

  • Version cible changé de TXM 0.8.3 à TXM 0.8.4

Formats disponibles : Atom PDF