Feature #1559

Updated by Matthieu Decorde about 5 years ago

FR

Stratégies d'enregistrement :
# l'affectation d'annotation sur le corpus se reposant sur une sauvegarde temporaire dans la session de travail
# une opération de commit qui rend disponible les annotations
# l'exploitation d'annotation du corpus se reposant sur une nouvelle version interne du corpus

h3. sauvegarde temporaire

Dans des tables SQL (eg SGBDR (HSQLDB, SQLite)

En cas de chevauchement d'annotation : scénario 1 : on informe l'utilisateur que les annotations correspondant à des structures enchâssées ont été abandonnées

h3. Commit


Déclenché manuellement, après avoir fait plusieurs annotations
* à partir du menu contextuel du corpus dans la vue Corpus. (le nom du corpus sera assorti d'une étoile, dès lors qu'une ou plusieurs annotations ont été effectuées)
* à partir d'un bouton “enregistrer les annotations” dans la barre d'outils de TXM
* à partir du menu principal “Corpus > Enregistrer les annotations”

h3. Sauvegarde définitive

Scénario C : On utilise les dernières étapes d'un module d'import : “compiler” et “pager”.
Cela implique
# transférer les annotations de la base temporaire en propriétés de structure englobant la séquence dans les fichiers XML-TXM du corpus binaire.
#* En parsant les fichiers XML-TXM en DOM
# qu'un corpus peut-être importé avec le module 'XML-XTZ + CSV'

Optimisations :
* générer un fichier WTC par fichier XML-TXM puis les concaténer à l'appel de cwb-encode au lieu de régénérer un gros fichier WTC pour tout le corpus
* ne pas mettre à jour les fichiers/textes qui ne sont pas concernés par les annotations et ne pas leur appliquer les étapes compiler et pager
* on peut utiliser l'antériorité entre les dates de fichiers XML-TXM -> WTC | HTML pour implémenter cette stratégie

Back