Feature #1562

Feature #1560: RCP: X.X, annotation storage

RCP: X.X, annotation storage - analysis V1

Added by Matthieu Decorde over 3 years ago. Updated over 3 years ago.

Status:Resolved Start date:10/12/2015
Priority:Normal Due date:
Assignee:- % Done:

80%

Category:Commands Spent time: -
Target version:TXM Annotation 1.0 Estimated time:3.00 hours

Description

Stratégies d'enregistrement :
  1. l'affectation d'annotation sur le corpus se reposant sur une sauvegarde temporaire dans la session de travail
  2. une opération de commit qui rend disponible les annotations
  3. l'exploitation d'annotation du corpus se reposant sur une nouvelle version interne du corpus

Sauvegarde définitive

Scénario C : On utilise les dernières étapes d'un module d'import : “compiler” et “pager”.
Cela implique
  1. transférer les annotations de la base temporaire en propriétés de structure englobant la séquence dans les fichiers XML-TXM du corpus binaire.
    • En parsant les fichiers XML-TXM en DOM
  2. qu'un corpus peut-être importé avec le module 'XML-XTZ + CSV'
Optimisations :
  • générer un fichier WTC par fichier XML-TXM puis les concaténer à l'appel de cwb-encode au lieu de régénérer un gros fichier WTC pour tout le corpus
  • ne pas mettre à jour les fichiers/textes qui ne sont pas concernés par les annotations et ne pas leur appliquer les étapes compiler et pager
  • on peut utiliser l'antériorité entre les dates de fichiers XML-TXM -> WTC | HTML pour implémenter cette stratégie

History

#1 Updated by Matthieu Decorde over 3 years ago

  • Parent task set to #1560

#2 Updated by Matthieu Decorde over 3 years ago

  • Estimated time set to 3.00

#3 Updated by Severine Gedzelman over 3 years ago

  • % Done changed from 0 to 80

#4 Updated by Matthieu Decorde over 3 years ago

  • Status changed from New to Resolved

Also available in: Atom PDF