Feature #1562

Feature #1560: RCP: X.X, annotation storage

RCP: X.X, annotation storage - analysis V1

Ajouté par Matthieu Decorde il y a plus de 3 ans. Mis à jour il y a environ 3 ans.

Statut:Resolved Début:12/10/2015
Priorité:Normal Echéance:
Assigné à:- % réalisé:

80%

Catégorie:Commands Temps passé: -
Version cible:TXM Annotation 1.0 Temps estimé:3.00 heures

Description

Stratégies d'enregistrement :
  1. l'affectation d'annotation sur le corpus se reposant sur une sauvegarde temporaire dans la session de travail
  2. une opération de commit qui rend disponible les annotations
  3. l'exploitation d'annotation du corpus se reposant sur une nouvelle version interne du corpus

Sauvegarde définitive

Scénario C : On utilise les dernières étapes d'un module d'import : “compiler” et “pager”.
Cela implique
  1. transférer les annotations de la base temporaire en propriétés de structure englobant la séquence dans les fichiers XML-TXM du corpus binaire.
    • En parsant les fichiers XML-TXM en DOM
  2. qu'un corpus peut-être importé avec le module 'XML-XTZ + CSV'
Optimisations :
  • générer un fichier WTC par fichier XML-TXM puis les concaténer à l'appel de cwb-encode au lieu de régénérer un gros fichier WTC pour tout le corpus
  • ne pas mettre à jour les fichiers/textes qui ne sont pas concernés par les annotations et ne pas leur appliquer les étapes compiler et pager
  • on peut utiliser l'antériorité entre les dates de fichiers XML-TXM -> WTC | HTML pour implémenter cette stratégie

Historique

#1 Mis à jour par Matthieu Decorde il y a plus de 3 ans

  • Tâche parente mis à #1560

#2 Mis à jour par Matthieu Decorde il y a plus de 3 ans

  • Temps estimé mis à 3.00

#3 Mis à jour par Severine Gedzelman il y a environ 3 ans

  • % réalisé changé de 0 à 80

#4 Mis à jour par Matthieu Decorde il y a environ 3 ans

  • Statut changé de New à Resolved

Formats disponibles : Atom PDF