Feature #1562
Feature #1560: RCP: X.X, annotation storage
RCP: X.X, annotation storage - analysis V1
Status: | Resolved | Start date: | 10/12/2015 | ||
---|---|---|---|---|---|
Priority: | Normal | Due date: | |||
Assignee: | - | % Done: | 80% |
||
Category: | Commands | Spent time: | - | ||
Target version: | TXM Annotation 1.0 | Estimated time: | 3.00 hours |
Description
Stratégies d'enregistrement :
Cela implique
- l'affectation d'annotation sur le corpus se reposant sur une sauvegarde temporaire dans la session de travail
- une opération de commit qui rend disponible les annotations
- l'exploitation d'annotation du corpus se reposant sur une nouvelle version interne du corpus
Sauvegarde définitive¶
Scénario C : On utilise les dernières étapes d'un module d'import : “compiler” et “pager”.Cela implique
- transférer les annotations de la base temporaire en propriétés de structure englobant la séquence dans les fichiers XML-TXM du corpus binaire.
- En parsant les fichiers XML-TXM en DOM
- qu'un corpus peut-être importé avec le module 'XML-XTZ + CSV'
- générer un fichier WTC par fichier XML-TXM puis les concaténer à l'appel de cwb-encode au lieu de régénérer un gros fichier WTC pour tout le corpus
- ne pas mettre à jour les fichiers/textes qui ne sont pas concernés par les annotations et ne pas leur appliquer les étapes compiler et pager
- on peut utiliser l'antériorité entre les dates de fichiers XML-TXM -> WTC | HTML pour implémenter cette stratégie
History
#1 Updated by Matthieu Decorde almost 8 years ago
- Parent task set to #1560
#2 Updated by Matthieu Decorde almost 8 years ago
- Estimated time set to 3.00
#3 Updated by Severine Gedzelman almost 8 years ago
- % Done changed from 0 to 80
#4 Updated by Matthieu Decorde over 7 years ago
- Status changed from New to Resolved