PrepCorpusBarcelone-TXM
Version 4 (Severine Gedzelman, 11/07/2017 18:35) → Version 5/14 (Severine Gedzelman, 11/07/2017 18:36)
h1. Préparation du corpus "Barcelone" pour TXM
Revoir les étapes pour le [[PrepCorpusPEDT-TXM|corpus PEDT]] éventuellement. Sinon en résumé il y a deux choix possibles :
* CHOIX 1 : Un corpus en catalan avec uniquement les textes t1, t2, t4 + un corpus en français avec t3
* CHOIX 2 : Un corpus plus détaillé avec plusieurs fichiers par source de texte : t1_1, t1_2, voir le détails avec le fichier des métadonnées (document#170)
* CHOIX 3 : Un corpus encore plus détaillé avec un codage des titres, notes, sections à ignorer par exemple les paragraphes de présentation de l'auteur, les tableaux, les libellés dans/des graphiques, etc...
Pour l'instant je n'ai préparé que le choix 2 :
* document#171
* document#172
h2. Choix 1
h2. Choix 2
h2. Choix 3
Des infos structurant le texte, classiques dans une édition :
* titre
* sous-titre
* notes de bas de page et ancrage dans le texte pour y faire référence
* tableaux
* graphiques
pourraient facilement être isolés, repérés en utilisant un système de balises (propres à XML) comme par exemple : <title>TITRE</title>, pour marquer un titre, etc...
Un exemple de codage est donné ci-après pour la ressource : attachment:"t2_1.xml"
* id : t2_1
* text_id : T2
* titre_partie : Les audiencies publiques als nois i noies de Barcelona
* auteurs : Antonia Hernandez, Esteve Barandica
* page_deb : 161
* page_end : 165
* titre_section : L'escola en el marc de la ciutat
<pre><code>
<page id="164">
<subtitle>La resposta del consistori</subtitle>
Les propostes que els nois i noies han fet al final de cada projecte sempre han estat ateses pel consistori. Això no vol dir, òbviament, que totes arribin a fer-se realitat de manera immediata, ni en la seva totalitat. L'aplicació pràctica depèn de diversos factors, el principal dels quals és que, de vegades, es tracta de temes que no depenen ex clusivament de l'ajuntament. Tanmateix, al llarg d'aquests quinze darrers cursos, són moltes i significatives les propostes que s'han dut a terme. Sempre es procura, a les propostes dels nois i noies, retor nar informes sobre actuacions o mesures municipals.
<subtitle>Audiències a d'altres ciutats</subtitle>
Altres ciutats de Catalunya i de l'Estat espanyol han desenvolupat, els darrers anys, experiències d'audiències públiques als nois i noies. Quan el tema és compartit entre les ciutats, permet als i les nostres alumnes con trastar propostes o comprovar-ne similituds. En les audiències públiques de cada ciutat participen joves observadors d'altres ciutats. Es parteix de la idea que, davant problemàtiques comunes a diferents ciutats, es poden transmetre coneixements i compartir experiències i solucions.
<table>
CURS
TEMA
1994-1995
i Audiència pública: Mesures per a un món millor
1995-1996
n Audiència pública: La participació dels nois i les noies en la vida social de Barcelona (barri, família i escola)
1996-1997
m Audiència pública: Educació física, salut i esport. Un dret d'avui i per a tots
1997-1998
iv Audiència pública: Ens ocupem del medi ambient per una Barcelona millor
1998-1999
v Audiència pública: Barcelona sona! Ens agrada la música?
2000-2001
vi Audiència pública: Barcelona més verda. Com volem que sigui un jardí del nostre districte?
2001-2002
vil Audiència pública: Ens movem per Barcelona. Com veiem la mobilitat en la ciutat?
2002-2003
viu Audiència pública: Com volem la Barcelona del futur? De la preservació del patrimoni a l'urbanisme del demà
</table>
</page>
</code></pre>
!t2_page164.jpg!
Revoir les étapes pour le [[PrepCorpusPEDT-TXM|corpus PEDT]] éventuellement. Sinon en résumé il y a deux choix possibles :
* CHOIX 1 : Un corpus en catalan avec uniquement les textes t1, t2, t4 + un corpus en français avec t3
* CHOIX 2 : Un corpus plus détaillé avec plusieurs fichiers par source de texte : t1_1, t1_2, voir le détails avec le fichier des métadonnées (document#170)
* CHOIX 3 : Un corpus encore plus détaillé avec un codage des titres, notes, sections à ignorer par exemple les paragraphes de présentation de l'auteur, les tableaux, les libellés dans/des graphiques, etc...
Pour l'instant je n'ai préparé que le choix 2 :
* document#171
* document#172
h2. Choix 1
h2. Choix 2
h2. Choix 3
Des infos structurant le texte, classiques dans une édition :
* titre
* sous-titre
* notes de bas de page et ancrage dans le texte pour y faire référence
* tableaux
* graphiques
pourraient facilement être isolés, repérés en utilisant un système de balises (propres à XML) comme par exemple : <title>TITRE</title>, pour marquer un titre, etc...
Un exemple de codage est donné ci-après pour la ressource : attachment:"t2_1.xml"
* id : t2_1
* text_id : T2
* titre_partie : Les audiencies publiques als nois i noies de Barcelona
* auteurs : Antonia Hernandez, Esteve Barandica
* page_deb : 161
* page_end : 165
* titre_section : L'escola en el marc de la ciutat
<pre><code>
<page id="164">
<subtitle>La resposta del consistori</subtitle>
Les propostes que els nois i noies han fet al final de cada projecte sempre han estat ateses pel consistori. Això no vol dir, òbviament, que totes arribin a fer-se realitat de manera immediata, ni en la seva totalitat. L'aplicació pràctica depèn de diversos factors, el principal dels quals és que, de vegades, es tracta de temes que no depenen ex clusivament de l'ajuntament. Tanmateix, al llarg d'aquests quinze darrers cursos, són moltes i significatives les propostes que s'han dut a terme. Sempre es procura, a les propostes dels nois i noies, retor nar informes sobre actuacions o mesures municipals.
<subtitle>Audiències a d'altres ciutats</subtitle>
Altres ciutats de Catalunya i de l'Estat espanyol han desenvolupat, els darrers anys, experiències d'audiències públiques als nois i noies. Quan el tema és compartit entre les ciutats, permet als i les nostres alumnes con trastar propostes o comprovar-ne similituds. En les audiències públiques de cada ciutat participen joves observadors d'altres ciutats. Es parteix de la idea que, davant problemàtiques comunes a diferents ciutats, es poden transmetre coneixements i compartir experiències i solucions.
<table>
CURS
TEMA
1994-1995
i Audiència pública: Mesures per a un món millor
1995-1996
n Audiència pública: La participació dels nois i les noies en la vida social de Barcelona (barri, família i escola)
1996-1997
m Audiència pública: Educació física, salut i esport. Un dret d'avui i per a tots
1997-1998
iv Audiència pública: Ens ocupem del medi ambient per una Barcelona millor
1998-1999
v Audiència pública: Barcelona sona! Ens agrada la música?
2000-2001
vi Audiència pública: Barcelona més verda. Com volem que sigui un jardí del nostre districte?
2001-2002
vil Audiència pública: Ens movem per Barcelona. Com veiem la mobilitat en la ciutat?
2002-2003
viu Audiència pública: Com volem la Barcelona del futur? De la preservació del patrimoni a l'urbanisme del demà
</table>
</page>
</code></pre>
!t2_page164.jpg!