Statistics
| Revision:

root / tmp / org.txm.core / res / org / txm / xml / xsl / txm-filter-teip5-teibfm.xsl @ 187

History | View | Annotate | Download (13.7 kB)

1
<?xml version="1.0"?>
2
<xsl:stylesheet
3
  xmlns:xd="http://www.pnp-software.com/XSLTdoc"
4
  xmlns:edate="http://exslt.org/dates-and-times"
5
  xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns:tei="http://www.tei-c.org/ns/1.0"
6
  exclude-result-prefixes="tei edate xd" version="2.0">
7
  
8
  <xd:doc type="stylesheet">
9
    <xd:short>
10
      Feuille de style de préparation de fichiers TEI P5 à l'importation 
11
      dans TXM. Permet de simplifier la structure du document afin
12
      d'optimiser les index CWB
13
    </xd:short>
14
    <xd:detail>
15
      This stylesheet is free software; you can redistribute it and/or
16
      modify it under the terms of the GNU Lesser General Public
17
      License as published by the Free Software Foundation; either
18
      version 3 of the License, or (at your option) any later version.
19
      
20
      This stylesheet is distributed in the hope that it will be useful,
21
      but WITHOUT ANY WARRANTY; without even the implied warranty of
22
      MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
23
      Lesser General Public License for more details.
24
      
25
      You should have received a copy of GNU Lesser Public License with
26
      this stylesheet. If not, see http://www.gnu.org/licenses/lgpl.html
27
    </xd:detail>
28
    <xd:author>Alexei Lavrentiev alexei.lavrentev@ens-lyon.fr</xd:author>
29
    <xd:copyright>2012, CNRS / ICAR (ICAR3 LinCoBaTO)</xd:copyright>
30
  </xd:doc>
31
  
32

    
33
  <xsl:output method="xml" encoding="utf-8" omit-xml-declaration="no"/>
34
  
35
  <!--
36
    Modifications par AL le  2012-01-25
37
    g dépalacé de "deleteAll" vers "deleteTag"
38
    classe de balise "name" créée
39
    (geogName, placeName, persName et name)
40
  -->
41
  
42
  <!-- 
43
    Modifications par LBe le 2012-02-17
44
    Transformation automatique des esperluettes dans les métadonnées
45
    Suppression des balises label et heraldry
46
    Signed n'est plus transformé en ab
47
    opener est transformé en ab
48
    L'institution et le dépôt sont récupérés pour le lieu de conservation
49
  -->
50
  
51
  <!-- Modifications par AL le 2012-02-20
52
    rolename -> roleName
53
    suppression des balises surname et forename
54
  -->
55
  
56
  <!-- Modifications par LBe le 2012-03-09
57
    Automatisation du nommage des sorties
58
  -->
59
  
60
  <!-- Listes des balises par type de traitement (les templates sont plus bas) -->
61
  
62
  <!-- balises à supprimer avec leur contenu -->
63
  <xsl:template match="tei:figDesc|tei:figure|tei:fw|tei:g
64
    |tei:space|tei:titlePage ">
65
    <xsl:call-template name="deleteAll"/>
66
  </xsl:template>
67
  
68
  <!-- balises à supprimer, contenu à conserver -->  
69
  <xsl:template match="tei:add|tei:app
70
    |tei:caesura|tei:castItem|tei:castGroup[ancestor::tei:castList]
71
    |tei:castList[ancestor::tei:p]|tei:cell|tei:choice|tei:cit|tei:corr|tei:date|tei:ex
72
    |tei:forename|tei:g|tei:head[parent::tei:list]|tei:heraldry|tei:hi|tei:item|tei:label|tei:lem
73
    |tei:list[ancestor::tei:p|ancestor::tei:ab]|tei:lg[child::tei:lg|ancestor::tei:sp]
74
    |tei:p[ancestor::tei:sp]|tei:performance
75
    |tei:ref|tei:reg|tei:role|tei:roleDesc
76
    |tei:row|tei:salute|tei:signed[ancestor::tei:closer]|tei:speaker|tei:stage[ancestor::tei:p|ancestor::tei:ab]
77
    |tei:surname|tei:table[ancestor::tei:p]|tei:subst|tei:term|tei:unclear">
78
    <xsl:call-template name="deleteTag"/>
79
  </xsl:template>
80
  
81
  <!-- balises à transformer en notes-->
82
  <xsl:template match="tei:abbr[parent::tei:choice and not(ancestor::tei:note)]
83
    |tei:bibl[not(ancestor::tei:note)]
84
    |tei:del
85
    |tei:orig[parent::tei:choice and not(ancestor::tei:note)]    
86
    |tei:rdg[parent::tei:app and not(ancestor::tei:note)]
87
    |tei:sic[parent::tei:choice and not(ancestor::tei:note)]
88
    |tei:surplus[not(ancestor::tei:w)]">
89
    <xsl:call-template name="makeNote"/>
90
  </xsl:template>
91
  
92
  <!-- balises de noms à indexer -->
93
  
94
  <xsl:template match="tei:name
95
    |tei:geogName
96
    |tei:persName
97
    |tei:placeName
98
    |tei:roleName
99
    |tei:orgName">
100
    <xsl:call-template name="makeName"/>
101
  </xsl:template>
102
  
103
  <!-- à transformer en W -->
104
  
105
  <xsl:template match="tei:abbr[not(parent::tei:choice)]
106
    |tei:expan
107
    |tei:num[matches(.,'.')]">
108
    <xsl:call-template name="makeWord"/>
109
  </xsl:template>
110
  
111
  <!-- à transformer en AB typé -->
112
  
113
  <xsl:template match="tei:byline|tei:lg[not(child::tei:lg or ancestor::tei:sp)]|tei:list[not(ancestor::tei:p|ancestor::tei:ab)]
114
    |tei:closer|tei:opener|tei:sp|tei:castGroup[not(ancestor::tei:castList)]|tei:castList[not(ancestor::tei:p)]
115
    |tei:signed[not(ancestor::tei:closer)]
116
    |tei:stage[not(ancestor::tei:p|ancestor::tei:ab)]
117
    |tei:table[not(ancestor::tei:p)]
118
    |tei:trailer">
119
    <xsl:call-template name="makeAb"/>
120
  </xsl:template>
121
  
122
  <!-- à transformer en DIV typé -->
123
  
124
  <xsl:template match="tei:set">
125
    <xsl:call-template name="makeDiv"/>
126
  </xsl:template>
127

    
128
<!-- Partie générale : on copie les éléments, les attributs, le texte, les commentaires, on supprime mes prrocessing intstructions -->
129

    
130
<!--  <xsl:template match="/">
131
      <xsl:apply-templates/>  
132
  </xsl:template>
133
-->
134
  
135
  <xsl:template match="*">    
136
    <xsl:choose>
137
      <xsl:when test="namespace-uri()=''">
138
        <xsl:element namespace="http://www.tei-c.org/ns/1.0" name="{local-name(.)}">
139
          <xsl:apply-templates select="*|@*|processing-instruction()|comment()|text()"/>
140
        </xsl:element>
141
      </xsl:when>
142
      <xsl:otherwise>
143
        <xsl:copy>
144
          <xsl:apply-templates select="*|@*|processing-instruction()|comment()|text()"/>
145
        </xsl:copy>
146
      </xsl:otherwise>
147
    </xsl:choose>  
148
  </xsl:template>
149

    
150
  <xsl:template match="@*|comment()">
151
    <xsl:copy/>
152
  </xsl:template>
153

    
154
  <xsl:template match="text()">
155
    <xsl:analyze-string select="." regex="&amp;|&lt;|&gt;|--|\*(\w+)">
156
      <xsl:matching-substring>
157
        <xsl:choose>
158
          <xsl:when test="matches(.,'&amp;')">
159
            <expan xmlns="http://www.tei-c.org/ns/1.0">et</expan>
160
          </xsl:when>
161
          <xsl:when test="matches(.,'&lt;')">
162
            <xsl:text>[</xsl:text>
163
          </xsl:when>
164
          <xsl:when test="matches(.,'&gt;')">
165
            <xsl:text>]</xsl:text>
166
          </xsl:when>
167
          <!-- pose problème si se trouve dans les notes transformés en commentaires xml par le tokeniseur -->
168
          <xsl:when test="matches(.,'--')">
169
            <xsl:text> - </xsl:text>
170
          </xsl:when>
171
<!--          <!-\- Spécial FRANTEXT -\->
172
          <xsl:when test="matches(.,'\*(\w+)')">
173
            <name xmlns="http://www.tei-c.org/ns/1.0" type="maj"><xsl:value-of select="regex-group(1)"/></name>        		
174
          </xsl:when>          -->
175
          <xsl:otherwise>
176
            <xsl:value-of select="."/>
177
          </xsl:otherwise>
178
        </xsl:choose>
179
      </xsl:matching-substring>
180
      <xsl:non-matching-substring>         
181
        <xsl:value-of select="."/>
182
      </xsl:non-matching-substring>      
183
    </xsl:analyze-string>
184
  </xsl:template>
185
  
186

    
187
  <xsl:template match="processing-instruction()"/>
188

    
189
<!-- On ne touche pas au teiHeader -->
190
  
191
  <xsl:template match="tei:teiHeader">    
192
      <xsl:copy-of select="."/>    
193
  </xsl:template>
194

    
195
<!-- On supprime les balises et tout ce qu'elles contiennent pour les éléments hors texte à ignorer lors de l'import -->
196
  
197
  <xsl:template name="deleteAll"/>
198

    
199
<!-- On supprime les balises non essentielles pour l'exploitation textométrique et susceptibles de poser des problèmes au tokeniseur,
200
  mais on garde leur contenu qui fait partie du matériau textuel -->
201
  
202
  <xsl:template name="deleteTag">
203
    <xsl:apply-templates/>
204
  </xsl:template>
205

    
206
<!-- on met en note les éléments hors texte qu'on aimerait garder pour l'édition, etc. -->
207
  
208
  <xsl:template name="makeNote">
209
    <note type="{local-name()}" xmlns="http://www.tei-c.org/ns/1.0">
210
      <xsl:apply-templates select="text()"/>
211
    </note>
212
  </xsl:template>
213
  
214
<!-- On supprime toutes les balises à l'intérieur des notes-->
215
  <xsl:template match="tei:note">
216
    <xsl:copy>
217
      <xsl:apply-templates select="text()"/>
218
    </xsl:copy>
219
  </xsl:template>
220

    
221
<!-- On transforme en DIV typés les balises de niveau de division textuelle (pouvant contenir des p) -->
222

    
223
  <xsl:template name="makeDiv">
224
    <div type="{local-name()}" xmlns="http://www.tei-c.org/ns/1.0">
225
      <xsl:copy-of select="@*"/>
226
      <xsl:apply-templates/>
227
    </div>
228
  </xsl:template>  
229

    
230
<!-- On transforme en bloc anonyme les balises de niveau équivalent au paragraphe -->
231

    
232
  <xsl:template name="makeAb">
233
    <ab type="{local-name()}" xmlns="http://www.tei-c.org/ns/1.0">
234
      <xsl:copy-of select="@*"/>
235
      <xsl:apply-templates/>
236
    </ab>
237
  </xsl:template>
238

    
239
  <!-- on pré-tokenise les éléments équivalents à un mot -->
240
  
241
  <xsl:template name="makeWord">
242
    <xsl:variable name="wordType">
243
      <xsl:choose>
244
        <xsl:when test="@type">
245
          <xsl:value-of select="concat(local-name(),'-',@type)"/>
246
        </xsl:when>
247
        <xsl:otherwise>
248
          <xsl:value-of select="local-name()"></xsl:value-of>
249
        </xsl:otherwise>
250
      </xsl:choose>
251
    </xsl:variable>
252
    <xsl:choose>
253
      <xsl:when test="descendant::tei:w or ancestor::tei:w">
254
<!--            <xsl:element namespace="http://www.tei-c.org/ns/1.0" name="seg">
255
              <xsl:attribute name="type"><xsl:value-of select="local-name(.)"/></xsl:attribute>
256
              <xsl:apply-templates select="*|@*[not(name()='type')]|processing-instruction()|comment()|text()"/>
257
            </xsl:element>
258
-->
259
        <xsl:apply-templates/> <!-- on supprime ces balises pour éviter la réduplication des mots-->
260
      </xsl:when>
261
      <xsl:otherwise>
262
        <w type="{$wordType}" xmlns="http://www.tei-c.org/ns/1.0"><xsl:apply-templates/></w>
263
      </xsl:otherwise>
264
    </xsl:choose>    
265
  </xsl:template>  
266

    
267
<xsl:template name="makeName">
268
  <xsl:variable name="nameType">
269
    <xsl:choose>
270
      <xsl:when test="@type">
271
        <xsl:choose>
272
          <xsl:when test="local-name()='name'"><xsl:value-of select='@type'/></xsl:when>
273
          <xsl:otherwise><xsl:value-of select="concat(local-name(),'-',@type)"/></xsl:otherwise>
274
        </xsl:choose>
275
      </xsl:when>
276
      <xsl:otherwise>
277
        <xsl:value-of select="local-name()"></xsl:value-of>
278
      </xsl:otherwise>
279
    </xsl:choose>
280
  </xsl:variable>
281
  <name type="{$nameType}" xmlns="http://www.tei-c.org/ns/1.0">
282
    <xsl:apply-templates/>
283
  </name>
284
</xsl:template>
285

    
286
<!-- les l sont transformés en lb -->
287
  
288
  <xsl:template match="tei:l">
289
    <lb xmlns="http://www.tei-c.org/ns/1.0">
290
      <xsl:if test="@n">
291
        <xsl:attribute name="n"><xsl:value-of select="@n"/></xsl:attribute>
292
      </xsl:if>
293
    </lb>
294
    <xsl:apply-templates/>
295
  </xsl:template>
296
  
297

    
298
<!-- On met la ponctuation forte à l'extérieur de la balise foreign :
299
Cet élément sera toujours à l'intérieur d'une phrase. Attention au risque
300
de perdre les balises éventuelles à l'intérieur-->
301
  
302
  <xsl:template
303
    match="tei:foreign[not(contains(@rend,'multi_s'))][matches(.,'[.!?]')]">
304
    <xsl:variable name="lang">
305
      <xsl:choose>
306
        <xsl:when test="@lang"><xsl:value-of select="@lang"/></xsl:when>
307
        <xsl:when test="@xml:lang"><xsl:value-of select="@xml:lang"/></xsl:when>
308
        <xsl:otherwise>xx</xsl:otherwise>
309
      </xsl:choose>
310
    </xsl:variable>
311
    <xsl:for-each select="child::node()">
312
      <xsl:choose>
313
        <xsl:when test="self::text()">
314
          <xsl:analyze-string select="." regex="([^.!?]*)([.?!]+)">
315
            <xsl:matching-substring>
316
              <xsl:element name="foreign" namespace="http://www.tei-c.org/ns/1.0">
317
                <xsl:attribute name="lang"><xsl:value-of select="$lang"/></xsl:attribute>
318
                <xsl:analyze-string select="regex-group(1)" regex="&amp;">
319
                  <xsl:matching-substring><expan xmlns="http://www.tei-c.org/ns/1.0">et</expan></xsl:matching-substring>
320
                  <xsl:non-matching-substring>         
321
                    <xsl:value-of select="."/>
322
                  </xsl:non-matching-substring>      
323
                </xsl:analyze-string>
324
              </xsl:element>
325
              <xsl:value-of select="regex-group(2)"/>
326
              <xsl:text> </xsl:text>
327
            </xsl:matching-substring>
328
            <xsl:non-matching-substring>
329
              <xsl:analyze-string select="." regex="&amp;">
330
                <xsl:matching-substring><expan xmlns="http://www.tei-c.org/ns/1.0">et</expan></xsl:matching-substring>
331
                <xsl:non-matching-substring>         
332
                  <xsl:value-of select="."/>
333
                </xsl:non-matching-substring>      
334
              </xsl:analyze-string>              
335
            </xsl:non-matching-substring>
336
          </xsl:analyze-string>          
337
        </xsl:when>
338
        <xsl:when test="self::*[not(descendant::text())]">
339
          <xsl:apply-templates/>
340
        </xsl:when>
341
        <xsl:otherwise>
342
          <xsl:element name="foreign" namespace="http://www.tei-c.org/ns/1.0">
343
            <xsl:attribute name="lang"><xsl:value-of select="$lang"/></xsl:attribute>
344
            <xsl:apply-templates select="."/>          
345
          </xsl:element>
346
        </xsl:otherwise>
347
      </xsl:choose>
348
    </xsl:for-each>
349
  </xsl:template>
350
  
351
  
352
  <xsl:template name="persname">
353
      <xsl:choose>
354
         <xsl:when test="tei:surname"><xsl:value-of select="tei:forename"/>&#160;<xsl:value-of select="tei:surname"/></xsl:when>
355
         <xsl:otherwise><xsl:value-of select="."/></xsl:otherwise>
356
      </xsl:choose>
357
   </xsl:template>
358
  
359
  
360
<!--  <!-\- traitement spécifique anciennes étiquettes bfm -\->
361
  <xsl:template match="tei:w/@type[contains(.,'_')]">
362
    <xsl:attribute name="type"><xsl:value-of select="substring-before(.,'_')"/></xsl:attribute>
363
  </xsl:template>
364
-->
365
</xsl:stylesheet>