Statistics
| Revision:

root / tmp / org.txm.core / res / org / txm / xml / xsl / txm-filter-teifrantext-teibfm.xsl @ 187

History | View | Annotate | Download (13.6 kB)

1
<?xml version="1.0"?>
2
<xsl:stylesheet
3
  xmlns:xd="http://www.pnp-software.com/XSLTdoc"
4
  xmlns:edate="http://exslt.org/dates-and-times"
5
  xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns:tei="http://www.tei-c.org/ns/1.0"
6
  exclude-result-prefixes="tei edate xd" version="2.0">
7
  
8
  <xd:doc type="stylesheet">
9
    <xd:short>
10
      Feuille de style de préparation de fichiers TEI P5 à l'importation 
11
      dans TXM. Permet de simplifier la structure du document afin
12
      d'optimiser les index CWB
13
    </xd:short>
14
    <xd:detail>
15
      This stylesheet is free software; you can redistribute it and/or
16
      modify it under the terms of the GNU Lesser General Public
17
      License as published by the Free Software Foundation; either
18
      version 3 of the License, or (at your option) any later version.
19
      
20
      This stylesheet is distributed in the hope that it will be useful,
21
      but WITHOUT ANY WARRANTY; without even the implied warranty of
22
      MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
23
      Lesser General Public License for more details.
24
      
25
      You should have received a copy of GNU Lesser Public License with
26
      this stylesheet. If not, see http://www.gnu.org/licenses/lgpl.html
27
    </xd:detail>
28
    <xd:author>Alexei Lavrentiev alexei.lavrentev@ens-lyon.fr</xd:author>
29
    <xd:copyright>2012, CNRS / ICAR (ICAR3 LinCoBaTO)</xd:copyright>
30
  </xd:doc>
31
  
32

    
33
  <xsl:output method="xml" encoding="utf-8" omit-xml-declaration="no"/>
34
  
35
  <!--
36
    Modifications par AL le  2012-01-25
37
    g dépalacé de "deleteAll" vers "deleteTag"
38
    classe de balise "name" créée
39
    (geogName, placeName, persName et name)
40
  -->
41
  
42
  <!-- 
43
    Modifications par LBe le 2012-02-17
44
    Transformation automatique des esperluettes dans les métadonnées
45
    Suppression des balises label et heraldry
46
    Signed n'est plus transformé en ab
47
    opener est transformé en ab
48
    L'institution et le dépôt sont récupérés pour le lieu de conservation
49
  -->
50
  
51
  <!-- Modifications par AL le 2012-02-20
52
    rolename -> roleName
53
    suppression des balises surname et forename
54
  -->
55
  
56
  <!-- Modifications par LBe le 2012-03-09
57
    Automatisation du nommage des sorties
58
  -->
59
  
60
  <!-- Modification par AL le 2013-12-31 
61
      harmonisation avec la feuille de style txm-filter-teip5-teibfm.xsl
62
  -->
63
  
64
  <!-- Listes des balises par type de traitement (les templates sont plus bas) -->
65
  
66
  <!-- balises à supprimer avec leur contenu -->
67
  <xsl:template match="tei:figDesc|tei:figure|tei:fw|tei:g
68
    |tei:space|tei:titlePage ">
69
    <xsl:call-template name="deleteAll"/>
70
  </xsl:template>
71
  
72
  <!-- balises à supprimer, contenu à conserver -->  
73
  <xsl:template match="tei:add|tei:app
74
    |tei:caesura|tei:castItem|tei:castGroup[ancestor::tei:castList]
75
    |tei:castList[ancestor::tei:p]|tei:cell|tei:choice|tei:cit|tei:corr|tei:date|tei:ex
76
    |tei:forename|tei:g|tei:head[parent::tei:list]|tei:heraldry|tei:hi|tei:item|tei:label|tei:lem
77
    |tei:list[ancestor::tei:p|ancestor::tei:ab]|tei:lg[child::tei:lg|ancestor::tei:sp]
78
    |tei:p[ancestor::tei:sp]|tei:performance
79
    |tei:ref|tei:reg|tei:role|tei:roleDesc
80
    |tei:row|tei:salute|tei:signed[ancestor::tei:closer]|tei:speaker|tei:stage[ancestor::tei:p|ancestor::tei:ab]
81
    |tei:surname|tei:table[ancestor::tei:p]|tei:subst|tei:term|tei:unclear">
82
    <xsl:call-template name="deleteTag"/>
83
  </xsl:template>
84
  
85
  <!-- balises à transformer en notes-->
86
  <xsl:template match="tei:abbr[parent::tei:choice and not(ancestor::tei:note)]
87
    |tei:bibl[not(ancestor::tei:note)]
88
    |tei:del
89
    |tei:orig[parent::tei:choice and not(ancestor::tei:note)]    
90
    |tei:rdg[parent::tei:app and not(ancestor::tei:note)]
91
    |tei:sic[parent::tei:choice and not(ancestor::tei:note)]
92
    |tei:surplus[not(ancestor::tei:w)]">
93
    <xsl:call-template name="makeNote"/>
94
  </xsl:template>
95
  
96
  <!-- balises de noms à indexer -->
97
  
98
  <xsl:template match="tei:name
99
    |tei:geogName
100
    |tei:persName
101
    |tei:placeName
102
    |tei:roleName
103
    |tei:orgName">
104
    <xsl:call-template name="makeName"/>
105
  </xsl:template>
106
  
107
  <!-- à transformer en W -->
108
  
109
  <xsl:template match="tei:abbr[not(parent::tei:choice)]
110
    |tei:expan
111
    |tei:num[matches(.,'.')]">
112
    <xsl:call-template name="makeWord"/>
113
  </xsl:template>
114
  
115
  <!-- à transformer en AB typé -->
116
  
117
  <xsl:template match="tei:byline|tei:lg[not(child::tei:lg or ancestor::tei:sp)]|tei:list[not(ancestor::tei:p|ancestor::tei:ab)]
118
    |tei:closer|tei:opener|tei:sp|tei:castGroup[not(ancestor::tei:castList)]|tei:castList[not(ancestor::tei:p)]
119
    |tei:signed[not(ancestor::tei:closer)]
120
    |tei:stage[not(ancestor::tei:p|ancestor::tei:ab)]
121
    |tei:table[not(ancestor::tei:p)]
122
    |tei:trailer">
123
    <xsl:call-template name="makeAb"/>
124
  </xsl:template>
125
  
126
  <!-- à transformer en DIV typé -->
127
  
128
  <xsl:template match="tei:set">
129
    <xsl:call-template name="makeDiv"/>
130
  </xsl:template>
131

    
132
<!-- Partie générale : on copie les éléments, les attributs, le texte, les commentaires, on supprime mes prrocessing intstructions -->
133

    
134
<!--  <xsl:template match="/">
135
      <xsl:apply-templates/>  
136
  </xsl:template>
137
-->
138
  
139
  <xsl:template match="*">    
140
    <xsl:choose>
141
      <xsl:when test="namespace-uri()=''">
142
        <xsl:element namespace="http://www.tei-c.org/ns/1.0" name="{local-name(.)}">
143
          <xsl:apply-templates select="*|@*|processing-instruction()|comment()|text()"/>
144
        </xsl:element>
145
      </xsl:when>
146
      <xsl:otherwise>
147
        <xsl:copy>
148
          <xsl:apply-templates select="*|@*|processing-instruction()|comment()|text()"/>
149
        </xsl:copy>
150
      </xsl:otherwise>
151
    </xsl:choose>  
152
  </xsl:template>
153

    
154
  <xsl:template match="@*|comment()">
155
    <xsl:copy/>
156
  </xsl:template>
157

    
158
  <xsl:template match="text()">
159
    <xsl:analyze-string select="." regex="&amp;|&lt;|&gt;|--|\*(\w+)">
160
      <xsl:matching-substring>
161
        <xsl:choose>
162
          <xsl:when test="matches(.,'&amp;')">
163
            <expan xmlns="http://www.tei-c.org/ns/1.0">et</expan>
164
          </xsl:when>
165
          <xsl:when test="matches(.,'&lt;')">
166
            <xsl:text>[</xsl:text>
167
          </xsl:when>
168
          <xsl:when test="matches(.,'&gt;')">
169
            <xsl:text>]</xsl:text>
170
          </xsl:when>
171
          <!-- pose problème si se trouve dans les notes transformés en commentaires xml par le tokeniseur -->
172
          <xsl:when test="matches(.,'--')">
173
            <xsl:text> - </xsl:text>
174
          </xsl:when>
175
          <!-- Spécial FRANTEXT -->
176
          <xsl:when test="matches(.,'\*(\w+)')">
177
            <name xmlns="http://www.tei-c.org/ns/1.0" type="maj"><xsl:value-of select="regex-group(1)"/></name>        		
178
          </xsl:when>          
179
          <xsl:otherwise>
180
            <xsl:value-of select="."/>
181
          </xsl:otherwise>
182
        </xsl:choose>
183
      </xsl:matching-substring>
184
      <xsl:non-matching-substring>         
185
        <xsl:value-of select="."/>
186
      </xsl:non-matching-substring>      
187
    </xsl:analyze-string>
188
  </xsl:template>
189
  
190

    
191
  <xsl:template match="processing-instruction()"/>
192

    
193
<!-- On ne touche pas au teiHeader -->
194
  
195
  <xsl:template match="tei:teiHeader">    
196
      <xsl:copy-of select="."/>    
197
  </xsl:template>
198

    
199
<!-- On supprime les balises et tout ce qu'elles contiennent pour les éléments hors texte à ignorer lors de l'import -->
200
  
201
  <xsl:template name="deleteAll"/>
202

    
203
<!-- On supprime les balises non essentielles pour l'exploitation textométrique et susceptibles de poser des problèmes au tokeniseur,
204
  mais on garde leur contenu qui fait partie du matériau textuel -->
205
  
206
  <xsl:template name="deleteTag">
207
    <xsl:apply-templates/>
208
  </xsl:template>
209

    
210
<!-- on met en note les éléments hors texte qu'on aimerait garder pour l'édition, etc. -->
211
  
212
  <xsl:template name="makeNote">
213
    <note type="{local-name()}" xmlns="http://www.tei-c.org/ns/1.0">
214
      <xsl:apply-templates select="text()"/>
215
    </note>
216
  </xsl:template>
217
  
218
<!-- On supprime toutes les balises à l'intérieur des notes-->
219
  <xsl:template match="tei:note">
220
    <xsl:copy>
221
      <xsl:apply-templates select="text()"/>
222
    </xsl:copy>
223
  </xsl:template>
224

    
225
<!-- On transforme en DIV typés les balises de niveau de division textuelle (pouvant contenir des p) -->
226

    
227
  <xsl:template name="makeDiv">
228
    <div type="{local-name()}" xmlns="http://www.tei-c.org/ns/1.0">
229
      <xsl:copy-of select="@*"/>
230
      <xsl:apply-templates/>
231
    </div>
232
  </xsl:template>  
233

    
234
<!-- On transforme en bloc anonyme les balises de niveau équivalent au paragraphe -->
235

    
236
  <xsl:template name="makeAb">
237
    <ab type="{local-name()}" xmlns="http://www.tei-c.org/ns/1.0">
238
      <xsl:copy-of select="@*"/>
239
      <xsl:apply-templates/>
240
    </ab>
241
  </xsl:template>
242

    
243
  <!-- on pré-tokenise les éléments équivalents à un mot -->
244
  
245
  <xsl:template name="makeWord">
246
    <xsl:variable name="wordType">
247
      <xsl:choose>
248
        <xsl:when test="@type">
249
          <xsl:value-of select="concat(local-name(),'-',@type)"/>
250
        </xsl:when>
251
        <xsl:otherwise>
252
          <xsl:value-of select="local-name()"></xsl:value-of>
253
        </xsl:otherwise>
254
      </xsl:choose>
255
    </xsl:variable>
256
    <xsl:choose>
257
      <xsl:when test="descendant::tei:w or ancestor::tei:w">
258
<!--            <xsl:element namespace="http://www.tei-c.org/ns/1.0" name="seg">
259
              <xsl:attribute name="type"><xsl:value-of select="local-name(.)"/></xsl:attribute>
260
              <xsl:apply-templates select="*|@*[not(name()='type')]|processing-instruction()|comment()|text()"/>
261
            </xsl:element>
262
-->
263
        <xsl:apply-templates/> <!-- on supprime ces balises pour éviter la réduplication des mots-->
264
      </xsl:when>
265
      <xsl:otherwise>
266
        <w type="{$wordType}" xmlns="http://www.tei-c.org/ns/1.0"><xsl:apply-templates/></w>
267
      </xsl:otherwise>
268
    </xsl:choose>    
269
  </xsl:template>  
270

    
271
<xsl:template name="makeName">
272
  <xsl:variable name="nameType">
273
    <xsl:choose>
274
      <xsl:when test="@type">
275
        <xsl:choose>
276
          <xsl:when test="local-name()='name'"><xsl:value-of select='@type'/></xsl:when>
277
          <xsl:otherwise><xsl:value-of select="concat(local-name(),'-',@type)"/></xsl:otherwise>
278
        </xsl:choose>
279
      </xsl:when>
280
      <xsl:otherwise>
281
        <xsl:value-of select="local-name()"></xsl:value-of>
282
      </xsl:otherwise>
283
    </xsl:choose>
284
  </xsl:variable>
285
  <name type="{$nameType}" xmlns="http://www.tei-c.org/ns/1.0">
286
    <xsl:apply-templates/>
287
  </name>
288
</xsl:template>
289

    
290
<!-- les l sont transformés en lb -->
291
  
292
  <xsl:template match="tei:l">
293
    <lb xmlns="http://www.tei-c.org/ns/1.0">
294
      <xsl:if test="@n">
295
        <xsl:attribute name="n"><xsl:value-of select="@n"/></xsl:attribute>
296
      </xsl:if>
297
    </lb>
298
    <xsl:apply-templates/>
299
  </xsl:template>
300
  
301

    
302
<!-- On met la ponctuation forte à l'extérieur de la balise foreign :
303
Cet élément sera toujours à l'intérieur d'une phrase. Attention au risque
304
de perdre les balises éventuelles à l'intérieur-->
305
  
306
  <xsl:template
307
    match="tei:foreign[not(contains(@rend,'multi_s'))][matches(.,'[.!?]')]">
308
    <xsl:variable name="lang">
309
      <xsl:choose>
310
        <xsl:when test="@lang"><xsl:value-of select="@lang"/></xsl:when>
311
        <xsl:when test="@xml:lang"><xsl:value-of select="@xml:lang"/></xsl:when>
312
        <xsl:otherwise>xx</xsl:otherwise>
313
      </xsl:choose>
314
    </xsl:variable>
315
    <xsl:for-each select="child::node()">
316
      <xsl:choose>
317
        <xsl:when test="self::text()">
318
          <xsl:analyze-string select="." regex="([^.!?]*)([.?!]+)">
319
            <xsl:matching-substring>
320
              <xsl:element name="foreign" namespace="http://www.tei-c.org/ns/1.0">
321
                <xsl:attribute name="lang"><xsl:value-of select="$lang"/></xsl:attribute>
322
                <xsl:analyze-string select="regex-group(1)" regex="&amp;">
323
                  <xsl:matching-substring><expan xmlns="http://www.tei-c.org/ns/1.0">et</expan></xsl:matching-substring>
324
                  <xsl:non-matching-substring>         
325
                    <xsl:value-of select="."/>
326
                  </xsl:non-matching-substring>      
327
                </xsl:analyze-string>
328
              </xsl:element>
329
              <xsl:value-of select="regex-group(2)"/>
330
              <xsl:text> </xsl:text>
331
            </xsl:matching-substring>
332
            <xsl:non-matching-substring>
333
              <xsl:analyze-string select="." regex="&amp;">
334
                <xsl:matching-substring><expan xmlns="http://www.tei-c.org/ns/1.0">et</expan></xsl:matching-substring>
335
                <xsl:non-matching-substring>         
336
                  <xsl:value-of select="."/>
337
                </xsl:non-matching-substring>      
338
              </xsl:analyze-string>              
339
            </xsl:non-matching-substring>
340
          </xsl:analyze-string>          
341
        </xsl:when>
342
        <xsl:when test="self::*[not(descendant::text())]">
343
          <xsl:apply-templates/>
344
        </xsl:when>
345
        <xsl:otherwise>
346
          <xsl:element name="foreign" namespace="http://www.tei-c.org/ns/1.0">
347
            <xsl:attribute name="lang"><xsl:value-of select="$lang"/></xsl:attribute>
348
            <xsl:apply-templates select="."/>          
349
          </xsl:element>
350
        </xsl:otherwise>
351
      </xsl:choose>
352
    </xsl:for-each>
353
  </xsl:template>
354
  
355
  
356
  <xsl:template name="persname">
357
      <xsl:choose>
358
         <xsl:when test="tei:surname"><xsl:value-of select="tei:forename"/>&#160;<xsl:value-of select="tei:surname"/></xsl:when>
359
         <xsl:otherwise><xsl:value-of select="."/></xsl:otherwise>
360
      </xsl:choose>
361
   </xsl:template>
362

    
363
</xsl:stylesheet>