Statistics
| Revision:

root / tmp / org.txm.core / res / org / txm / xml / xsl / txm-filter-teip5-xmlw-simplify.xsl @ 187

History | View | Annotate | Download (7.9 kB)

1
<?xml version="1.0"?>
2
<xsl:stylesheet
3
  xmlns:xd="http://www.pnp-software.com/XSLTdoc"
4
  xmlns:edate="http://exslt.org/dates-and-times"
5
  xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns:tei="http://www.tei-c.org/ns/1.0"
6
  exclude-result-prefixes="tei edate xd" version="2.0">
7
  
8
  <xd:doc type="stylesheet">
9
    <xd:short>
10
      Feuille de style de préparation de fichiers TEI P5 à l'importation 
11
      dans TXM en utilisant le module d'import xml-w. Permet de supprimer
12
      le contenu de teiHeader et des élements hors-texte et de supprimer
13
      les balises non utilisées dans les index TXM.
14
      Par défaut, toutes les balises sauf celles qui sont listées dans le
15
      paramètre "copyAll" sont supprimées
16
    </xd:short>
17
    <xd:detail>
18
      This stylesheet is free software; you can redistribute it and/or
19
      modify it under the terms of the GNU Lesser General Public
20
      License as published by the Free Software Foundation; either
21
      version 3 of the License, or (at your option) any later version.
22
      
23
      This stylesheet is distributed in the hope that it will be useful,
24
      but WITHOUT ANY WARRANTY; without even the implied warranty of
25
      MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
26
      Lesser General Public License for more details.
27
      
28
      You should have received a copy of GNU Lesser Public License with
29
      this stylesheet. If not, see http://www.gnu.org/licenses/lgpl.html
30
    </xd:detail>
31
    <xd:author>Alexei Lavrentiev alexei.lavrentev@ens-lyon.fr</xd:author>
32
    <xd:copyright>2012, CNRS / ICAR (ICAR3 LinCoBaTO)</xd:copyright>
33
  </xd:doc>
34
  
35

    
36
  <xsl:output method="xml" encoding="utf-8" omit-xml-declaration="no"/>
37
  
38
  <!-- Listes des balises par type de traitement. -->
39
  
40
	<!-- balises à supprimer avec leur contenu -->
41
  
42
	<xsl:param name="deleteAll">teiHeader|facsimile|note</xsl:param>
43
	
44
	<xsl:template match="*[matches(name(),concat('^',$deleteAll,'$'))]">
45
		<xsl:call-template name="deleteAll"/>
46
	</xsl:template>
47
		
48
	<!-- balises à conserver  -->
49
	<xsl:param name="copyAll">ab|body|div|front|head|lb|p|pb|s|TEI|text|w</xsl:param>
50
	
51
	<xsl:template match="*[matches(name(),concat('^',$copyAll,'$'))]">
52
		<xsl:call-template name="copyAll"></xsl:call-template>
53
	</xsl:template>
54
	
55
	<!-- balises à supprimer, contenu à conserver, c'est la règle par défaut -->  
56
	<xsl:template match="*">
57
		<xsl:call-template name="deleteTag"/>
58
	</xsl:template>
59
  
60
  <!-- balises à transformer en notes-->
61
  <!--<xsl:template match="">
62
    <xsl:call-template name="makeNote"/>
63
  </xsl:template>-->
64
  
65

    
66
  <!-- balises à transformer en W -->
67
  
68
<!--  <xsl:template match="tei:abbr[not(parent::tei:choice)]
69
    |tei:expan
70
    |tei:num[matches(.,'.')]">
71
    <xsl:call-template name="makeWord"/>
72
  </xsl:template>-->
73
  
74
  <!-- à transformer en AB typé -->
75
  
76
<!--  <xsl:template match="">
77
    <xsl:call-template name="makeAb"/>
78
  </xsl:template>
79
-->  
80
  <!-- à transformer en DIV typé -->
81
  
82
<!--  <xsl:template match="">
83
    <xsl:call-template name="makeDiv"/>
84
  </xsl:template>
85
-->
86
<!-- Partie générale : on copie les éléments, les attributs, le texte, les commentaires, on supprime mes prrocessing intstructions -->
87

    
88
  <xsl:template match="@*|comment()">
89
    <xsl:copy/>
90
  </xsl:template>
91

    
92
<xsl:template match="processing-instruction()"/>
93

    
94
<xsl:template match="text()"><xsl:value-of select="."/></xsl:template>
95

    
96
	<!-- ancien filtre pour les noeuds texte, n'est plus nécessaire pour l'import xml/w TXM 0.5 -->
97
	
98
	<!--<xsl:template match="text()">
99
  	<xsl:analyze-string select="." regex="&amp;lt;|&amp;gt;|&lt;|&gt;|-\-">
100
      <xsl:matching-substring>
101
        <xsl:choose>
102
        	<xsl:when test="matches(.,'&amp;lt;')">
103
        		<xsl:text>‹</xsl:text>
104
        	</xsl:when>
105
        	<xsl:when test="matches(.,'&amp;gt;')">
106
        		<xsl:text>›</xsl:text>
107
        	</xsl:when>
108
          <xsl:when test="matches(.,'&lt;')">
109
            <xsl:text>‹</xsl:text>
110
          </xsl:when>
111
          <xsl:when test="matches(.,'&gt;')">
112
            <xsl:text>›</xsl:text>
113
          </xsl:when>
114
          <!-\- pose problème si se trouve dans les notes transformés en commentaires xml par le tokeniseur -\->
115
          <xsl:when test="matches(.,'-\-')">
116
            <xsl:text> - </xsl:text>
117
          </xsl:when>
118
          <xsl:otherwise>
119
            <xsl:value-of select="."/>
120
          </xsl:otherwise>
121
        </xsl:choose>
122
      </xsl:matching-substring>
123
      <xsl:non-matching-substring>         
124
            <xsl:value-of select="."/>
125
      </xsl:non-matching-substring>      
126
    </xsl:analyze-string>
127
  </xsl:template>-->
128
	
129

    
130
<!-- On garde les balises utiles pour l'exploitation TXM -->
131
  
132
  <xsl:template name="copyAll">    
133
  	<xsl:copy>
134
  		<xsl:apply-templates select="*|@*|processing-instruction()|comment()|text()"/>	
135
  	</xsl:copy>
136
  </xsl:template>
137
  
138

    
139
<!-- On supprime les balises et tout ce qu'elles contiennent pour les éléments hors texte à ignorer lors de l'import -->
140
  
141
  <xsl:template name="deleteAll"/>
142

    
143
<!-- On supprime les balises non essentielles pour l'exploitation textométrique et susceptibles de poser des problèmes au tokeniseur,
144
  mais on garde leur contenu qui fait partie du matériau textuel -->
145
  
146
  <xsl:template name="deleteTag">
147
    <xsl:apply-templates/>
148
  </xsl:template>
149

    
150
<!-- on met en note les éléments hors texte qu'on aimerait garder pour l'édition, etc. -->
151
  
152
  <xsl:template name="makeNote">
153
    <note type="{local-name()}" xmlns="http://www.tei-c.org/ns/1.0">
154
      <xsl:value-of select="."/>
155
    </note>
156
  </xsl:template>
157
  
158
<!-- On supprime toutes les balises à l'intérieur des notes-->
159
<!--  <xsl:template match="tei:note">
160
    <xsl:copy>
161
      <xsl:value-of select="."></xsl:value-of>
162
    </xsl:copy>
163
  </xsl:template>
164
-->
165
  
166
<!-- On transforme en DIV typés les balises de niveau de division textuelle (pouvant contenir des p) -->
167

    
168
  <xsl:template name="makeDiv">
169
    <div type="{local-name()}" xmlns="http://www.tei-c.org/ns/1.0">
170
      <xsl:copy-of select="@*"/>
171
      <xsl:apply-templates/>
172
    </div>
173
  </xsl:template>  
174

    
175
<!-- On transforme en bloc anonyme les balises de niveau équivalent au paragraphe -->
176

    
177
  <xsl:template name="makeAb">
178
    <ab type="{local-name()}" xmlns="http://www.tei-c.org/ns/1.0">
179
      <xsl:copy-of select="@*"/>
180
      <xsl:apply-templates/>
181
    </ab>
182
  </xsl:template>
183

    
184
  <!-- on pré-tokenise les éléments équivalents à un mot -->
185
  
186
  <xsl:template name="makeWord">
187
    <xsl:variable name="wordType">
188
      <xsl:choose>
189
        <xsl:when test="@type">
190
          <xsl:value-of select="concat(local-name(),'-',@type)"/>
191
        </xsl:when>
192
        <xsl:otherwise>
193
          <xsl:value-of select="local-name()"></xsl:value-of>
194
        </xsl:otherwise>
195
      </xsl:choose>
196
    </xsl:variable>
197
    <w type="{$wordType}" xmlns="http://www.tei-c.org/ns/1.0"><xsl:apply-templates/></w>
198
  </xsl:template>  
199

    
200
<!--<xsl:template name="makeName">
201
  <xsl:variable name="nameType">
202
    <xsl:choose>
203
      <xsl:when test="@type">
204
        <xsl:choose>
205
          <xsl:when test="local-name()='name'"><xsl:value-of select='@type'/></xsl:when>
206
          <xsl:otherwise><xsl:value-of select="concat(local-name(),'-',@type)"/></xsl:otherwise>
207
        </xsl:choose>
208
      </xsl:when>
209
      <xsl:otherwise>
210
        <xsl:value-of select="local-name()"></xsl:value-of>
211
      </xsl:otherwise>
212
    </xsl:choose>
213
  </xsl:variable>
214
  <name type="{$nameType}" xmlns="http://www.tei-c.org/ns/1.0">
215
    <xsl:apply-templates/>
216
  </name>
217
</xsl:template>
218
-->
219
<!-- les l sont transformés en lb -->
220
  
221
  <xsl:template match="tei:l">
222
    <lb xmlns="http://www.tei-c.org/ns/1.0">
223
      <xsl:if test="@n">
224
        <xsl:attribute name="n"><xsl:value-of select="@n"/></xsl:attribute>
225
      </xsl:if>
226
    </lb>
227
    <xsl:apply-templates/>
228
  </xsl:template>
229
  
230

    
231
</xsl:stylesheet>