Statistics
| Revision:

root / tmp / org.txm.rcp / installtreetagger_fr.html @ 377

History | View | Annotate | Download (3.7 kB)

1
<? version="1.0" encoding="UTF-8"?>
2
<html>
3
<head>
4
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8"/>
5
<title>
6
Installation de  TreeTagger
7
</title>
8
</head>
9
<body>
10
<h1>
11
Tutoriel d'installation de TreeTagger pour TXM
12
</h1>
13
<p>
14
Pour être en mesure d'automatiser l'étiquetage morphosyntaxique et la lemmatisation de votre corpus au cours du processus d'importation, 
15
vous devez installer le logiciel TreeTagger(*) et indiquer à la plate-forme TXM où il est installé. Pour cela, il vous suffit de suivre les étapes suivantes
16
(il s'agit d'une installation simplifiée - suffisante pour TXM - et non d'une installation complète du logiciel TreeTagger) : 
17
</p>
18
<ol>
19
<li>
20
Télécharger l'archive du programme TreeTagger située à : http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger
21
<ul>
22
<li>
23
Windows : <a href="ftp://ftp.ims.uni-stuttgart.de/pub/corpora/tree-tagger-windows-3.2.zip">ftp://ftp.ims.uni-stuttgart.de/pub/corpora/tree-tagger-windows-3.2.zip</a>
24
</li>
25
<li>
26
Linux : <a href="ftp://ftp.ims.uni-stuttgart.de/pub/corpora/tree-tagger-linux-3.2.tar.gz">ftp://ftp.ims.uni-stuttgart.de/pub/corpora/tree-tagger-linux-3.2.tar.gz</a>
27
</li>
28
<li>
29
Mac : <a href="ftp://ftp.ims.uni-stuttgart.de/pub/corpora/tree-tagger-MacOSX-3.2-intel.tar.gz">ftp://ftp.ims.uni-stuttgart.de/pub/corpora/tree-tagger-MacOSX-3.2-intel.tar.gz</a>
30
</li>
31
</ul>  
32
</li>
33
<li>
34
Dézipper l'archive dans un répertoire, par exemple : 
35
<p>
36
Windows : "C:\Program Files\TreeTagger"
37
<br/>
38
Linux : "/home/&lt;nom utilisateur&gt;/TreeTagger"
39
</p>
40
</li>
41
<li>
42
Télécharger un fichier de modèle de langue TreeTagger pour chaque langue que vous avez besoin d'étiqueter (au format UTF8, non ISO-Latin-1) 
43
<ul>
44
<li>
45
Modèle français UTF-8: <a href="ftp://ftp.ims.uni-stuttgart.de/pub/corpora/french-par-linux-3.2-utf8.bin.gz">ftp://ftp.ims.uni-stuttgart.de/pub/corpora/french-par-linux-3.2-utf8.bin.gz</a>
46
</li>
47
<li>
48
Modèle ancien français BFM (sans lemme) UTF-8: <a href="http://bfm.ens-lyon.fr/IMG/zip/rgaqcj.zip">http://bfm.ens-lyon.fr/IMG/zip/rgaqcj.zip</a>
49
</li>
50
<li>
51
Modèle italien UTF-8 : <a href="ftp://ftp.ims.uni-stuttgart.de/pub/corpora/italian-par-linux-3.2-utf8.bin.gz">ftp://ftp.ims.uni-stuttgart.de/pub/corpora/italian-par-linux-3.2-utf8.bin.gz</a>
52
</li>
53
</ul>
54
</li>
55
<li>
56
Décompresser et renommer chaque fichier de modèle, en «fr.par» pour le français, «it.par» pour l'italien et «afr.par» pour l'ancien français dans le répertoire de votre choix.
57
Par exemple dans un répertoire "Models" que vous créez dans le répertoire TreeTagger ci-dessus (où vous avez décompressé l'archive de TreeTagger).
58
</li>
59
<li>
60
Enfin, depuis le logiciel TXM, aller dans les préférences (menu Outils/Préférences) et modifier les champs de la page TXM / Avancé / TAL / TreeTagger
61
<ol>
62
<li>
63
Pour le champ 'TreeTagger install dir' mettre le chemin vers le répertoire où vous avez décompressé l'archive de TreeTagger
64
</li>
65
<li>
66
Pour le champ 'TreeTagger models directory' mettre le chemin vers le répertoire où vous avez mis vos fichiers de modèles (fr.par, it.par...)
67
</li>
68
</ol>
69
</li>
70
</ol>
71
<p>
72
Vous pouvez alors relancez un nouveau processus d'importation pour tester le nouvel étiqueteur.
73
</p>
74
<p>
75
Si vous ne parvenez pas aller jusqu'au bout du processus d'installation, veuillez nous contacter via 
76
la liste de diffusion des utilisateurs de TXM (txm-users@cru.fr) après vous être inscrit à l'adresse
77
<a href="https://listes.cru.fr/sympa/subscribe/txm-users">https://listes.cru.fr/sympa/subscribe/txm-users</a>.
78
</p>
79
<p>
80
(*) La licence de diffusion de TreeTagger interdit de livrer TreeTagger embarqué dans un logiciel commercial. 
81
Comme la licence de TXM n'interdit à personne d'avoir une activité commerciale avec TXM, il nous est interdit 
82
d'inclure TreeTagger dans la distribution de TXM.
83
</p>
84
</body>
85
</html>
86