Wiki
Version 8 (Severine Gedzelman, 17/10/2018 11:21)
1 | 1 | Severine Gedzelman | h1. Wiki |
---|---|---|---|
2 | 1 | Severine Gedzelman | |
3 | 2 | Severine Gedzelman | h2. Récupération des données du fichier PDF |
4 | 2 | Severine Gedzelman | |
5 | 2 | Severine Gedzelman | h3. Utilisation du service OCR d'Huma-Num |
6 | 2 | Severine Gedzelman | |
7 | 2 | Severine Gedzelman | * avec Filezilla, placer dans le dossier "ocr" de l'espace commun : triangle@mygrid.huma-num.fr, le fichier pdf source |
8 | 2 | Severine Gedzelman | |
9 | 2 | Severine Gedzelman | * puis en ligne de commande, exécuter ainsi : |
10 | 2 | Severine Gedzelman | |
11 | 2 | Severine Gedzelman | <pre><code> |
12 | 2 | Severine Gedzelman | $ ssh triangle@mygrid.huma-num.fr |
13 | 2 | Severine Gedzelman | $ abbyyocr11 -rl French -if GLH-Pub_Fonciere-bureau1et2_pages2-3.pdf -f XML -of test2-fr.xml |
14 | 2 | Severine Gedzelman | |
15 | 2 | Severine Gedzelman | puis en local : |
16 | 2 | Severine Gedzelman | $ scp -p 22 triangle@mygrid.huma-num.fr:~/ocr/test2-fr.xml Documents/workspaceGit/FrancoisRobert/output/ |
17 | 2 | Severine Gedzelman | </code></pre> |
18 | 2 | Severine Gedzelman | |
19 | 2 | Severine Gedzelman | h2. Conception du modèle des données |
20 | 3 | Francois Robert | |
21 | 8 | Severine Gedzelman | Francois a commencé à faire de la saisie et propose ce modèle de données pour le fichier excel. |
22 | 8 | Severine Gedzelman | |
23 | 7 | Severine Gedzelman | |_. Nom colonne excel Francois |_. Variable code python |_. valeur exemple |_. remarque ou texte qui précède dans le pdf| |
24 | 1 | Severine Gedzelman | | Bureau | office | 1 (default value) | | |
25 | 6 | Severine Gedzelman | | num | ordernum | 105 | _N° d'ordre:_ | |
26 | 4 | Severine Gedzelman | | Fichier | file | 1b (default value) | | |
27 | 5 | Severine Gedzelman | | année acte | year | 2009 | laquelle parmi celles-ci : _Date de dépôt_, _Référence d'enliassement_, _Date de l'acte_ | |
28 | 4 | Severine Gedzelman | | nature simplifiée | | | | |
29 | 6 | Severine Gedzelman | | nature acte | nature | voir liste ci-après | _Nature de l'acte:_ | |
30 | 5 | Severine Gedzelman | | Donateur | donator | COURLY (acronyme de F.) | | |
31 | 5 | Severine Gedzelman | | Donataire | beneficiary | GLH (acronyme de F.) | | |
32 | 4 | Severine Gedzelman | | Montant | sum | 56 160 | uniquement quand il y a eu une *vente* | |
33 | 4 | Severine Gedzelman | | Cadastre | registry | AO 25 | uniquement quand il y a eu un *bail* ou une *vente*| |
34 | 4 | Severine Gedzelman | | Localisation | localization | 69001 | uniquement quand il y a eu un *bail* ou une *vente* | |
35 | 6 | Severine Gedzelman | | Notes | notes | 55 ans, 53 450 € après la 40e année (synthèse de F.)| _Complément:_ | |
36 | 1 | Severine Gedzelman | |
37 | 4 | Severine Gedzelman | Liste des options possibles pour la nature de l'acte : |
38 | 4 | Severine Gedzelman | * BAIL EMPHYTEOTIQUE, |
39 | 4 | Severine Gedzelman | * CONSTITUTION DE SERVITUDES, |
40 | 4 | Severine Gedzelman | * CORRECTION DE FORMALITE, |
41 | 4 | Severine Gedzelman | * VENTE, CHANGEMENT DE DENOMINATION, |
42 | 4 | Severine Gedzelman | * ETAT DESCRIPTIF DE DIVISION EN VOLUMES, |
43 | 4 | Severine Gedzelman | * BAIL A CONSTRUCTION, INFIRMATION DE MISE EN INSTANCE DE REJET, |
44 | 4 | Severine Gedzelman | * EMPHYTEOSE, |
45 | 1 | Severine Gedzelman | * VENTE ET ANNULATION EDD, |
46 | 1 | Severine Gedzelman | * etc. |
47 | 4 | Severine Gedzelman | |
48 | 4 | Severine Gedzelman | h2. Script pour attraper les données |
49 | 4 | Severine Gedzelman | |
50 | 4 | Severine Gedzelman | |
51 | 4 | Severine Gedzelman | Quand |
52 | 4 | Severine Gedzelman | * vente, chercher *un prix* et regarder les compléments |
53 | 4 | Severine Gedzelman | * bail (à construire, emphytéotique) ou emphytéose, chercher *une durée* |
54 | 4 | Severine Gedzelman | |
55 | 4 | Severine Gedzelman | |
56 | 4 | Severine Gedzelman | Attention il peut y avoir plusieurs Dispositions, Disposants, Bénéficiaires/donataires et Immeubles et Lots. |