# HG changeset patch # User Patrick PIERRE # Date 1401293078 -7200 # Node ID 3fc7130d289c17ea305421945740a98899ea915e # Parent 41ba3991f7c74e68757f5812daa2742bf6a50bb8 Exemple de nettoyage de PDF diff -r 41ba3991f7c7 -r 3fc7130d289c Pdf/BaladeNature/balade_nature.ini --- a/Pdf/BaladeNature/balade_nature.ini jeu. mai 08 11:16:02 2014 +0200 +++ b/Pdf/BaladeNature/balade_nature.ini mer. mai 28 18:04:38 2014 +0200 @@ -58,13 +58,16 @@ page.3.range = 1, 2 page.3.crop = TrimBox #page.3.crop = 35.173 630.449 545.409 35.173 +page.3.sanitize = true page.3.rotation = 0 page.3.keep_byte4text = true page.3.keep_byte4image = false -page.3.toc.1 = 1> Le lynx, le chamois et la marmotte +page.3.remove_tounicode = true +page.3.remove_differences = true page.3.replace.1 = 1> prai([ri]+)e = \1vière page.3.clean.1 = 1> //svg:text[@id="text52"] page.3.clean.2 = *> //*[@id="tspan50"] +page.3.toc.1 = 1> Le lynx, le chamois et la marmotte page.4.type = pdf page.4.source = %(here)s/balade_nature.pdf @@ -72,8 +75,8 @@ page.4.crop = TrimBox page.4.keep_byte4text = true page.4.keep_byte4image = false -page.4.toc.1 = 3> Le pic-vert, le coucou, le sanglier et le cerf page.4.clean.1 = 3> //svg:tspan[.='12'] page.4.clean.2 = 3-4> //svg:text[@id="text22"] #page.4.clean.3 = 3> //svg:tspan[not(.='12')] #page.4.clean.4 = 4> //svg:tspan[@id!="tspan38" and @id!="tspan40"] +page.4.toc.1 = 3> Le pic-vert, le coucou, le sanglier et le cerf