Parfois, vous n'avez besoin que de certaines pages d'un document PDF plutôt que du fichier entier. La division vous permet d'extraire et de sauvegarder uniquement les pages dont vous avez besoin, ce qui facilite le travail avec les informations pertinentes. Dans cet article, nous vous montrerons comment diviser des documents PDF en utilisant Python.
Installer la bibliothèque requise
Avant de commencer le processus de division d'un document PDF, il est essentiel d'installer la bibliothèque nécessaire. Dans cet article, nous utiliserons la bibliothèque Spire.PDF for Python, qui vous permet de créer, lire, convertir et manipuler des fichiers PDF en Python.
Pour installer cette bibliothèque, ouvrez le terminal de votre projet et exécutez la commande pip suivante :
pip install Spire.Pdf
Diviser des documents PDF avec Python
Avec Spire.PDF for Python, vous pouvez diviser un fichier PDF en plusieurs fichiers PDF d'une seule page, ainsi que diviser un PDF en fonction de plages de pages spécifiques.
Exemple 1. Diviser un fichier PDF en plusieurs fichiers PDF d'une seule page en Python
L'exemple de code suivant montre comment diviser un fichier PDF en plusieurs fichiers PDF d'une seule page en utilisant Python et Spire.PDF for Python :
from spire.pdf.common import *
from spire.pdf import *
# Créer un objet PdfDocument
doc = PdfDocument()
# Charger un fichier PDF
doc.LoadFromFile("Example.pdf")
# Diviser le fichier PDF en plusieurs fichiers PDF d'une seule page
doc.Split("Output/SplitDocument-{0}.pdf", 1)
# Fermer l'objet PdfDocument
doc.Close()
Exemple 2. Diviser un fichier PDF en fonction de plages de pages en Python
L'exemple de code suivant montre comment diviser un fichier PDF en plusieurs fichiers PDF en fonction de plages de pages en utilisant Python et Spire.PDF for Python :
from spire.pdf.common import *
from spire.pdf import *
# Créer un objet PdfDocument
doc = PdfDocument()
# Charger un fichier PDF
doc.LoadFromFile("Exemple.pdf")
# Créer trois objets PdfDocument
newDoc_1 = PdfDocument()
newDoc_2 = PdfDocument()
newDoc_3 = PdfDocument()
# Insérer la première page du fichier source dans le premier document
newDoc_1.InsertPage(doc, 0)
# Insérer les pages 2 à 4 du fichier source dans le deuxième document
newDoc_2.InsertPageRange(doc, 1, 3)
# Insérer les pages restantes du fichier source dans le troisième document
newDoc_3.InsertPageRange(doc, 4, doc.Pages.Count - 1)
# Enregistrer les trois documents
newDoc_1.SaveToFile("Output/Split-1.pdf")
newDoc_2.SaveToFile("Output/Split-2.pdf")
newDoc_3.SaveToFile("Output/Split-3.pdf")
# Fermer les objets PdfDocument
doc.Close()
newDoc_1.Close()
newDoc_2.Close()
newDoc_3.Close()
Conclusion
La division de documents PDF est une technique précieuse pour améliorer la gestion des documents et l'efficacité du flux de travail. En utilisant le code présenté dans cet article, vous pouvez facilement automatiser le processus de division des documents PDF en utilisant Python.
Top comments (0)