DEV Community

Liam Anderson
Liam Anderson

Posted on

Comment obtenir les coordonnées du texte ou des images dans un PDF avec C#

Avoir les coordonnées du texte ou des images dans un PDF permet une annotation précise du contenu et des marques. Vous pouvez ajouter de manière programmée des commentaires, des surlignages ou d'autres indicateurs visuels à des zones spécifiques ou à des éléments du document. Cette fonctionnalité est bénéfique pour la révision collaborative de documents, l'audit de documents ou la création de présentations interactives et informatives. Dans cet article, nous explorerons comment obtenir les coordonnées du texte ou des images dans un PDF en utilisant C#.

Installer la bibliothèque requise

Avant de commencer le processus de récupération des coordonnées du texte ou des images dans un PDF, nous devons installer la bibliothèque requise. Dans cet article, nous allons utiliser Spire.PDF for .NET à cette fin.

Vous pouvez installer Spire.PDF for .NET via NuGet en suivant ces étapes :

  1. Ouvrez la "Package Manager Console".
  2. Exécutez cette commande : Install-Package Spire.PDF

Obtenir les coordonnées du texte ou des images dans un PDF avec C

Une fois que vous avez installé la bibliothèque, vous pouvez l'utiliser pour récupérer les coordonnées du texte ou des images dans votre PDF.

Exemple 1 : Obtenir les coordonnées d'un texte spécifique dans un PDF avec C#

L'exemple de code suivant montre comment obtenir les coordonnées d'un texte spécifique dans un PDF en utilisant C# et Spire.PDF for .NET :

using Spire.Pdf; 
using Spire.Pdf.Texts; 
using System.Drawing; 

namespace GetCoordinatesOfText 
{ 
    class Program 
    { 
        static void Main(string[] args) 
        { 
            // Créez un objet PdfDocument 
            PdfDocument doc = new PdfDocument(); 

            // Chargez un fichier PDF 
            doc.LoadFromFile("C:\\Users\\Administrator\\Desktop\\input.pdf"); 

            // Parcourez toutes les pages 
            foreach (PdfPageBase page in doc.Pages) 
            { 
                // Créez un objet PdfTextFinder 
                PdfTextFinder finder = new PdfTextFinder(page); 

                // Définissez les options de recherche 
                PdfTextFindOptions options = new PdfTextFindOptions(); 
                options.Parameter = TextFindParameter.IgnoreCase; 
                finder.Options = options; 

                // Trouvez toutes les instances d'un texte spécifique 
                List<PdfTextFragment> fragments = finder.FindAll("public"); 

                // Parcourez les instances 
                foreach (PdfTextFragment fragment in fragments) 
                { 
                    // Obtenez la position d'une instance spécifique 
                    PointF position = fragment.Position; 
                    Console.WriteLine("Coordonnées : X = " + position.X + ", Y = " + position.Y); 
                } 
            } 
        } 
    } 
} 
Enter fullscreen mode Exit fullscreen mode

Exemple 2 : Obtenir les coordonnées d'une image dans un PDF avec C#

L'exemple de code suivant montre comment obtenir les coordonnées d'une image spécifique dans un PDF en utilisant C# et Spire.PDF for .NET :

using Spire.Pdf; 
using Spire.Pdf.Images; 
using System.Drawing; 

namespace GetCoordinatesOfImage 
{ 
    class Program 
    { 
        static void Main(string[] args) 
        { 
            // Créez un objet PdfDocument 
            PdfDocument doc = new PdfDocument(); 

            // Chargez un fichier PDF 
            doc.LoadFromFile("C:\\Users\\Administrator\\Desktop\\input.pdf"); 

            // Obtenez une page spécifique 
            PdfPageBase page = doc.Pages[0]; 

            // Parcourez toutes les images sur la page 
            foreach (PdfImage image in page.ImagesInfo) 
            { 
                // Obtenez les coordonnées X et Y d'une image spécifique 
                float xPos = image.Bounds.X; 
                float yPos = image.Bounds.Y; 
                Console.WriteLine("L'image est située à (X = " + xPos + ", Y = " + yPos + ")"); 
            } 
        } 
    } 
} 
Enter fullscreen mode Exit fullscreen mode

Conclusion

Extraire les coordonnées du texte ou des images à partir d'un PDF ouvre un monde de possibilités pour l'analyse des données et la manipulation des documents. En utilisant les exemples de code décrits dans cet article, vous pouvez récupérer automatiquement les coordonnées précises du texte et des images dans votre PDF avec C#.

Sujets connexes

Top comments (0)