Avoir les coordonnées du texte ou des images dans un PDF permet une annotation précise du contenu et des marques. Vous pouvez ajouter de manière programmée des commentaires, des surlignages ou d'autres indicateurs visuels à des zones spécifiques ou à des éléments du document. Cette fonctionnalité est bénéfique pour la révision collaborative de documents, l'audit de documents ou la création de présentations interactives et informatives. Dans cet article, nous explorerons comment obtenir les coordonnées du texte ou des images dans un PDF en utilisant C#.
Installer la bibliothèque requise
Avant de commencer le processus de récupération des coordonnées du texte ou des images dans un PDF, nous devons installer la bibliothèque requise. Dans cet article, nous allons utiliser Spire.PDF for .NET à cette fin.
Vous pouvez installer Spire.PDF for .NET via NuGet en suivant ces étapes :
- Ouvrez la "Package Manager Console".
- Exécutez cette commande : Install-Package Spire.PDF
Obtenir les coordonnées du texte ou des images dans un PDF avec C
Une fois que vous avez installé la bibliothèque, vous pouvez l'utiliser pour récupérer les coordonnées du texte ou des images dans votre PDF.
Exemple 1 : Obtenir les coordonnées d'un texte spécifique dans un PDF avec C#
L'exemple de code suivant montre comment obtenir les coordonnées d'un texte spécifique dans un PDF en utilisant C# et Spire.PDF for .NET :
using Spire.Pdf;
using Spire.Pdf.Texts;
using System.Drawing;
namespace GetCoordinatesOfText
{
class Program
{
static void Main(string[] args)
{
// Créez un objet PdfDocument
PdfDocument doc = new PdfDocument();
// Chargez un fichier PDF
doc.LoadFromFile("C:\\Users\\Administrator\\Desktop\\input.pdf");
// Parcourez toutes les pages
foreach (PdfPageBase page in doc.Pages)
{
// Créez un objet PdfTextFinder
PdfTextFinder finder = new PdfTextFinder(page);
// Définissez les options de recherche
PdfTextFindOptions options = new PdfTextFindOptions();
options.Parameter = TextFindParameter.IgnoreCase;
finder.Options = options;
// Trouvez toutes les instances d'un texte spécifique
List<PdfTextFragment> fragments = finder.FindAll("public");
// Parcourez les instances
foreach (PdfTextFragment fragment in fragments)
{
// Obtenez la position d'une instance spécifique
PointF position = fragment.Position;
Console.WriteLine("Coordonnées : X = " + position.X + ", Y = " + position.Y);
}
}
}
}
}
Exemple 2 : Obtenir les coordonnées d'une image dans un PDF avec C#
L'exemple de code suivant montre comment obtenir les coordonnées d'une image spécifique dans un PDF en utilisant C# et Spire.PDF for .NET :
using Spire.Pdf;
using Spire.Pdf.Images;
using System.Drawing;
namespace GetCoordinatesOfImage
{
class Program
{
static void Main(string[] args)
{
// Créez un objet PdfDocument
PdfDocument doc = new PdfDocument();
// Chargez un fichier PDF
doc.LoadFromFile("C:\\Users\\Administrator\\Desktop\\input.pdf");
// Obtenez une page spécifique
PdfPageBase page = doc.Pages[0];
// Parcourez toutes les images sur la page
foreach (PdfImage image in page.ImagesInfo)
{
// Obtenez les coordonnées X et Y d'une image spécifique
float xPos = image.Bounds.X;
float yPos = image.Bounds.Y;
Console.WriteLine("L'image est située à (X = " + xPos + ", Y = " + yPos + ")");
}
}
}
}
Conclusion
Extraire les coordonnées du texte ou des images à partir d'un PDF ouvre un monde de possibilités pour l'analyse des données et la manipulation des documents. En utilisant les exemples de code décrits dans cet article, vous pouvez récupérer automatiquement les coordonnées précises du texte et des images dans votre PDF avec C#.
Sujets connexes
- C#/VB.NET : Extraire le texte des documents PDF
- C#/VB.NET : Extraire des images d'un PDF
- C#/VB.NET : Rechercher et surligner un texte spécifique dans un PDF
- C#/VB.NET : Insérer, remplacer ou supprimer des images dans un PDF
- C#/VB.NET : Ajouter des filigranes de texte à un PDF
- C#/VB.NET : Ajouter des filigranes d'images à un PDF
Top comments (0)