如何从Java中的PDF文档中提取图片
#图片 #java #pdf #extract

PDF文档的图片提取是经常提供的要求。有许多支持此功能的PDF库。这些库之一是Java的免费spire.pdf。在本文中,我们将讨论如何使用Free Spire.PDF for Java从PDF文档中提取图像。

PDF-Bilder extrahieren

for Spirit.pdf for Java添加到您的程序中:

在开始之前,我们必须在程序中添加免费的spire.pdf for Java。这是为此的步骤:

  1. offiziellen Website下载免费的spire.pdf。
  2. 解压缩下载的文件,然后将库文件(.jar)保存在项目文件夹中的合适位置。
  3. 将.jar文件放入您的构建路径。 在您的Java程序中导入免费的spire.pdf库。

如何从PDF文档中提取图片

现在我们可以开始从PDF文档中提取图片。

  • 步骤1:下载您要从中提取图像的PDF文档。
  • 步骤2:通过文档的页面进行迭代。
  • 步骤3:从每个页面中提取图像并将其保存在详尽的输出目录中。

这是一个完整的Java示例,演示了该过程:

import com.spire.pdf.*;
import com.spire.pdf.graphics.*;
import java.awt.image.BufferedImage;
import java.io.File;
import javax.imageio.ImageIO;

public class ExtractImages {
    public static void main(String[] args) {
        // Laden Sie das PDF-Dokument
        PdfDocument document = new PdfDocument();
        document.loadFromFile("input.pdf");

        // Initialisierung der Bildanzahl
        int imageCount = 0;

        // Iterieren Sie durch die Seiten des Dokuments
        for (int i = 0; i < document.getPages().getCount(); i++) {
            // Abrufen der aktuellen Seite
            PdfPageBase page = document.getPages().get(i);

            // Bilder aus der aktuellen Seite extrahieren
            PdfImageCollection images = page.getImages();

            // Speichern Sie die extrahierten Bilder
            for (int j = 0; j < images.getCount(); j++) {
                BufferedImage image = images.get(j).toImage();
                File output = new File("Image_" + (++imageCount) + ".png");
                try {
                    ImageIO.write(image, "png", output);
                } catch (Exception e) {
                    e.printStackTrace();
                }
            }
        }

        // Schließen Sie das PDF-Dokument
        document.close();

        System.out.println("Images extracted successfully!");
    }
}

此代码首先是离开PDF输入文档并初始化图像计。然后,他翻转了文档的每一页,从每一侧提取图片,然后将它们作为png文件存储在当前的工作目录中。

for Spire.pdf for Java提供了许多其他功能,此外还可以从PDF文档中提取图片。这是其他六个功能: