PDF文档的图片提取是经常提供的要求。有许多支持此功能的PDF库。这些库之一是Java的免费spire.pdf。在本文中,我们将讨论如何使用Free Spire.PDF for Java从PDF文档中提取图像。
for Spirit.pdf for Java添加到您的程序中:
在开始之前,我们必须在程序中添加免费的spire.pdf for Java。这是为此的步骤:
- 从offiziellen Website下载免费的spire.pdf。
- 解压缩下载的文件,然后将库文件(.jar)保存在项目文件夹中的合适位置。
- 将.jar文件放入您的构建路径。 在您的Java程序中导入免费的spire.pdf库。
如何从PDF文档中提取图片
现在我们可以开始从PDF文档中提取图片。
- 步骤1:下载您要从中提取图像的PDF文档。
- 步骤2:通过文档的页面进行迭代。
- 步骤3:从每个页面中提取图像并将其保存在详尽的输出目录中。
这是一个完整的Java示例,演示了该过程:
import com.spire.pdf.*;
import com.spire.pdf.graphics.*;
import java.awt.image.BufferedImage;
import java.io.File;
import javax.imageio.ImageIO;
public class ExtractImages {
public static void main(String[] args) {
// Laden Sie das PDF-Dokument
PdfDocument document = new PdfDocument();
document.loadFromFile("input.pdf");
// Initialisierung der Bildanzahl
int imageCount = 0;
// Iterieren Sie durch die Seiten des Dokuments
for (int i = 0; i < document.getPages().getCount(); i++) {
// Abrufen der aktuellen Seite
PdfPageBase page = document.getPages().get(i);
// Bilder aus der aktuellen Seite extrahieren
PdfImageCollection images = page.getImages();
// Speichern Sie die extrahierten Bilder
for (int j = 0; j < images.getCount(); j++) {
BufferedImage image = images.get(j).toImage();
File output = new File("Image_" + (++imageCount) + ".png");
try {
ImageIO.write(image, "png", output);
} catch (Exception e) {
e.printStackTrace();
}
}
}
// Schließen Sie das PDF-Dokument
document.close();
System.out.println("Images extracted successfully!");
}
}
此代码首先是离开PDF输入文档并初始化图像计。然后,他翻转了文档的每一页,从每一侧提取图片,然后将它们作为png文件存储在当前的工作目录中。
for Spire.pdf for Java提供了许多其他功能,此外还可以从PDF文档中提取图片。这是其他六个功能: