DEV Community

SirOnly
SirOnly

Posted on

[Python] Einfache Batch-Konvertierung von Word-Dokumenten in PDF

Word-Dateien (Doc, Docx) und PDF-Dateien sind weit verbreitete Dokumentformate. Das Word-Dokumentformat hat offensichtliche Vorteile bei der Bearbeitung von Inhalten und kann verschiedenen Bearbeitungsbedürfnissen gerecht werden. Um jedoch die Integrität des Dokuments und die Konsistenz des Formats zu gewährleisten und das Dokument in eine plattformübergreifend kompatible Form zu bringen, ist das PDF-Format besser geeignet. PDF-Dokumente können auf verschiedenen Plattformen und Geräten geöffnet werden und behalten das Format und das Erscheinungsbild des Dokuments konsequent bei. Es ist auch in Bezug auf Sicherheit überlegen. Daher ist die Konvertierung von Word-Dokumenten in PDF-Dateien eine gängige Anforderung. In diesem Artikel wird erläutert, wie Word-Dokumente mit Spire.Doc for Python in PDF-Dateien konvertiert werden, sowie Batch-Konvertierungen und die Einstellung verschiedener Konvertierungsparameter.

Installation von Spire.Doc for Python

Für dieses Tutorial benötigen Sie Spire.Doc for Python. Sie können es einfach mit den folgenden pip-Befehlen in VS-Code installieren:

pip install Spire.Doc
Enter fullscreen mode Exit fullscreen mode

Konvertieren eines Word-Dokuments in eine PDF-Datei

Mit der Document.SaveToFile()-Methode von Spire.Doc for Python können Word-Dokumente als PDF, XPS, HTML, RTF usw. gespeichert werden. Hier sind die Schritte zum Direktspeichern eines Word-Dokuments als PDF-Datei:

  • Erstellen Sie ein Objekt der Document-Klasse.
  • Laden Sie ein Word-Beispieldokument mit der Document.LoadFromFile()-Methode.
  • Speichern Sie das Dokument als PDF-Datei mit der Doucment.SaveToFile()-Methode.

Python

from spire.doc import *
from spire.doc.common import *

# Erstellen eines Objekts der Document-Klasse  
document = Document()

# Word-Dokument laden
document.LoadFromFile("G:/Dokumente/Beispiel1.docx") 

# Dokument als PDF-Datei speichern
document.SaveToFile("Ausgabe/PDF1.pdf", FileFormat.PDF)
document.Close()
Enter fullscreen mode Exit fullscreen mode

Konvertierungsergebnis

Konvertieren eines Word-Dokuments in eine PDF-Datei

Batch-Konvertierung von Word-Dokumenten in PDF

Hier sind die Schritte zum Batch-Konvertieren von Word-Dokumenten in PDF-Dateien. Unterstützt Doc- und Docx-Word-Dokumentformate:

  • Erstellen Sie ein Objekt der Document-Klasse.
  • Durchlaufen Sie alle Dateien im angegebenen Ordner und identifizieren Sie Dateien mit den Endungen .doc und .docx.
  • Laden Sie die Dokumente nacheinander mit der Document.LoadFromFile()-Methode.
  • Konvertieren Sie das Dokument mit der Document.SaveToFile()-Methode in PDF-Format und speichern Sie es im angegebenen Pfad.

Python

import os
from spire.doc import *
from spire.doc.common import *

# Ordnerpfad abrufen
folder_path = "G:/Dokumente"

# Objekt der Document-Klasse erstellen
document = Document()

# Alle Dateien im Ordner durchlaufen
for file_name in os.listdir(folder_path):
    if file_name.endswith(".doc") or file_name.endswith(".docx"):
        # Vollständigen Dateipfad erstellen
        file_path = os.path.join(folder_path, file_name)

        # Word-Dokument laden
        document.LoadFromFile(file_path)

        # Ausgabedateipfad generieren
        output_path = os.path.join("Ausgabe1", os.path.splitext(file_name)[0] + ".pdf")

        # Dokument als PDF-Datei speichern
        document.SaveToFile(output_path, FileFormat.PDF)
        document.Close()
    else:
        print(f"Datei ignorieren: {file_name}")
Enter fullscreen mode Exit fullscreen mode

Konvertierungsergebnis

Batch-Konvertierung von Word-Dokumenten in PDF

Einstellen von Konvertierungsparametern während der Konvertierung (Verschlüsselung, Einbetten von Lesezeichen, Einbetten von Schriftarten, Einstellung der Bildqualität)

Spire.Doc for Python unterstützt auch die Verschlüsselung, das Hinzufügen von Lesezeichen, das Einbetten von Schriftarten, die Einstellung der Bildqualität usw. beim Konvertieren von Word-Dokumenten über die Eigenschaften der ToPdfParameterList-Klasse und die Document.JPEGQuality-Eigenschaft. Die detaillierten Schritte sind:

  • Erstellen Sie ein Objekt der Document-Klasse.
  • Laden Sie ein Word-Beispieldokument mit der Document.LoadFromFile()-Methode.
  • Erstellen Sie ein Objekt der ToPdfParameterList-Klasse.
  • Verwenden Sie die ToPdfParameterList.PdfSecurity.Encrypt()-Methode, um ein Kennwort zum Öffnen und ein Berechtigungskennwort festzulegen.
  • Mit der Einstellung ToPdfParameterList.CreateWordBookmarksUsingHeadings können Sie auch PDF-Lesezeichen aus allen Ebenen von Überschriften generieren. Sie können auch Word-Lesezeichen direkt in PDF-Lesezeichen konvertieren, indem Sie die Einstellung ToPdfParameterList.CreateWordBookmarks verwenden.
  • Verwenden Sie die Eigenschaft ToPdfParameterList.IsEmbeddedAllFonts, um die Schrifteinbettung einzustellen.
  • Verwenden Sie die Eigenschaft Document.JPEGQuality, um die Bildqualität einzustellen.
  • Speichern Sie das Dokument mit der Doucment.SaveToFile()-Methode und wenden Sie die Parameter an, um es als PDF-Datei zu speichern.

Python

from spire.doc import *
from spire.doc.common import *

# Objekt der Document-Klasse erstellen
document = Document()

# Word-Dokument laden  
document.LoadFromFile("G:/Dokumente/Beispiel1.docx")

# Objekt der ToPdfParameterList-Klasse erstellen
parameter = ToPdfParameterList()

# Kennwort zum Öffnen und Berechtigungskennwort festlegen
openpsd = "password"
permissionpsd = "permission"
parameter.PdfSecurity.Encrypt(openpsd, permissionpsd, PdfPermissionsFlags.Default, PdfEncryptionKeySize.Key128Bit)

# Lesezeichen mit Überschriften erstellen  
parameter.CreateWordBookmarksUsingHeadings = True
# Lesezeichen einbeziehen
# parameter.CreateWordBookmarks = True  

# Schriftarten einbetten
parameter.IsEmbeddedAllFonts = True

# Bildqualität einstellen
document.JPEGQuality = 40

# Dokument als PDF-Datei speichern
document.SaveToFile("Ausgabe/PDF2.pdf", parameter)
document.Close()
Enter fullscreen mode Exit fullscreen mode

Konvertierungsergebnis

Verschlüsselung

Einbetten von Lesezeichen

Einbetten von Schriftarten

Dies ist der Prozess der Konvertierung eines Word-Dokuments in ein PDF-Dokument mit Spire.Doc for Python. Wenn Sie Fragen zum Prozess haben oder mehr Details wissen möchten, können Sie sich das Spire.Doc for Python-Tutorial ansehen oder im Spire.Doc-Forum darüber diskutieren.

Top comments (0)