iTextsharp Pdf aufteilen. Ausgabe-Teil ist zu groß.

Plohich · 18. August 2016, 10:58

Hallo Freunde,
kann mir jemand bei itextsharp helfen? Ich benutze Vers. 5.5.8.0

Folgendes Problem, ich habe ein PDF mit 100 Seiten und möchte ihn auf mehrere Teile aufteilen, z.B. zwei Seiten pro Teil. Das hat funktioniert, aber das Ergebnis hat mich verwirrt. Test.pdf war 5mb groß, aber das Ergebnis, jedes Teil hat 5mb gehabt. Also Input --> 5mb, Output --> 5mb x 50…
Ich bin kein Programmierer, ich versuche mir nur das Leben mit Programmierung leichter zu machen, bitte nicht gleich mit Steinen bewerfen wegen meines Codes

Was mache ich falsch?

Vielen Dank im Voraus!

P.S. es tut mir leid, ich habe leider der Beitrag im falsche Thema erstellt und kann es jetzt nicht verschieben. :huh:

C#-Quellcode

public static int TeilePdfInTeile(string filePdf, string OPT_OUTPUT, int iPage)
{
int currentFile = 0;
FileInfo filePdfInfo = new FileInfo(filePdf);
if (File.Exists(filePdf))
{
using (var pdfReader = new PdfReader(filePdf))
{
int iCurrentPage = 0;
int iCurrentFile = 0;
var pages = new List<int>();
Dictionary<string, List<int>> seitenNeuePdf = new Dictionary<string, List<int>>();
for (var page = 1; page <= pdfReader.NumberOfPages; page++)
{
iCurrentPage++;
pages.Add(page);
if (iCurrentPage == iPage)
{
iCurrentFile++;
iCurrentPage = 0;
seitenNeuePdf.Add(iCurrentFile.ToString("00000"), pages);
pages = new List<int>();
}
}
foreach (var oneSendung in seitenNeuePdf)
{
var doc = new iTextSharp.text.Document();
var copie = new iTextSharp.text.pdf.PdfCopy(doc, new System.IO.FileStream(OPT_OUTPUT + filePdfInfo.Name.Substring(0, filePdfInfo.Name.Length - 4) + "_" + oneSendung.Key + ".pdf", FileMode.Create));
doc.Open();
var newPages = new List<int>();
newPages = oneSendung.Value;
if (newPages.Count == 1)
{
copie.AddPage(copie.GetImportedPage(pdfReader, newPages[0]));
}
else
{
for (int i = 1; i <= newPages.Count; i++)
{
copie.AddPage(copie.GetImportedPage(pdfReader, newPages[i - 1]));
}
}
copie.Close();
doc.Close();
currentFile++;
}
}
}
else
{
currentFile = 0;
return currentFile;
}
return currentFile;
}

Verschoben. ~Thunderbolt

HenryV · 18. August 2016, 15:01

Hallo @Plohich

Zuerst zu deinem Code
Ich würde Zeile 17 noch ergänzen, damit bei ungerader Anzahl Seiten auch der Rest exportiert wird.

C#-Quellcode

if (iCurrentPage == iPage | page == pdfReader.NumberOfPages)

Zu deinem Problem:
Ich glaube nicht,dass das Problem an deinem Code liegt, sondern an der PDF-Datei selbst.
Guckst du hier: itext.2136553.n4.nabble.com/Re…First-Page-tp4660563.html

Gruss HenryV

RodFromGermany · 18. August 2016, 15:08

@Plohich Willkommen im Forum. :thumbup:

Wieviele solcher Dokumente willst Du zerhackstückeln?
Warum nimmst Du nicht die schnöde Druckfunktion vom Adobe?

Thunderbolt · 18. August 2016, 15:36

@Plohich Wenn du ein Thema im falschen Unterforum erstellt hast, melde das bitte über das kleine Warndreieck unter dem Beitrag. Dann kümmern wir uns darum.

Plohich · 19. August 2016, 09:20

Vielen Dank an alle!!!

Es scheint tatsächlich dass Code richtig ist. Ich habe Gestern mehrere Aussagen im Internet gefunden, dass die Ressourcen welche sich im Input-Pdf befinden, in jede neue erstellte Teil noch mal geschrieben werden. Das finde ich blöd...
Man kann sich, aber helfen wenn man Pdf vorher in eine andere Pdf-Version mit Hilfe von gswin32c.exe konvertiert. Dann habe ich konvertierte Pdf aufgeteilt und das Ergebnis war fast 1:1. Es ist aber nicht ganz saubere Lösung, durch solche Konvertierungen können manche Schriftarten ausgetauscht werden.

So habe ich es konvertiert:

"C:\Program Files (x86)\gs\gs8.70\bin\gswin32c.exe" -dPDFA -sDEVICE=pdfwrite -od:\ok\input.PDF d:\fehler\output.PDF

@RodFromGermany Mit Adobe wird es nicht funktionieren. Diese Prozesse müssen dann später auf dem Server automatisch laufen. Wir arbeiten momentan mit ceTe.DynamicPDF, funktioniert perfekt. Aber dann habe ich festgestellt dass manche Prozesse mit itextsharp bis zu 500% schneller laufen. Jetzt versuche ich alles was wir in mehrere Jahren implementiert haben umzuschreiben.

@HenryV Ja, Du hast Recht. Dieser Pdf hat viele Farbfotos gehabt und wenn ich ein Pdf nur mit Text aufteile, oder wie ich vorher beschrieben habe (Konvertierung), dann werden Input- und Output-Pdfs fast gleiche Größe haben.

Viele Grüße,
Plohich

iTextsharp Pdf aufteilen. Ausgabe-Teil ist zu groß.

iTextsharp Pdf aufteilen. Ausgabe-Teil ist zu groß.

C#-Quellcode

C#-Quellcode

Tags

Ähnliche Themen

4 Benutzer haben hier geschrieben