08-29-2010, 11:20 AM | #1 |
Zealot
Posts: 119
Karma: 10
Join Date: May 2010
Location: NRW, Germany
Device: Pocketbook 360° + Kindle 3
|
Calibre: Seitenzahlen von pdf in epub/mobi entfernen
Hallo zusammen!
Ich habe (egal mit welcher Calibre-Version) das Problem, dass ich die in pdf-Büchern eingebundenen Seitenzahlen (meistens unten auf jeder Seite (mittig oder zentriert) bei der Konventierung zu epub/mobi nicht wegbekomme und sie somit mitten im eigentlichen Text landen. Mache ich bei der Anwendung des "Zauberstabs" (oder wie Calibre das nennt) etwas falsch? Oder kann das Calibre einfach noch nicht? Habe leider keine Ahnung von "Befehlkommandos" (die man anscheinend bei Calibre eingeben kann/soll)... Wie werdet ihr die Seitenzahlen bei pdf-Dokumenten los? Gruß, Zel |
08-29-2010, 03:14 PM | #2 |
Wizard
Posts: 3,130
Karma: 91256
Join Date: Feb 2008
Location: Germany
Device: Cybook Gen3
|
Welchen der Zauberstäbe benutzt Du denn? Sinnvoll in diesem Kontext wäre Entfernung von Fußzeile, denke ich.
Das, was Du "Befehlskommandos" (ist das nicht ein bißchen doppeltgemoppelt?) nennst, sind regular expressions. Eine übrigens auch im Calibre-Handbuch verlinkte Einführung ist hier zu finden. |
Advert | |
|
08-29-2010, 05:33 PM | #3 |
Zealot
Posts: 119
Karma: 10
Join Date: May 2010
Location: NRW, Germany
Device: Pocketbook 360° + Kindle 3
|
ja, ich meine den Zauberstab zur Entfernung der Fußzeile.
Vielleicht benutze ich den Zauberstab auch nur einfach falsch: Ich mache ein Häkchen bei "Fußzeile entfernen" und das wars. Leider klappt es so nie. Wenn ich dann noch auf den Zauberstab drücke, öffnet sich ein weiteres Fenster, wo ich dann aber nicht mehr weiß, was ich machen soll.. |
08-29-2010, 07:11 PM | #4 |
Wizard
Posts: 3,130
Karma: 91256
Join Date: Feb 2008
Location: Germany
Device: Cybook Gen3
|
Ah. Der Ausdruck, der da steht, ist (vermutlich, ich hab den noch nicht genauer angeguckt) auf Standard-Fußzeilen ausgelegt. Das Häkchen ist schonmal richtig, in dem Fenster, das sich dann öffnet, wird Dir der Quelltext des zu konvertierenden Buches angezeigt. Oben gibst Du dann die regular expression ein, die die Fußzeile bzw. Seitenzahl im Dokument beschreibt, und mittels der Schaltfläche "Test" zeigt Calibre dann, was es tatsächlich entfernen würde. Denk dran, entsprechende umschließende Tags mit zu entfernen.
EDIT: Konkretes, vielleicht anschaulicheres Beispiel: Angenommen, die Seitenzahlangabe ist "Seite X von Y" ohne weitere Tags. Dann wäre die regular expression, die Du für die Entfernung der Fußleiste angeben mußt, "Seite [0-9]+ von Y" (da Y eine feste Zahl ist, kann das direkt übernommen werden.) Siehe ansonsten den Link in meinem obigen Post- lies Dir den am Besten mal in Ruhe durch, das sollte einiges verdeutlichen. Last edited by Manichean; 08-29-2010 at 07:19 PM. Reason: Beispiel angefügt |
08-30-2010, 04:54 AM | #5 | |
Zealot
Posts: 119
Karma: 10
Join Date: May 2010
Location: NRW, Germany
Device: Pocketbook 360° + Kindle 3
|
Quote:
Werde mir deinen Link noch einmal genauer anschauen und anschließend probieren es mit Calibre umzusetzen..! |
|
Advert | |
|
08-30-2010, 06:36 AM | #6 |
Winged Ape
Posts: 128
Karma: 290
Join Date: May 2010
Location: Germany
Device: Kindle 2i
|
Der alte Trick: PDF -> html mit dem MobipocketCreator, html dann mit Calibre in gewünschtes eBook-Format trimmen.
Der MobipocketCreator schafft das mit den Seitenzahlen (und Kopf- und Fußzeilen) in der Regel recht gut... |
08-30-2010, 07:03 AM | #7 | |
Zealot
Posts: 119
Karma: 10
Join Date: May 2010
Location: NRW, Germany
Device: Pocketbook 360° + Kindle 3
|
Quote:
|
|
09-04-2010, 04:21 PM | #8 |
Junior Member
Posts: 2
Karma: 10
Join Date: Sep 2010
Device: iPod 3G 32GB
|
Danke für eure Diskussion,
hatte das gleiche Problem wie Zel, durch den Tipp von Manichean hab ich dann kapiert. Mein Eintrag für schlichte Seitenzahlen-Entfernung: (([0-9]+ </p>)*([10-99]+ </p>)*([100-999]+ </p>)) Vorschautyp ePub, Staffelung der Zahlen weil Calibre [1-1000] nicht rafft. Das </p>-Tag, weil auch sonst alle anderen Zahlen im Skript gelöscht würden. |
09-04-2010, 04:36 PM | #9 |
Junior Member
Posts: 2
Karma: 10
Join Date: Sep 2010
Device: iPod 3G 32GB
|
Uups - P.S.:
Wenn Du erstmal "nur" das PDF hast, ist der Eintrag (([0-9]+ <br>)*([10-99]+ <br>)*([100-999]+ <br>)) Bei mehr als tausend Seiten entsprechend erweitern |
09-05-2010, 06:25 AM | #10 |
Wizard
Posts: 3,130
Karma: 91256
Join Date: Feb 2008
Location: Germany
Device: Cybook Gen3
|
Hm, nach meinem Verständnis sollte eigentlich
Code:
[0-9]+ <br> EDIT: Anders ausgedrückt: Eine regexp "versteht" keine Zahlen sondern Zeichenketten. Mit [1-1000]+ hast Du also versucht zu sagen "mindestens einmal eine Zahl zwischen 1 und 1 oder die 0 oder die 0 oder die 0". Last edited by Manichean; 09-05-2010 at 08:47 AM. |
09-22-2010, 12:38 PM | #11 |
Zealot
Posts: 119
Karma: 10
Join Date: May 2010
Location: NRW, Germany
Device: Pocketbook 360° + Kindle 3
|
Leider klappt es bei mir (PDF, unten mittig die Seitenzahl (nur die Zahl, keine Striche o.ä.), ca. 650 Seiten) mit keiner der oben beschriebenen Lösungen + auch nicht mit dem vorgeschlagenen Ausdruck von Calibre.
Entweder ich mache etwas falsch (sehr gut möglich, da wirklich keine Ahnung) oder es geht einfach nicht... Soll ich wohl den Calibre-Chef ( = Erfinder) mal persönlich fragen, ob er zu diesem Thema nicht ein Video hochladen kann? ;-) |
09-23-2010, 06:17 AM | #12 |
Wizard
Posts: 3,130
Karma: 91256
Join Date: Feb 2008
Location: Germany
Device: Cybook Gen3
|
Es gibt ein Tutorial, das versucht, reguläre Ausdrücke verständlich zu erklären. Die Regexpes, die da oben stehen, sind vermutlich für Dein Problem ungeeignet, weil der Code für die Seitenzahlen bei Dir einfach anders aussieht.
|
09-23-2010, 08:09 AM | #13 |
The one and only
Posts: 3,302
Karma: 535819
Join Date: Oct 2008
Location: Berlin, Germany
Device: yup!
|
Die Schwierigkeit dabei ist, dass manche Seitenzahlen nicht als Fußzeilen bei der Konvertierung interpretiert werden. Das passiert sogar, wenn man aus Acrobat heraus in ein anderes Format abspeichert.
Ich rede mal jetzt in Word: Wenn du Glück hast, steht jede Seitenzahl in einer eigenen Zeile, also ^p1^p oder ^pSeite 1 von 1008^p oder Ähnliches. *^p=Zeilenumbruch Dann lassen sie sich leicht manuell abfangen oder per Makro rauslöschen. Übelst wird es, wenn die Seitenzahlen in einer etwas anderen Formatierung in den Fließtext übergehen. Die sicherste - aber aufwendigste - Methode ist und bleibt allerdings das manuelle Rauslöschen. Sonst kann es dir passieren, dass du solche Textstellen plötzlich automatisch mitlöscht. "Der Countdown läuft", brüllte der Offizier durch den Raum. 10 ... 9 ... 8 Sergeant Thomlin lief der Schweiß von der Stirn 7 ... 6 ... 5 Nervosität machte sich unter den Männern breit. oder Hastig zählte er seine Schritte, um den Fallen zu entgehen. 17, 18, 19 ... Hatte er richtig gezählt? 18? Mitten in der Bewegung hielt er inne. PDFs sind einfach eine Katastrophe, wenn's ums Konvertieren geht. |
09-23-2010, 12:24 PM | #14 | |
Zealot
Posts: 119
Karma: 10
Join Date: May 2010
Location: NRW, Germany
Device: Pocketbook 360° + Kindle 3
|
Vielen Dank @K-Thom & @Manichean für eure (erneute) Hilfe!
Quote:
Da ich meinem Buch viele (wichtige) Jahreszahlen vorkommen, ist vielleicht wirklich der manuelle Weg der Beste.. |
|
09-23-2010, 12:50 PM | #15 | |
Wizard
Posts: 3,130
Karma: 91256
Join Date: Feb 2008
Location: Germany
Device: Cybook Gen3
|
Quote:
Eigentlich sollte ein vernünftiger regulärer Ausdruck zwischen Seitenzahlen und Jahreszahlen anhand der umgebenden Tags differenzieren können. Kannst Du einen Abschnitt aus dem Buch posten, der eine Jahres- und eine Seitenzahl, oder geht das wegen Copyright oder so nicht? (Sonst per PM.) Dann könnte man da nämlich mehr zu sagen als diese Konjunktiv- Formulierung da oben |
|
|
Similar Threads | ||||
Thread | Thread Starter | Forum | Replies | Last Post |
von .doc zu .epub über Calibre? | laura86 | Software | 3 | 06-29-2010 07:22 AM |
Epub/Mobi TO pdf conversion problem | Hitch | Calibre | 4 | 06-15-2010 06:28 PM |
Entfernen von DRM bei Kindle eBooks klappt! | K-Thom | Amazon Kindle | 3 | 01-14-2010 01:00 PM |
Calibre: Header entfernen nicht mit aktueller Version ?? | KimJ | Software | 5 | 01-06-2010 01:39 AM |
PDF -> LRF, ePUB, MOBI? | krischik | Calibre | 12 | 07-24-2009 12:37 AM |