07-12-2009, 12:18 PM | #16 |
Reader
Posts: 818
Karma: 3522
Join Date: Apr 2009
Location: Germany
Device: Kindle 4, iPad
|
@Targor: Wir können uns ja beide an ein Cover machen und dann mal vergleichen welches Besser aussieht. Und zwei verschiedene Banner wären ja auch möglich.
Was das OCR angeht, wir haben irgendwo daheim noch eine Finreader Version rumliegen. Ich kann ja mal schauen ob sich mit der was machen lässt. |
07-12-2009, 12:36 PM | #17 | |
sleepless reader
Posts: 4,763
Karma: 615547
Join Date: Jan 2008
Location: Germany, near Stuttgart
Device: Sony PRS-505, PB 360° & 302, nook wi-fi, Kindle 3
|
Quote:
Mal anders herum gefragt: Wer hat denn außer Josch noch alles Abby Finereader zur Verfügung? Ich schreibe gerade den offenen Brief mit der Erklärung des Projekts und der Bitte um Mithilfe. Den Entwurf poste ich dann hier zur freien Diskussion. Die Domain www.rettet-den-luftpirat.de habe ich natürlich auch schon beantragt... Ein Hintergrund-/Rahmenentwurf für die Seite mit dem offenen Brief wäre natürlich auch nicht schlecht. Vielleicht machen wir die Seite einfach im groben Stil der Hefte. Was meint Ihr? |
|
Advert | |
|
07-12-2009, 12:45 PM | #18 |
Connoisseur
Posts: 72
Karma: 376
Join Date: Mar 2009
Location: Verden, Germany
Device: Nokia N81 8GB, COOL-ER
|
Euren Optimismus in allen Ehren, aber bevor hier Scan-Jobs verteilt und Sammelbände geschnürt werden, würde ich doch gerne die ersten Scans erst einmal sehen. Ich stelle mir das pupsig schwierig vor, da ran zu kommen, aber bis heute morgen wusste ich auch nichts von dem wackeren Piraten und der Villa Galactica. Ich lasse mich gerne von Netseeker eines Besseren belehren. Verdammt, so ein Heftchen hat 32 Seiten, zur Not tippt man die eben ab - 165 Helfer, jeder eins. Ein Schnittchen nach dem anderen.
|
07-12-2009, 01:00 PM | #19 | ||
sleepless reader
Posts: 4,763
Karma: 615547
Join Date: Jan 2008
Location: Germany, near Stuttgart
Device: Sony PRS-505, PB 360° & 302, nook wi-fi, Kindle 3
|
Quote:
Quote:
Laut einem älteren Interview mit Herrn v. Reeken ist der Zustand der Hefte oftmals unter der üblicherweise notwendigen Qualität um daraus ein (Druck-) Buch zu erzeugen - was auch immer das heißen mag. Ein weiteres Problem neben den Texten sind auch die Illustrationen, welche zumindest soweit aufbereitet werden müssten um wieder Verwendung finden zu können. In jedem Fall lautet die Devise kurzfristig erstmal: Konkretes Ziel formulieren (=komplette Überführung aller 165 Hefte in 20 Sammelbände), offenen Brief veröffentlichen, die richtigen Leute anschreiben und lautstark trommeln, trommeln, trommeln und noch lauter tommeln um genug Leute und Institutionen dafür zu interessieren. Mit stillem Vorgehen werden wir da wohl leider nicht allzu viel erreichen... |
||
07-12-2009, 01:20 PM | #20 | |
Connoisseur
Posts: 72
Karma: 376
Join Date: Mar 2009
Location: Verden, Germany
Device: Nokia N81 8GB, COOL-ER
|
Quote:
Abgestimmt müsste meines Erachtens auch werden, was die Scanner/Tipper abliefern sollen. Ich fände es etwas unglücklich, wenn da jeder seine eigene Interpretation als fertiges eBook abliefern würde oder von Latin1 bis Word 2008 ein buntes Potpourri das Ergebnis wäre. Besser ist da sicherlich ein gemeinsam abgestimmter Zwischenschritt. Orientiert man sich da an den Regeln der Distributed Proofreaders, oder hat jemand einen besseren Vorschlag oder Erfahrung mit so einem Projekt? |
|
Advert | |
|
07-12-2009, 01:30 PM | #21 | |
sleepless reader
Posts: 4,763
Karma: 615547
Join Date: Jan 2008
Location: Germany, near Stuttgart
Device: Sony PRS-505, PB 360° & 302, nook wi-fi, Kindle 3
|
Ok, wir haben einen Deal!
Quote:
|
|
07-12-2009, 01:43 PM | #22 |
The cake is a lie
Posts: 442
Karma: 354530
Join Date: May 2009
Device: PB 360
|
Kann man den mit einem "Standard" ABBYY Fraktur einlesen? Wenn ich das richtig verstanden habe, braucht man dazu diese Spezialversion, XIX oder so ähnlich.
Zum Banner, zwei Versuche: Der erste war eine Idee ... die sich als Schwachsinn entpuppt hatte Größe ist jetzt 500x150 |
07-12-2009, 01:48 PM | #23 | |
Connoisseur
Posts: 72
Karma: 376
Join Date: Mar 2009
Location: Verden, Germany
Device: Nokia N81 8GB, COOL-ER
|
Quote:
Das hätte den Vorteil, dass wir keine eigenen Regeln aufstellen müssen - was man keinesfalls unterschätzen sollte. So lückenlos gefallen tut mir der DP-Kram allerdings nicht. Sie sind zum Beispiel schwer an Latin-1 gebunden, weshalb man statt typographischer Anführungszeichen das Ersatzzeichen auf der 2 nehmen soll. Formatierungen soll man weglassen bzw. sogar rauswerfen und den folgenden Formatierern überlassen. Bei GaGa scheint es ziemlich ähnlich zu sein. Passt irgendwie nicht so perfekt wie die Faust aufs Auge. Guckt man sich die Hefte erst einmal durch, was einen da erwartet? Ich hätte keine Hemmungen, eigene Richtlinien aufzustellen: UTF8, Absätze sind eine Zeile, Szenenwechsel/größere Abstände als Absätze mit Leerzeile, Anführungszeichen/Gedankenstriche/Auslassungspunkte (dank UTF) korrekt wiedergeben, Kursiv/Fett (wenn überhaupt vorhanden) mit <i>/<b> kennzeichnen. So etwa in der Art. Es mag ja löblich sein, möglichst viel vom Original herüberzuretten, ganz persönlich finde ich aber diese Bemühungen von DP und GaGa, die einzelnen Zeilenumbrüche zu retten, ein bisschen affig. |
|
07-12-2009, 02:16 PM | #24 | |
sleepless reader
Posts: 4,763
Karma: 615547
Join Date: Jan 2008
Location: Germany, near Stuttgart
Device: Sony PRS-505, PB 360° & 302, nook wi-fi, Kindle 3
|
Quote:
Banner Nr. 2 kommt bereits ganz gut rüber, wirkt aber ein bisschen martialisch mit den ganzen "Messern". Könntest Du das mit ein bisschen mehr Weltraum und weniger "Messern" überarbeiten? |
|
07-12-2009, 02:24 PM | #25 | ||
sleepless reader
Posts: 4,763
Karma: 615547
Join Date: Jan 2008
Location: Germany, near Stuttgart
Device: Sony PRS-505, PB 360° & 302, nook wi-fi, Kindle 3
|
Quote:
Quote:
Ich versuche gerade die Digitalisate von drei Heften zu ergattern, weiss aber noch nicht ob das klappt und wie lange sich das noch hinzieht. Damit hätten wir dann aber zumindest eine Vorlage anhand derer wir eigene Regeln aufstellen könnten. Du scheinst Dich da ja ganz gut auszukennen. Ich komme auf Dich zu, sobald wir zumindest ein Heft "in der Hand" haben. |
||
07-12-2009, 02:45 PM | #26 |
Wizard
Posts: 4,917
Karma: 1840619
Join Date: Oct 2008
Location: Munich, Germany
Device: Kindle PW, PocketBook 360°, Cybook Gen3, iPad mini
|
Hey allerseits, tolles Projekt! Wenn Ihr eine grausig kleinliche Proofreaderin braucht, wisst Ihr ja, wo Ihr mich findet.
|
07-12-2009, 03:01 PM | #27 | |
Connoisseur
Posts: 72
Karma: 376
Join Date: Mar 2009
Location: Verden, Germany
Device: Nokia N81 8GB, COOL-ER
|
Quote:
In vielen Dokumenten gibt es aber noch eine weitere Lücke, für die ich keinen Fachbegriff liefern kann. Meist taucht sie da auf, wo Zeit verstreicht oder ein Ortswechsel geschieht. Auch wenn die Absätze ohne Abstand mit Einrückung formatiert sind, ist in diesen Fällen in den Dokumenten eine Lücke, oft auch ein kleines Bildchen. Solche Lücken würde ich gerne auch entsprechend kodieren, vielleicht mit Leerzeile/Stern/Leerzeile. CSS käme erst im zweiten Schritt, wenn man für die Text- und Bild-Dateien, die hoffentlich nach einem einheitlichen Schema benannt sind, einen Konverter bastelt - oder auch viele. Es würde sicherlich nichts schaden, wenn mehrere Skript-Schreiber Vorschläge machen und sich gegenseitig geistig befruchten. Es besteht bei solchen Aktionen leicht die "Gefahr", dass man sich am Endprodukt orientiert. Wir sollten uns immer mal wieder daran erinnern, dass es hier zunächst um Daten geht: Texte und Bilder. |
|
07-12-2009, 03:10 PM | #28 |
sleepless reader
Posts: 4,763
Karma: 615547
Join Date: Jan 2008
Location: Germany, near Stuttgart
Device: Sony PRS-505, PB 360° & 302, nook wi-fi, Kindle 3
|
Ok, habe mich vielleicht falsch ausgedrückt: Ich meinte bspw. <p class="standard"> für einen normalen Absatz, <p class="newScene"> für den Beginn nach einem Szenenwechsel usw.. Wie die Definition der CSS-Klassen für die jeweilige Ausgabe dann später tatsächlich aussieht ist dabei erstmal irrelevant.
Womit ich mich nicht so recht anfreunden kann, ist die Kenntlichmachung von Zeilenumbrüchen innerhalb eines Absatzes. Das wäre zwar näher am Original, verhindert aber den Displaygrößen-unabhängigen Reflow. Für diese zeitlichen Unterbrechungen (Ich kennzeiche die in meinen eBooks meistens mit einem zentriertem "***" mit etwas größerem oberen und unteren Abstand) wäre dann auch ein <p class="discontinuity">***</p> o.ä. denkbar. Da wir (X)HTML als Grundlagenformat wollen, können wir uns doch auch einer derartigen Kennzeichnung bedienen oder übersehe ich da etwas? Edit: Vergesst das mal mit meiner Ablehnung gegen die Kenntlichmachung der Zeilenumbrüche. Die könnten wir dann ggfs. tatsächlich für die Konvertierung "wegparsen". Last edited by netseeker; 07-12-2009 at 03:19 PM. |
07-12-2009, 03:26 PM | #29 |
Reader
Posts: 818
Karma: 3522
Join Date: Apr 2009
Location: Germany
Device: Kindle 4, iPad
|
Ich habe mich jetzt mal wegen dem Finereader und der Frakturschrift schlau gemacht. Um Frakturschrift zu erkennen raucht man FineReader XIX (ca. 350€). Der normale Finereader besitzt jedoch einen Lernfunktion mit der man anscheinden auch recht gute Ergebnisse erzielen kann.
|
07-12-2009, 03:30 PM | #30 | |
sleepless reader
Posts: 4,763
Karma: 615547
Join Date: Jan 2008
Location: Germany, near Stuttgart
Device: Sony PRS-505, PB 360° & 302, nook wi-fi, Kindle 3
|
Quote:
Vielen Dank, Josch. Ich glaube wir bleiben dann doch besser erstmal bei Tesseract. Es sei denn irgendjemand stiftet uns Finereader-Lizenzen. Wobei...warum fragen wir nicht einfach bei ABBYY an, ob sie uns unterstützen würden, sobald wir ein paar Hefte digitalisiert vorliegen haben? Fragen kostet ja erstmal noch nix. |
|
Thread Tools | Search this Thread |
|
Similar Threads | ||||
Thread | Thread Starter | Forum | Replies | Last Post |
Inhaltsverzeichnis unter Calibre?? - und andere Probleme bei der Ebook-Erstellung | Momo_Germany | Erste Hilfe | 4 | 05-26-2009 04:38 PM |
Philosophy Nietzsche, Friedrich: Der Wanderer und sein Schatten. v1 23 may 2009 german | stahanovez | Kindle Books | 0 | 05-23-2009 01:38 PM |
Philosophy Nietzsche, Friedrich: Der Wanderer und sein Schatten. v1.1 24 may 2009 german | stahanovez | ePub Books | 0 | 05-23-2009 01:37 PM |
Short Fiction Laßwitz, Kurd: Auf der Seifenblase und andere Erzählungen. german. v1. 04 mar 2009 | netseeker | ePub Books | 0 | 03-04-2009 05:35 PM |
Short Fiction Laßwitz, Kurd: Auf der Seifenblase und andere Erzählungen. german. v1. 04 mar 2009 | netseeker | Kindle Books | 0 | 03-04-2009 05:34 PM |