05-20-2011, 03:04 AM | #16 |
Fidibus
Posts: 441
Karma: 2246533
Join Date: Feb 2010
Device: none
|
Das Ergebnis ist wirklich beeindruckend! Wow!
Jetzt ärgert es mich um so mehr, dass ich Tesseract nicht zum Laufen bekommen habe. Die Scans sind leider alle nicht besser, Google eben, aber vielleicht macht es ja einen kleinen Unterschied, wenn Du nicht die beschnittenen Seiten sondern die Bilder von den Originalseiten nimmst? Wenn Du dein Glück nochmal versuchen willst, Meister Dietrich ist hier: http://ge.tt/#7jYNqrH Du wirst an den Dateinamen merken, dass Seiten fehlen, aber diesmal ist das Buch komplett. Die Seiten waren teilweise doppelt gescant. Generell sind die Scans von Archive.org besser, aber das meiste, was man da findet, ist leider auch nur von Google übernommen. |
05-20-2011, 03:08 AM | #17 | |
Fidibus
Posts: 441
Karma: 2246533
Join Date: Feb 2010
Device: none
|
Quote:
Ja, die Datei ist da und runtergeladen. Ich mach mich gleich an die Arbeit ... |
|
Advert | |
|
05-20-2011, 04:00 AM | #18 |
Enthusiast
Posts: 31
Karma: 10
Join Date: Nov 2010
Device: PB360
|
Ein paar nützliche Informationen zu Tesseract findet man auch auf den folgenden Seiten:
https://adnanvatandas.wordpress.com/...eract-windows/ http://wiki.ubuntuusers.de/tesseract-ocr http://wiki.ubuntuusers.de/tesseract...ocr_trainieren Die Ubuntu-Links erklären auch das Handling schön anschaulich und Schritt für Schritt. Auch als Windows-Nutzer kann man mMn gut davon profitieren. Denn Scan von Klaus hab ich mal durch ein frisch installiertes Tesseract (ohne Training) durchgejagt. Das Ergebnis ist schon mal recht gut. |
05-20-2011, 05:00 AM | #19 |
BioReader
Posts: 292
Karma: 42568
Join Date: Apr 2009
Location: Germany
Device: Various
|
Hallole ... hier überschlagen sich ja die Aktivitäten! Hier einmal eine kleine Kochanleitung für Windows Anwender, die sich auch auf Betriebssystemebene bewegen können (Kenntnisse von DOS und den benötigten Kommandos sind leider erforderlich):
Training u.s.w. ist dann komplizierter und da helfen die von piff genannten Links weiter. Klaus Last edited by kbaerwald; 05-20-2011 at 05:05 AM. |
05-20-2011, 05:20 AM | #20 | |
BioReader
Posts: 292
Karma: 42568
Join Date: Apr 2009
Location: Germany
Device: Various
|
Quote:
Es erhebt sich natürlich die Frage ob nicht ein Schnellschreiber wie Uluhara schneller zum Ziel gelangt, wenn noch viel nachgearbeitet bzw. tesseract trainiert werden muß. Klaus |
|
Advert | |
|
05-20-2011, 07:16 AM | #21 |
Fidibus
Posts: 441
Karma: 2246533
Join Date: Feb 2010
Device: none
|
Das sieht wirklich gut aus. Würdest Du die anderen Seiten auch durch Tesseract schicken? Dann würde ich das Proofreading übernehmen.
Abschreiben geht wohl nur dann schneller, wenn man wirklich gut 10 Finger schreiben kann. Kann ich leider nicht. Die Anleitungen zu Tesseract werde ich mir in einer ruhigen Stunde mal ausführlich zu Gemüte führen. Vielen Dank piff und Klaus für die Infos! |
05-20-2011, 07:42 AM | #22 | |
BioReader
Posts: 292
Karma: 42568
Join Date: Apr 2009
Location: Germany
Device: Various
|
Quote:
Klaus |
|
05-20-2011, 10:00 AM | #23 |
BioReader
Posts: 292
Karma: 42568
Join Date: Apr 2009
Location: Germany
Device: Various
|
Ich habe die pdf Datei (Meister Dietrich) genommen, Seiten grob beschnitten und in tif gewandelt. Danach Behandlung mit tesseract und *.txt in meister_dietrich.txt zusammengeführt. Es sieht nicht so "schön" aus wie bei meinem selbst gescannten Material: schätze die fehlerrate bei etwa 15-20% je nach Vorlage. Aber es ist über weite Strecken durchaus lesbar.
Ich sehe folgende Probleme:
Ich habe die Textdatei zwecks Korrekturlesen angehängt - viel Spaß. Klaus [edit] Pdf Datei wurde bereinigt und präzise geschnitten (Vermeidung von Störstellen), teilweise wurden Seiten gerade gerückt. Es gibt nun die imho deutlich besser interpretierte Version 2 im Anhang. Last edited by kbaerwald; 05-20-2011 at 12:12 PM. Reason: Ergänzung |
05-20-2011, 05:29 PM | #24 |
Fidibus
Posts: 441
Karma: 2246533
Join Date: Feb 2010
Device: none
|
Super! Vielen Dank!
Die epub Version von Schwert und Schlage wird wohl morgen fertig werden. Muss noch ein Cover entwerfen. Dann fange ich gleich mit dem PR für Meister Dietrich an. |
05-26-2011, 06:05 PM | #25 |
Zealot
Posts: 141
Karma: 10
Join Date: Dec 2007
Device: Pocketbook Touch Lux 3
|
Super, das ist ja interessant. Schaue ich mir auch mal an, obwohl ich kaum selbst etwas machen kann. Ich habe einen Mac und mit den Windows-Programmen in der Emulation ist es auch nicht so toll mit der Zusammenarbeit mit meinem Scanner.
Vauh |
05-27-2011, 04:28 AM | #26 |
Enthusiast
Posts: 31
Karma: 10
Join Date: Nov 2010
Device: PB360
|
Übrigens Tesseract läuft auch auf Maschinen mit dem angebissnen Apfel.
Guckst Du: http://www.macresearch.org/do-it-you...ecognition-ocr http://www.malcolmhardie.com/ocr/index.html |
05-27-2011, 11:41 AM | #27 |
Zealot
Posts: 141
Karma: 10
Join Date: Dec 2007
Device: Pocketbook Touch Lux 3
|
Danke, wusste ich nicht. Probiere ich gerne mal aus.
Vauh |
05-27-2011, 11:49 AM | #28 |
Zealot
Posts: 141
Karma: 10
Join Date: Dec 2007
Device: Pocketbook Touch Lux 3
|
Wo findet man eigentlich Scans alter Bücher, die man bearbeiten kann?
Oder scannt ihr eigene Bücher und bearbeitet die dann? Ich habe zwar einige alte Bücher, aber leider nicht so viele. Vauh |
05-27-2011, 12:38 PM | #29 | |
Connoisseur
Posts: 50
Karma: 874
Join Date: Apr 2011
Device: sony prs-505
|
Quote:
durch die Scans von Hokuspokus bin ich auf http://books.google.de/ aufmerksam geworden - da scheint jede Menge Potential drinzustecken, auch wenn ich die Suchfunktion irgendwie "merkwürdig" finde ... und das ausgerechnet auf einer Google Seite |
|
05-27-2011, 04:53 PM | #30 |
Fidibus
Posts: 441
Karma: 2246533
Join Date: Feb 2010
Device: none
|
Qualitativ bessere Scans findet man bei Archive.org, obwohl da auch viele Google Scans zu finden sind. Allerdings kriegt man manchmal über Archive auch Google Bücher, die von Google aus irgendwelchen Gründen für nicht US IPs gesperrt sind. (all files http)
http://www.archive.org/details/texts |
|
Similar Threads | ||||
Thread | Thread Starter | Forum | Replies | Last Post |
Das Aus für den txtr Reader? | Bratzzo | Andere Lesegeräte | 22 | 12-05-2010 09:16 PM |
gibt es den perfekten eBook-Reader für mich? | Ataraxia | Erste Hilfe | 6 | 05-25-2010 10:54 AM |
Lesetipp für den Notfall - Handbuch Filesharing - Leitfaden für Eltern | beachwanderer | Lounge | 2 | 02-24-2010 03:51 AM |
Nook Kleiner Tip für alle, die einen M-Edge cove für den Nook möchten | mos | Andere Lesegeräte | 0 | 01-30-2010 04:52 AM |
Welche Features wünscht Ihr euch für den "perfekten Reader"? | Josch91 | Lounge | 9 | 08-03-2009 03:22 PM |