Archiv der Kategorie: Büroprogramme

Tolino Shine/Vision einrichten

Notwendige Programme:

  • Calibre (Bücher verwalten, konvertieren und übertragen)
  • Ebola (kostenlose Bücher von „Projekt Gutenberg“ und „Zeno“)
  • Adobe DigitalEdition (Notwendig zum Download von Büchern mit dem Adobe-DRM)

Calibre sollte in der aktuellsten Version direkt von der Homepage installiert werden, da die Version in den gängigen Quellen oft zu alt ist und den Tolino nicht unterstützt (http://calibre-ebook.com/download_linux – am Ende der Seite werden die Paket-Abhängigkeiten aufgeführt). In den Versionen ab 1.34 unterstützt Calibre den Tolino als „Generic e-ink device“.

Ebola ist in der Regel nur direkt auf der Homepage erhältlich (http://lbremer.de/ebola.html). Damit auch Bücher von Zeno heruntergeladen werden können, muss zusätzlich noch Cextra installiert werden. Dieses Tool ist jedoch kaum zu finden und zur Zeit eigentlich nur unter folgendem Link verfügbar: http://www.mobileread.com/forums/attachment.php?attachmentid=105523&d=1367924885. Die Java-Datei cextra.jar in das Ebola-Verzeichnis kopieren und diesen Pfad in Ebola unter Einstellungen/Cetra-Pfad auswählen.
Die aktuellen Buchlisten können über die „Bearbeiten → Buchliste → Update …“ Einträge im Menü aktualisiert werden (dauert sehr lange!).
Ebola speichert die heruntergeladenen Bücher im Ebola-Verzeichnis unter „output“.

Adobe DigitalEdition läuft unter Linux mit Wine-HQ zusammen mit Wine-Mono. Wichtig ist, dass Wine-HQ in einer aktuellen Version (>= 1.7) und Wine-Mono (>=4.5) installiert wird. Es kann vorkommen, dass die aktuelle Version von Adobe DigitalEdition (3.0) nicht installiert werden kann bzw. dann beim Start mit Fehlermeldungen abstürzt. Es gibt auch ältere Versionen (z. B. 2.0) die problemlos laufen (http://download.adobe.com/pub/adobe/digitaleditions/ADE_2.0_Installer.exe). Die Kompatibilität der Versionen kann sich jedoch ständig ändern, daher einfach zunächst mit der aktuellen Version testen).

Die Installation kann auch ganz einfach über winetricks installiert werden. Dort einfach „Install an app“ und dann „adobe_diget“ auswählen.

Beim Download eines gekauften Buchs, die acsm-Datei direkt an Adobe DigitalEdition übergeben lassen, dann wird das Buch im Home-Verzeichnis automatisch unter „My Digital Editions“ gespeichert und kann dann von Calibre importiert werden.

Notwendig ist jetzt noch eine Adobe-ID, die direkt über Adobe zu beziehen ist (https://www.adobe.com/de → Bei meinem Adobe-Konto anmelden → Sie haben noch keine Adobe-ID?).

OCR unter Linux

Programme zur Texterkennung

Die Besten Ergebnisse hatte ich mit tesseract erhalten. Hierfür kann der OCRFeeder als grafische Oberfläche verwendet werden. Es kann je nach Version des OCRFeeders notwendig sein, in den Einstellungen in der Kommandozeile für tesseract Deutsch als Erkennungssprache anzugeben. Der OCRFeeder kann auch Seiten begradigen und greift auch auf die Funktionen von Unpaper zurück. Zur Vorbereitung von gescannten Seiten empfiehlt sich das Programm ScanTailor.

sudo apt-get install tesseract-ocr tesseract-ocr-deu tesseract-ocr-eng ocrfeeder unpaper scantailor

Fehler beim Start des OCR-Feeders:

ImportError: No module named Image

Dieser Fehler tritt auf, da sich in der PythonImageLibrary (PIL) Aufrufe geändert haben. Daher das Kompatibilitäts-Paket python-imaging installieren:

sudo apt-get install python-imaging

Durchsuchbare PDF-Datei im PDF/A-Format

Gescannte PDF-dokumente können mit einem Script (OCRmyPDF) automatisch in durchsuchbare PDF-Dokumente im PDF/A-Format umgewandelt werden. Das Script kann unter github.com/fritz-hh/OCRmyPDF/releases heruntergeladen werden. Das Archiv herunterladen, entpacken und ggf. das Shellscript OCRmyPDF.sh ausführbar machen.

Aufruf:

./OCRmyPDF.sh -l deu input.pdf output.pdf

Aufrufparameter:

  • -l deu: deutsche Sprache
  • -d: Seite mit unpaper geraderücken
  • -g: Debug-Modus (der erkannte Text wird jeweils als extra Seite zusätzlich eingefügt)

tellico

Die persönlichen Einstellungen (auch den Zugang für die Amazon-Suche) speichert tellico unter ~/.kde/share/config/tellicorc

Damit die Suche bei Amazon funktioniert muss eine Anmeldung bei Amazon erfolgen: https://affiliate-program.amazon.com/gp/advertising/api/detail/main.html

Suche hinzufügen:

  1. Unter Einstellungen / Tellico einrichten / Datenquellen einen neuen Eintrag anlegen. (Amazon nennen)
  2. Art der Quelle: „Amazon.com Web Services“
  3. Klick auf „Sign up for an account“ und mit Amazon-Benutzerdaten anmelden. Den Anweisungen folgen und dan „Access key“ und „Secret key“ in ttellico eingeben.