gscan2pdf meldet, dass es für tesseract kein language file findet Thema ist als GELÖST markiert

Hilfe bei der Installation von Manjaro Linux!
Antworten

Themen Author
Clemens
Forum Gott
Forum Gott
Beiträge: 377
Registriert: Donnerstag 9. Januar 2020, 18:16
Wohnort: Rottweil
CPU: Intel i5-7400
GPU: nVidia GTX 1650
Kernel: 5.10
Desktop-Variante: XFCE
GPU Treiber: nVidia proprietär
Hat sich bedankt: 73 Mal
Danksagung erhalten: 10 Mal
Kontaktdaten:

gscan2pdf meldet, dass es für tesseract kein language file findet

#1

Beitrag von Clemens »

Sobald ich gscan2pdf starte, kommt die o.g. Meldung (sinngemäß wiedergegeben). Es ist nicht möglich, in gscan2pdf in der DropDown-Liste eine Sprachdatei auszuwählen, obwohl ich bei mir englisch und deutsch installiert habe.

Diese Fehlermeldung kommt erst seit dem gerade stattgefundenen größeren Manjaro Update.

Nun ist zu klären, ob es an gscann2pdf liegt oder an tesseract. Hierzu habe ich im Terminal geprüft:

Code: Alles auswählen

...$ tesseract --list-langs

Error opening data file /usr/share/tessdata/eng.traineddata
Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory.
Failed loading language 'eng'
Tesseract couldn't load any languages!
List of available languages (2):
deu
osd
Es liegt demnach an tesseract selbst, welches seine eigenen Sprachdateien nicht findet. Ich weiß zudem nicht, wo man denn tesseract die benötigte Umgebungsvariable TESSDATA_PREFIX mitteilen kann.

Glücklicher Weise scannt gscan2pdf auch ohne tesseract einwandfrei. Nur die tesseract Fehlereldung nervt natürlich. Wie kann ich das reparieren?
Benutzeravatar

gosia
Forum Held
Forum Held
Beiträge: 2245
Registriert: Dienstag 24. Mai 2016, 13:33
CPU: Intel i5-3210M
GPU: Intel HD 4000
Kernel: 4.19
Desktop-Variante: Openbox
GPU Treiber: i915
Hat sich bedankt: 20 Mal
Danksagung erhalten: 503 Mal

Re: gscan2pdf meldet, dass es für tesseract kein language file findet

#2

Beitrag von gosia »

Hallo Clemens,
probiere mal diese Anleitung
https://www.pyimagesearch.com/2020/08/0 ... languages/
da ist zwar u.a. von Ubuntu die Rede, aber das lässt sich auch auf Manjaro übertragen. Die Sprachdatei musst Du dir natürlich nicht von github holen, sondern von den Repos. Das Paket heisst tesseract-data-deu

viele Grüße gosia

Themen Author
Clemens
Forum Gott
Forum Gott
Beiträge: 377
Registriert: Donnerstag 9. Januar 2020, 18:16
Wohnort: Rottweil
CPU: Intel i5-7400
GPU: nVidia GTX 1650
Kernel: 5.10
Desktop-Variante: XFCE
GPU Treiber: nVidia proprietär
Hat sich bedankt: 73 Mal
Danksagung erhalten: 10 Mal
Kontaktdaten:

Re: gscan2pdf meldet, dass es für tesseract kein language file findet

#3

Beitrag von Clemens »

Der Fehler ist immer noch da, obwohl ich das deutsche Sprachpaket installiert hatte. Tesseract scheint das aber nicht zur Kenntnis zu nehmen. Muss ich da in irgendeiner Config was ändern /korrigieren?
Benutzeravatar

gosia
Forum Held
Forum Held
Beiträge: 2245
Registriert: Dienstag 24. Mai 2016, 13:33
CPU: Intel i5-3210M
GPU: Intel HD 4000
Kernel: 4.19
Desktop-Variante: Openbox
GPU Treiber: i915
Hat sich bedankt: 20 Mal
Danksagung erhalten: 503 Mal

Re: gscan2pdf meldet, dass es für tesseract kein language file findet

#4

Beitrag von gosia »

Hallo Clemens,
naja, ich habe noch kein tesseract installiert, kann also nicht so viel aus dem Nähkästchen plaudern. Aber deine Angaben sehen auch etwas knapp aus
Clemens hat geschrieben: ↑Dienstag 1. Dezember 2020, 21:13 obwohl ich das deutsche Sprachpaket installiert hatte
wenn Du "nur" installiert hast, so wird das wohl noch etwas zuwenig sein. Wie sieht es z.B. mit dem Setzen der Umgebungsvariable TESSDATA_PREFIX aus?
Was sagt

Code: Alles auswählen

echo $TESSDATA_PREFIX
gibt das den exakten Pfad zum tessdata Verzeichnis aus?

viele Grüße gosia

Themen Author
Clemens
Forum Gott
Forum Gott
Beiträge: 377
Registriert: Donnerstag 9. Januar 2020, 18:16
Wohnort: Rottweil
CPU: Intel i5-7400
GPU: nVidia GTX 1650
Kernel: 5.10
Desktop-Variante: XFCE
GPU Treiber: nVidia proprietär
Hat sich bedankt: 73 Mal
Danksagung erhalten: 10 Mal
Kontaktdaten:

Re: gscan2pdf meldet, dass es für tesseract kein language file findet

#5

Beitrag von Clemens »

Wenn ich

Code: Alles auswählen

echo $TESSDATA_PREFIX
eingebe, kommt gar keine Reaktion, also kein Pfad o.ä.

Wo setze ich denn die Umgebungsvariable?
Benutzeravatar

gosia
Forum Held
Forum Held
Beiträge: 2245
Registriert: Dienstag 24. Mai 2016, 13:33
CPU: Intel i5-3210M
GPU: Intel HD 4000
Kernel: 4.19
Desktop-Variante: Openbox
GPU Treiber: i915
Hat sich bedankt: 20 Mal
Danksagung erhalten: 503 Mal

Re: gscan2pdf meldet, dass es für tesseract kein language file findet

#6

Beitrag von gosia »

Hallo Clemens,
Clemens hat geschrieben: ↑Dienstag 1. Dezember 2020, 23:12 Wo setze ich denn die Umgebungsvariable?

Code: Alles auswählen

export TESSDATA_PREFIX=/PFAD/ZU/TESSDATA/DIR
/PFAD/ZU/TESSDATA/DIR musst Du natürlich anpassen.
Damit das dauerhaft bleibt die Zeile in die ~/.bashrc schreiben und dann neu booten.

viele Grüße gosia

Themen Author
Clemens
Forum Gott
Forum Gott
Beiträge: 377
Registriert: Donnerstag 9. Januar 2020, 18:16
Wohnort: Rottweil
CPU: Intel i5-7400
GPU: nVidia GTX 1650
Kernel: 5.10
Desktop-Variante: XFCE
GPU Treiber: nVidia proprietär
Hat sich bedankt: 73 Mal
Danksagung erhalten: 10 Mal
Kontaktdaten:

Re: gscan2pdf meldet, dass es für tesseract kein language file findet

#7

Beitrag von Clemens »

Danke für deine Antwort. Ich hab zunächst im Pacman nachgeschaut, wohin denn das deutsche Sprachpaket installiert worden ist und dies mit dem realen Vorhandensein der Datei an der vorgesehenen Stelle geprüft.
Demnach gab ich ins Terminal:

Code: Alles auswählen

export TESSDATA_PREFIX=/usr/share/tessdata
Der anschließende Test durch einen Start von gscan2pdf brachte aber die gleiche Fehlermeldung wie bisher.

Da dies also nicht funktioniert hat, habe ich die o.g. Zeile nicht in bashrc eingetragen.

Sicherheitshalber gab ich im Terminal noch den o.g. Pfad und zusätzlich danach die Datei deu.traineddata mit ein, was aber leider auch nicht den gewünschten Erfolg brachte.

Glücklicher Weise benötige ich Tesseract bisher nicht. Aber die Meldung nervt, obwohl ich sie ja auch abschalten könnte. Lieber will ich aber ein funktionierendes Tesseract, für den Fall, dass ich es doch mal plötzlich benötige.
Benutzeravatar

gosia
Forum Held
Forum Held
Beiträge: 2245
Registriert: Dienstag 24. Mai 2016, 13:33
CPU: Intel i5-3210M
GPU: Intel HD 4000
Kernel: 4.19
Desktop-Variante: Openbox
GPU Treiber: i915
Hat sich bedankt: 20 Mal
Danksagung erhalten: 503 Mal

Re: gscan2pdf meldet, dass es für tesseract kein language file findet

#8

Beitrag von gosia »

Hallo Clemens,
wäre auch zu schön gewesen ;)
Aber da ich Tesseract schon lange mal ausprobieren wollte, werde ich es mal installieren. Komme aber erst am Wochenende dazu. Aber bis dahin meldet sich bestimmt noch jemand.

viele Grüße gosia
Benutzeravatar

gosia
Forum Held
Forum Held
Beiträge: 2245
Registriert: Dienstag 24. Mai 2016, 13:33
CPU: Intel i5-3210M
GPU: Intel HD 4000
Kernel: 4.19
Desktop-Variante: Openbox
GPU Treiber: i915
Hat sich bedankt: 20 Mal
Danksagung erhalten: 503 Mal

Re: gscan2pdf meldet, dass es für tesseract kein language file findet

#9

Beitrag von gosia »

Hallo Clemens,
irgendwie bin ich in die falsche Richtung marschiert :( Wenn man genau hinsieht, dann ist ja nicht "deutsch" das Problemkind sondern "englisch"
Clemens hat geschrieben: ↑Mittwoch 7. Oktober 2020, 21:11 ...$ tesseract --list-langs
Error opening data file /usr/share/tessdata/eng.traineddata
Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory.
Failed loading language 'eng'
Tesseract couldn't load any languages!
List of available languages (2):
deu
osd
Jedenfalls habe ich das Problem nicht

Code: Alles auswählen

tesseract --list-langs
List of available languages (3):
deu
eng
osd
aber ich habe auch einen anderen Pfad für tesseract. Bei mir liegt das ganze Zeug unter

Code: Alles auswählen

/usr/share/tesseract-ocr/4.00/tessdata/
Kannst ja mal nachsehen, ob das bei dir auch so ist.

Code: Alles auswählen

ls -l /usr/share/tesseract-ocr/4.00/tessdata/
drwxr-xr-x 2 root root     4096 Okt  1 15:52 configs
-rw-r--r-- 1 root root  1525436 Sep 15  2017 deu.traineddata
-rw-r--r-- 1 root root  4113088 Sep 15  2017 eng.traineddata
-rw-r--r-- 1 root root 10562727 Sep 15  2017 osd.traineddata
-rw-r--r-- 1 root root      572 Jan 21  2019 pdf.ttf
drwxr-xr-x 2 root root     4096 Okt  1 15:52 tessconfigs
aber ich sehe gerade, Du sagst ja, dass bei dir alles unter /usr/share/tessdata/ liegt
Clemens hat geschrieben: ↑Mittwoch 2. Dezember 2020, 11:07 dies mit dem realen Vorhandensein der Datei an der vorgesehenen Stelle geprüft.
Da fallen mir im Moment nur mangelnde Rechte ein. Was sagt denn bei dir

Code: Alles auswählen

ls -ld /usr/share/tessdata/
ls -l /usr/share/tessdata/
viele Grüße gosia

Themen Author
Clemens
Forum Gott
Forum Gott
Beiträge: 377
Registriert: Donnerstag 9. Januar 2020, 18:16
Wohnort: Rottweil
CPU: Intel i5-7400
GPU: nVidia GTX 1650
Kernel: 5.10
Desktop-Variante: XFCE
GPU Treiber: nVidia proprietär
Hat sich bedankt: 73 Mal
Danksagung erhalten: 10 Mal
Kontaktdaten:

Re: gscan2pdf meldet, dass es für tesseract kein language file findet

#10

Beitrag von Clemens »

Ich danke dir. Den Fehler hab ich jetzt durch deine Anregung gefunden. Zwar meldet mir gscan2pdf, dass die deutsche Sprachversion fehlen würde. Tatsächlich aber fehlt in meiner Installation erstaunlicher Weise die englische Sprachversion. Nachdem ich die englische Sprachdatei über Pacman ganz normal installiert hatte – zusätzlich zu der deutschen – startete gscan2pdf ohne die Tesseract-Fehlermeldung.

Nun erhalte ich nur noch zwei Fehlermeldungen beim Start von gsacn2pdf, die sich auf eine fehlende Verschlüsselungsmöglichkeit für PDFs sowie auf ein fehlendes Modul zur Ausgabe in einem weiteren Format beziehen. Das benötige ich aber nicht und so habe ich die Meldung jetzt deaktiviert.

Problem Tesseract deutsch ist also damit gelöst!
Antworten

Zurück zu „Manjaro Linux Installation und Programme“