Könyvek digitalizálása Kubuntu 10.04 alatt

2010
03
máj

Sziasztok!

Egy ismerősöm jelenleg win7 oprendszert használ, mert könyvek digitalizásával foglalkozik.A napokban megmutattam Neki az új Kubuntu-t és szeretné feltelepíteni a gépére csak eddig még nem talált használható linuxos megfelelőket az általa használt windows programokhoz.

Ezeket használja win alatt:

Abbyy Finereader 9, Xnview, Djvu Solo 3.1, ScanGear,stb.

Idézek a leveléből:

"A szkenneléshez az irfanview-et használom a ScanGear progival, Canon LiDE 200 szkennerrel.
Miután beszkenneltem a könyvet 300dpi-vel,szürkeárnyalatosként, az Abbyyvel felismertetem a képeken lévő szöveget,stb. Ezután a szöveget elmentem docba. A képeket szintén szürkeárnyalatos jpg-ben elmentem, majd az xnviewben többoldalas képet csinálok belölük, tiff formátumban. Ezt megnyitom a djvu soloban és .djvu képfájlt csinálok, ami a korrektor mankójaként van használva. Ez tényleg csak nagy vonalakban lett leírva, mivel még sok munkafolyamat van. De a leírt progik és folyamatok a legfontosabbak."

Tudnátok ajánlani olyan progikat, amelyekkel kiválthatja a fent említett win alkalmazásokat?

Előre is köszönöm!

Hozzászólások

-

Ha csak ez a probléma, virtuális gépben megoldható, hogy elfuttat egy xp-t, és azon belül teheti a dolgát. De ha pl ebből él, akkor nem érdemes teljesen váltani.

Helló!Mióta Linuxot

Helló!
Mióta Linuxot (openSUSE) használok, azóta nekem is megoldatlan dolog a karakter-felismerés. Próbáltam az Ocradot és a GOCR-t, de nem sok mindenre tudtam használni. Vagyis lényegében egyáltalán nem. Viszont azóta hallottam két programról, amikkel lehet, hogy érdemes foglalkozni. Az egyik a Tesseract. Erről azt hallottam, hogy 98%-os pontossággal ismeri fel a karaktereket. A másik az OCRopus. Ezt sikerült kipróbálnom, mivel integrálva van a vakok számára kifejlesztett Knoppix ADRIANE rendszerbe. Ez egy teljesen karakteres, beszélő rendszer (vagyis felolvas mindent, ami a képernyőn van). Szerintem jó lehet, csak nem tudom, hogy a magyar nyelv megtanítható-e neki, mert az enyém nem ismeri. Nevezetesen az pl. "ü" helyett "ii"-t ismer fel.
Egyébként tényleg bosszantó dolog, hogy megveszek egy  szkennert a legális szoftverrel, ami tartalmaz egy jó karakter-felismerő szoftvert (Canon Lide 60/OmniPage), és nem tudom használni, mert nem az Ablakos rendszer van a gépemen.