PDF v zásadě není problém, protože pokud jsou to naskenované stránky (takže je to náhrada za sérii .jpg), tak s tím stejně nic nenaděláte, při vytváření pdf (třeba TeXem) zase není problém vyrobit "čtečkový" formát, který bude na těchto zařízeních čitelný.
Víc by mě u téhle čtečky vadila absence podpory formátu pdb, protože řada e-booků je dostupná jen v něm.
PDF je vzdycky problem, jednoduse proto, ze ten format by (teoreticky) mel odpovidat tiskovemu vystupu. Pokud nekdo neco ponechava jako scan, tak jde prevazne o knizky se slozitym formatovanim, spoustou obrazku, tabulek, ... s cimz si zadny OCR neporadi bez manualnich korektur.
Pokud nekdo scanuje ciste text, tak samozrejme vysledek OCRkem prevede. Ovsem i tak je to bez korektur prevazne plne chyb.
Tragedii pak je, kdyz neco podobneho zverejni narodni knihovna ... lol ... (mozna to uz spravili, ale veskera capkova tvorba byla zverejnena jako OCRkovane scany - bez jekehokoli formatovani, kapitol, odsazeni .... proste hruza)
Národní knihovna a nebo Městská knihovna Praha?
Četl jsem takhle Krakatit, právě jsem tehdy také nadával, žádné rozlišení kapitol, i odstavce byly slité dohromady... A to bylo právě z Městské knihovny v Praze. Ale byla to jedna z prvních věcí, co jsem četl na Kindlu. Mám pocit, že pak vyrobili novější verzi, kde už to bylo lepší...
To jsou zase polobludy: '(..) při vytváření pdf (třeba TeXem) zase není problém vyrobit "čtečkový" formát (..)'. Pisatel asi v zivote nesazel v TeXu, a nebo si ho, jak je u nas kdoviproc oblibene, plete s LaTeXem.
Verim, ve v LaTeXu je to, aspon u dokumentu, ktere se LaTeXove sablone prilis nevzpouzeji, snadne (presto bych uvital odkaz pro blbe, muze se mi to nekdy hodit). V TeXu je to obecne zhola nemozne, resp. mozne uplne stejne, jako u PDF -- jen velmi spatne, ve zvlastnich pripadech a za cenu znacneho domrseni stranky.
Mýlíte se vy. Tenhle problém jsem nedávno řešil a v čistém TeXu je to opravdu jednodušší.
Pro TeX mi stačí v optimálním případě zadat do do hlavičky dokumentu \magnification = magstep No, kdy za to No dosazuji konkrétní číslo (pro tisk na A4 stačí 1 (což je implicitní, takže se dá tento řádek pouze zakomentovat), pro Kindle (a jiné podobné čtečky) to bude 2 nebo 3, 4 přečtu i na mrňavém displeji Nokie E72.
Pokud nebudu mít k dispozici příslušné fonty (dané velikosti), tak je buď ručně nakompiluji, případně se dopustím prasečiny a spustím dvipdf pod rootem (některé instalace TeXu v takovém případě samy provedou kompilaci příslušných fontů).
V LaTeXu bude tento problém trochu složitější (minimálně bude třeba poshánět nebo nadefinovat sazbu na velikost stránky A5, A6, nebo dokonce A7 (což není úplně triviální záležitost, svého času jsem se s něčím podobným potýkal a moc úspěšný jsem nebyl). Nebo patřičně nazvětšovat fonty pro normální text, nadpisy atd. (opět to není úplně triviální záležitost a předdefinované styly mi zde budou spíš překážet). Nebo nadefinovat vlastní styly (děkuji pěkně, nemusím).
Takže pokud půjde o hladký text s tu a tam vloženým obrázkem, tak spíš budu podobný problém řešit v čistém TeXu než v LaTeXu, jedině u složitě formátovaných textů bych šel do znásilňování LaTeXu.
Snad by se u toho LaTeXu ještě dala ralativně snadno udělat skrčka, že byste to vysadil vícesloupcově (pro Kindle by při fontu 12 pt stačila dvousloupcová sazba, pro displej Nokie E72 - a podobné 3 - 4 sloupce, pro tablety by asi stačily 2 - 3 sloupce) a muselo by se při čtení přejíždět na začátek dalšího sloupce, nebylo by to tedy pohodlné čtení ekvivalentní optimu blízké velikosti písma.
A námitku, že chcete vlastní velikost písma, třeba 16,7 pt, neberu, protože vlastní velikost písma si nemůžete navolit ani na papírové knížce.
Ocividne mluvite o necem zcela odlisnem. Mluvite o pripadu, ze v TeXu mate dokument velmi chudy na makra. Tam neni o cem se bavit. Pokud mate v TeXu jiz hotovou vysazenou knizku (plakat, tabulky), je predelani hodne az nesmirne obtizne. Neresim nesmyslne zadani, resim typickou ulohu, ze autor posle nakladateli knizku/clanek. V TeXu tedy jen za podminek, ze nakladatelstvi by zverejnilo dostatecne nadcasovou sablonu -- utopie. DocBookiste s FOPisty se o to snazi leta s vysledky, rekneme, skromnymi. (A uplne automatizovana sazba zas nikdy neda spolehlive graficky koukatelny vysledek.)
Záleží na tom, jaká makra to jsou a kdo je jakým způsobem napsal. Mohou skutečně existovat makra striktně určená pro výsledný konkrétní formát stránky (absolutně v cm nebo inch), nicméně při troše slušnosti při psaní budou ta makra vycházet z nějaké délkové míry (třeba délky strany tiskového zrcadla) a na ni přepočítávat vše ostatní.
Druhou věcí je, že při tvorbě e-booku máme k dispozici zpravidla holý text od autora (+ soubory s obrázky), a ten nějak zalamujeme, a na tuhle činnost je TeX (včetně možnosti parametrizovat toto zalomení pro různou velikost fontů nebo různou velikost stránky) neskonale lepší než cokoli jiného.
Resili jsme to tu pred casem, vehementne jsem se domahal napr. ja. Root mi pomohl, nasledkem diskuse jsem si koupil 6" Nook Simple Touch, rootnutej s OrionViewerem a moc mi to pomohlo. Jiste by mohlo bejt lip, ale i v tech 800x600 se mi naprosta vetsina odborne literatury cte lip (po oriznuti okraju vetsinou jednosloupcova PDF/DjVu na sirku, vicesloupcova po rozkrajeni v ctecce na vysku).
Ad: "uzivatele zadaji pdf, protoze nechapou, ze pdf neumi reflow". Myslim, ze PDF celkem chapu, pred lety jsem programoval docela casto v PostScriptu a vyrazove prostredky jsou podobne. Tady ale az tak nejde o to, co kdo chape. Scanovane dokumenty premluvite stezi, a takovych je vetsina clanku starsich nez z 90. let.
Dale si uplne nejsem jist, jak soucasne cteci formaty umeji zachazet napr. s netrivialni matematikou, protoze tyhle formaty naopak zase vubec neznam. Ale i pokud je toto vyreseno skvele, jak v kratkem case premluvite IEEE, Springer, Elsevier, Wiley... a dalsich par alespon desitek nakladatelstvi, aby
1. vydavali svoje casopisy v ohebnych formatech
2. do nich prevedli tech cca 100 let nazpatek?
Vysledkem je, ze kostnate, geometricky pevne formaty jsou a budou jeste nejakych par desitek let potreba.
A to kde ze se vezme ta lidska sila na prevod scanu do textovych formatu u toho mnozstvi clanku, u nichz je tak zhruba jeden ctenar z deseti milionu behem deseti let? A presto je role i takto malo ctenych clanku v technicke ci prirodovedne praci nesmirne dulezita, i kdyz nemaji prodejnost/kopirovatelnost jako Hary Potr.
Na shitozni a zachybovany prevod OCRkem neni treba nakladatele, to si ze scanu muze pustit kazdy doma sam. A1e rnoc rne nebav! ci5t takovy b|bosti.
Kupodivu mezi ctenari ... a na podobne zachybovany book sem nenarazil uz hodne dlouho, nehlede na to, ze pokud to nekdo nascanuje, muze to nekdo jiny protahnout OCR a nekdo dalsi udelat korekturu - driv nebo pozdejs z toho vyleze vysledek.
A ze budou primarne prevadeny veci, o ktere je zajem? No to je celkem logicke. O zbytek se muzou postarat nejaka sdruzeni/nadace/... podstatne je, aby takove konani nebylo po staleti(uz ted se bavime o +- 150 letech) nezakonne.
O dila stara 150+ let je zajem velmi vyjimecne, specielne pokud to jsou odborne publikace - pak prevazne plati, ze co je v nich uvedeno uz davno neni pravda (v tomhle pripade plati casto uz po par letech od vydani).
Ja nic chapat nepotrebuju. Proste vim, co chci a to je pdf. Zadne reflow netreba, staci, kdyz ctecka zvlada zakladni ukony, snadny zoom a posun po strance, presun na dalsi sloupec, nikoli stranku u dvousloupcove sazby, apod. Velka ctecka mi pripada na cesty nepohodlna a na 6" jsem zatim byl schopen pohodlne precist vse, co jsem potreboval i v pdf. Ja jsem zadal a dostal jsem. Sice nechapu, ale dulezitejsi je, ze mam.
Souhlasím. Jednou jsem našel dokonce i dvě verze téhož odborného článku ve formátu PDF. Jeden pro A4 a jeden pro A5 (a ten je na čtečce čitelný bez rolování). Myslímže by mohl jít vývoj tímto směrem. Každá třebas diplomka by navíc v sobě obsahovala variantu formátování pro zhruba A5. V reflow moc nevěřím zvlášte u vzorců, obrázků a vůbec tam, kde je lámání stránky podstatné.