Vlákno názorů k článku Calibre 2.1: ještě lepší e-knihovna od j - "vylepšení interpunkce" ... spis jeji zmrveni, nema totiz...

  • Článek je starý, nové názory již nelze přidávat.
  • 2. 9. 2014 9:29

    j (neregistrovaný)

    "vylepšení interpunkce" ... spis jeji zmrveni, nema totiz zadnou moznost nastavit trebas spravne uvozovky, takze to prevede samo na US. Navic editor neumoznuje, a to tak ze vubec, pracovat s metainformacemi.

    Ctecka pak trvale neumi cist v pdb v cestine (nezobrazi diakritiku), navic ma pro nekoho velmi nemilou vlastnost, ze si napriklad pri cteni epub tento zaroven modifikuje, protoze si to, kde ctenar skoncil zapisuje do nej (za tohle by se melo strilet).

    Prevodnik je pak trvale nastroj naprosto tragickej ... 80% pdf neprevede vubec (respektive vygeneruje zmet hexa znaku), cestina je samo v tomhle ohledu naprosto mimo jeho shopnosti. Pri prevodech z doc/odt/... pak dava daleko lepsi vysledky plugin do oo/lo.

  • 2. 9. 2014 9:42

    MK (neregistrovaný)

    Že to nepřevede pdf se moc nedivím. Jak to pdf vůbec převádí. Umí Calibre postscript nebo to dělá přes OCR?

  • 2. 9. 2014 11:54

    j (neregistrovaný)

    OCR to nedela, protoze to by fungovalo daleko lip, snazi se z toho vydolovat text, ale funguje to tak max na EN (a samo se pri tom totalne rozpadne formatovani, ale to je dany PDFkem samym). Jakmile v tom je diakritika, tak je vysledek naprosta tragedie, ostatne presne stejne jako ty pdb. V nich to diakriticky znaky projistotu vynecha uplne.

  • 2. 9. 2014 12:53

    _pepak (neregistrovaný)

    A víte o tom, že PDB nenese žádnou informaci o použitém kódování, takže ho konverzní utilita může tak maximálně hádat? Že když Calibru řeknete, že to PDB je například v Windows-1250, tak s češtinou žádné problémy mít nebude a převede to, kam budete chtít?

    Obdobné nepřesnosti máte s tím PDF. Pokud použijete dobře vygenerované české PDF (např. z LaTeXu), tak vám z něj Calibre vyrobí EPUB (nebo cokoliv jiného) s naprosto správnou češtinou. Pokud do toho vložíte PDF, které dobře vygenerované není, tak to samozřejmě dopadne hůře, přesně podle principu Garbage In, Garbage Out.

  • 2. 9. 2014 18:46

    j (neregistrovaný)

    Jiste ze to muze leda hadat, ale je spousta ctecek, ktere ho kupodivu uhadnou, a spravne. Stejne tak se ctecka muze zeptat, pripadne alespon umoznit kodovani vybrat, ani jedno z toho mozne neni.Jedine co potencielne mozne je, je provest konverzi s parametrama z radky, ale ani to nefunguje spravne (zkusel jsem to na cele radce souboru). Zajimave, ze trebas takovy pspad, ac to neni zadna ebook ctecka, to otevre ve 100% pripadu spravne ... asi disponuje cernou magii.

    Co je to dobre vygenerovane PDF? To jsou jenom pindy. PDF mi zcela korektne zobrazi jak acrobat reader, tak foxit, tak js hruza firefoxu => jedinej kdo to neumi je calibre. Tudiz tomu PDF nic neni. Jen to calibre proste neumi. Ostatne, prevod v calibre dopadne velmni podobne jako pokus o cpy&paste, kde se diakritika bud odpari, nebo z toho vznika zmet znaku.

    Navic ovladani tyhle veci mi prislo odjakziva ponekud chory, ale to je samo vec vkusu.

  • 3. 9. 2014 7:22

    _pepak (neregistrovaný)

    Asi je zbytečné to psát, protože podle stylu vyjadřování ve vašich příspěvcích je zřejmé, že víte všechno nejlíp a pokud náhodou někde jsou chyby, tak ve vesmíru, v žádném případě ne ve vás, ale pro kompletnost:

    1) Je to možné, a ne jen "potenciálně". Podívejte se na parametr --input-encoding, resp. "kódování vstupních znaků".

    2) Vždyť píšu, třeba výstupy LaTeXu. Se zobrazením to nemá nic společného. Zato s copy and paste všechno. Zkuste si třeba http://www.kiv.zcu.cz/pad2013/template/sbornikpad2013.pdf

  • 3. 9. 2014 12:03

    VfB (neregistrovaný)

    A to otvírání v PSPadu jste zkoušel jen s českými texty nebo jste zkoušel také např. japonštinu? To že PSPad, tak „chytře“ pracuje s češtinou může být způsobeno tím, že v něm máte natvrdo nastavené kódování na češtinu.

    Měl jste ty soubory se správným kódováním (UTF-8) nebo v nějakém prasáckém formátu (Win-1250)?

  • 2. 9. 2014 11:35

    NA (neregistrovaný)

    Vyhráváte bludišťáka
    "Vylepšit interpunkci" převede bdquo na „ Když se podíváš co se změnilo uvidíš.
    Editor umožňuje vložit libovolný znak a navíc vložit libovolný znak ze schránky, případně bdquo; Další bludišťák! ldquo; Uvozovky sám nepřevádí. Editor umožňuje pracovat s metainformacemi a umí to Calibre také.

    V pdb zrovna nic nemám. Ano každá čtečka, která si pamatuje pozici, modifikuje jeden k tomu určený soubor epubu(on je totiž epub archiv). To nemá vliv na text knihy a umožňuje to pokračovat ve čtení na jiném zařízení.

    Asi dělám něco špatně, protože to v Calibre převádím. PDF obsahující text se převede a to dle úrovně své sprasenosti.

  • 2. 9. 2014 11:51

    j (neregistrovaný)

    koukam placal co vubec netusi o cem placa, takze milej placale

    "" to neprevede na „“ ... protoze to nelze takto nastavit, ale prevede to na “” , coz jsou uplne jine a vcestine naprosto nepouzitelne znaky (sem zvedav, jak si stim root poradi).

    Mata to samozrejme editovat neumi, to se da jedine v calibre jako takovym, ale ne v editoru samotnym, takze zase plkas a nevis o cem. Mozna tak maximale ve zdrojaku, coz je vskutku user friendly ...

    Toto se opravdu dobre modifikuje .... obzvlast, kdyz tam je treba neco pridat, ze, trebas nazev ... hmm.

    <metadata xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:opf="http://www.idpf.org/2007/opf">
       <dc:identifier id="BookId" opf:scheme="UUID">urn:uuid:6006fb0b-f515-4d9d-9516-523a91edafec</dc:identifier>
       <dc:language>cs</dc:language>
       <dc:date opf:event="modification">2014-09-02</dc:date>
       <meta content="0.7.4" name="Sigil version" />
     </metadata>
     <manifest>
       <item href="toc.ncx" id="ncx" media-type="application/x-dtbncx+xml" />
       <item href="Text/Section0001.xhtml" id="Section0001.xhtml" media-type="application/xhtml+xml" />
       <item href="Styles/stylesheet.css" id="stylesheet.css" media-type="text/css" />
     </manifest>
     <spine toc="ncx">
       <itemref idref="Section0001.xhtml" />
     </spine>
    </package>

    pdf obsahujici cesky text to neprevede v 90% pripadu, muzu poskytnout nekolik set prikladu. A opravdu nemluvim o scanech, ale o textu.

    A ani nahodou, kazda normalni ctecka si to, kde uzivatel skoncil zapisuje to SVEHO k tomu urceneho indexu, protoze stejnou knizku muze cist 10 lidi zaroven, a kazdy je aktualne nekde jinde, takze zapisovat do knihy muze leda debil. Ale jo, podle predstav vyvojaru calibre ma mit kazdej user v /home 10GB knizek, stejnych jako 150 jinejch uzivatelu, protoze tak to ma byt ...

  • 2. 9. 2014 12:17

    Zopper

    PDF obsahující češtinu mi v 90 % případů převede, jen to občas chce ručně nastavit vstupní kódování. Větší problém je spíš s odstavci a odřádkováními, kdy ani heuristika někdy nestačí. Výsledný dokument pak tvoří hromada odstavců o délce jednoho řádku z původního PDF.

    A co se reading progress týče, tak to je otázka use case. Já zase netuším, proč bych si dělal 150 uživatelů a dával jim 10 GB knížek. Stačí mi jeden uživatel, zato ale chci sdílet informaci o poslední přečtené stránce mezi několika zařízeními. A mám takový pocit, že většina uživatelů Calibre to má taky tak. ;-)

  • 2. 9. 2014 17:56

    NA (neregistrovaný)

    "" to neprevede na „“
    Protože k tomu ta funkce není určena. Dělá totiž něco úplně jiného. Až přestanete nadávat, dupat nožičkou a šířit bludy, možná na to přijdete. Na záměnu špatných uvozovek můžete použít funkci najdi/nahraď.

    Metadata umí editor editovat ve zdrojáku. U nové knihy titul vyplním v nabídce. A napsat (title)Titul(/ti­tle) nepovažuji za problém. Mohu použít i nabídku Calibre. Kdy použiji který způsob je na mě.

    Záložky Calibre jdou smazat a když spustíte kontrolu, tak tu nabídku dostanete.
    Číst stejnou knížku může několik korektorů a ti chtějí vědět co ten předchozí udělal (pokud nepoužívají například git), nebo 10 debilů. Inteligentní lidé mají svou kopii a tak se jich to, co dělám na své čtečce / případně v Calibre netýká.

    Prostě si přiznejte, že vaše problémy se nacházejí mezi vašima ušima. To, že něco neumíte/neznáte neznamená, že za to může někdo jiný.

  • 2. 9. 2014 18:56

    j (neregistrovaný)

    Jiste, ty to nepovazujes za problem, protoze zcela zjevne vubec netusis, jak ten format vypada ... jen tu placas.

    Takz emilej placale, uz vidim jak zivy, jak BFu, kterej si chce trebas jen lehce upravit knizky a doplnit do nich nejaky info, rucne vklada ..

    <dc:contributor opf:file-as="Voprsalek,Karel" opf:role="ill">Karel Voprsalek</dc:contributor>

    Jenom proto, aby doplnil ilustratora

    Pripadne ...

    <dc:title>Nazev</dc:title>

    Protoze mu uzasny editor neumozni to udelat jinak. O pripadnych slozitejs formatovanych informacich ani nemluve.

    Tak funkce je urcena k tomu, aby prevedla znaky na typograficky spravne znaky. A typograficky spravne uvozovky (a spousta jinych znaku) jsou (pro tebe velke prekvapeni) pro kazdy jazyk definovany jinak. A jelikoz to neumi regularni vyrazy, tak se samozrejme ani nedaji uvozovky nahradit spravne nijak jinak. Takze tu neplkej o vecech, o kterych vubec netusis jak maji vypadat.

    Na korekce jsou urceny uplne jine aplikace a s debilitou ukladani a predevsim modifikace (a mrveni) knizek nemaji nic spolecnyho. Nasrano na krku tady pak mas leda ty, nebot samozrejme doma mas 20 pocitacu, aby kazdej i potencielni navstenik mohl mit svoji kopii od kazde hovadiny, kterou by nahodou chtel pouzit ...

  • 3. 9. 2014 7:54

    as (neregistrovaný)

    A to je problem, který si Vy nechcete připustit, buď to neumím a tak to nedělám či se smířím, že to není dokonalé.
    Když to chci mít dokonalé, tak se ten program naučím ovládat víc jak BFU...

    Ale chápu, lepší je být Brouk pytlík než Ferda mravenec.

  • 4. 9. 2014 9:36

    j (neregistrovaný)

    Ne, lepsi je netvrdit, ze nastroj neco umi, kdyz to zcela zjevne neumi. Sigil umi jak wysiwyg editaci, tak samozrejme upravu zdrojaku, tak pochopitelne (F8) editaci meta informaci.

    Jediny co me na nem aktualne sejri je, ze padne nahubu, pokud ho mam overenej v RDPcku a prepnu sesnu. Zatim sem nenasel vuli a silu instalovat si kvuli tomu nejaky visualko, abych si to oddebugoval.

  • 2. 9. 2014 12:25

    izidor (neregistrovaný)

    problem je v tom, ze ctecka pri kazdem otevirani pdb provede nejprve konverzi na epub a pak teprve zobrazi ten epub. Nejlepsi reseni je tedy provest tu konverzi vsech pdb jen jednou, nastavit pri prevodu ve Vzhled a Chovani polozku Kodovani vstupnich znaku na cp1250 a je to, pak ta ctecka funguje, jak ma.

    Druhy otravny problem pri prevodu je, ze odstavce jsou oddeleny mezerou a nikoliv odsazenim. Pro tento pripad staci do Extra CSS pridat
    p {text-indent: 1.5em; margin-top: 0em; margin-bottom: 0em}

    Jinak editor regularni vyrazy umi, po CTRL + F muzu normalne regularni vyrazy pouzivat.

  • 2. 9. 2014 12:27

    VfB (neregistrovaný)

    „vylepšení interpenkce“ - je myšleno pomocí najdi/nahraď regulérních výrazů v editoru

    pdb je asi stokrát překonaný prehistorický formát a problém s češtinou bude nejspíš způsoben tím, že ten soubor bude v nějakém prasáckém kódování a ne utf-8

    problém s PDF bude nejspíše podobný, většina pdf z ulozto edice a jiných warez zdrojů bude nejspíše natvrdo formátovaná na A4ku a možná zprasená i jiným způsobem

    při exportu z ODT (nebo z DOC přes ODT) do ebookových formátů funguje Calibre na uspokojivých cca 85% a s češtinou nemá vůbec žádné problémy, tedy pokud máte dokumenty v UTF-8, jak je normální v toto století

  • 2. 9. 2014 19:00

    j (neregistrovaný)

    Jiste, bez vykladat tem milionum booku, ze je nekdo ma prekodovat a prevadet ...lol. Automaticky prevod je naprosto knicemu ... navic prevodnik parametr s kodovanim zvesela igonoruje (mozna uz neplati, ale zkousel sem to v nekolika ruznych vezich, a fungovalo to tak v 1% pripadu spravne, v 80% pripadu "nahodny pristup" (= nektere znaky OK, jine nikoli) a ve zbytku to nefungovalo vubec.

  • 3. 9. 2014 12:12

    VfB (neregistrovaný)

    Ne každý má potřebu mít nakradeno na disku desetkrát více knih, než je schopen kdy v celém životě přečíst.

    Hádal bych že minimálně 85% těch knih lze sehnat v nějakém uživatelsky přívětivějším formátu než je pravěké pdb.

  • 4. 9. 2014 9:31

    j (neregistrovaný)

    Jiste ... trebas doc ... nebo pdf ... a mimochodem, vis proc si lidi ukladaji na disky knizky, filmy, muziku, ... ??? Zjevne nikoli ... protoze uz za tyden to muze byt nedostupne. A to treba proto, ze se nekdo rozhodne, ze 70let po smrti je malo, a prodlouzi se to na 90 nebo 100 ...

    Mimochodem, v knihovne maji nakradeno na 10 zivotu ... svine jedny ... a pucujou to zadarmo hajzlove ...