Nemusí to jít o...blafnout tak snadno. Pokud bude těch změn hodně a nebudeš znát klíč jejich rozmístění ani přibližný počet, nejsi schopen zajistit si „čistou kopii“.
Ad různé verze: dá se to udělat i hodně citlivě třeba pomocí různého dělení slov nebo změnou interpunkce tam, kde jsou možné různé zápisy. Napadá mě, že je možné třeba použít různé bílé znaky, tabulátory, tvrdé mezery na různých místech a podobně.
Pokud nebude zveřejněno co a jak se přesně používá a bude se toho používat hodně, nebude možné tyhle věci obcházet snadno. Stejně tak je možné třeba steganograficky měnit obrázky.
Bílé znaky, tabulátory, tvrdé mezery spolehlivě odstraní OCR ze screenshotů, což je dost rychlá metoda upirátění ebooku s neprolomeným DRM.
Takže jediné relevantní změny jsou obsahové. A není potřeba čistá kopie, ale vytvořit jinou kopii, ze které nelze poznat, kdo kupoval. Změn by muselo být opravdu hodně, aby vydavatelé mohli s vysokou pravděpodobností říct, kdo pirátil. Zvlášť, když kniha má třeba náklad 20 000 kusů, a 200 stran.
Vela zmien? Ani nahodou.
Dajme tomu, ze chceme predat radovo 60000 knih. Za tretim slovom v kazdom odstavci dame binarne jednu alebo dve medzery (kodujeme 0 a 1). Po prvych 16 odstavcoch mame zakovodane cislo zakaznika. Toto mozeme urobit v kazdej kapitole. Alebo mozeme kazdy vyskyt znaku "y" v pripade potreby nahradit jeho unicode verziou. 16 bitov schovame uz v +- tretej vete. Takze to mozeme opakovat aj na kazdej strane, nech je to pekne schovane. Dame 10 takychto metod cez seba a statisticky urcime, ktore najdene cislo mame najcastejsie (odstranite, alebo preformatujete vetsinu textu nahodne a aj tak najdem vami nenajdene sifrovanie rovnako vo vetsine textu a je to). Ligatury a slitky mozeme nahradzovat dvojicami znakov - ludia su hovada, nevsimnu si ani zarovnanie dolava, preco by si mali vsimnut "iny font".
Prehadzovanie slovosledu by som fakt zakazal - uz sa robil preklad, korekcia, tiskovy skriatok a teraz aj DRM? To sa uz ani nebude podobat na original...
Mal som tu smolu, ze na vysokej som si naozaj uzil trojsemestralku o sadzani textu, programovani latexu a od tej doby si aj viac uzivam DOBRE vytlacenu knihu. Ked som zbadal scany prvych vydani asi astounding stories mal som skoro orgazmicky zazitok. Dnes si kupite ekhnihu od ibux.sk a v ich citacke, ktora podporuje len ich vlastny drm format ani neviete zarovnat knihu do bloku - len dolava. A aj pri zobrazeni na fulscreen vo windows aplikacii sa kniha zobrazuje len v uzkom stlpci v strede obrazovky - tak preco by sa mali trapit s nejakou kvalitou.
Druhou vecou je, ze cena eknihy je velmi vysoka. Licencovanie DRM technologie este viac dvihne cenu a to uz fakt nie som ochotny platit. A este daju peniaze aj na pravnikov aby vymahali skody od "zlodejov".
Takze mam dve knihy s drm, a asi 30 bez drm a moja volba je jasna. Ziadna ochrana mi nestoji za problemy.
Tahle ochrana je silně nespolehlivá. Zdvojené mezery se odstraní snadno běžnou opravou formátování stejně jako Unicode náhrady se odstraní normalizací, font se odstraní převedením do plain textu, ligatury opět řeší Unicode normalizace. Navíc OCR to všechno obejde bez nějakých větších problémů, protože (stejně jako čtenář) to nerozpozná. Takže zase to bude fungovat jenom na pár malých ryb, co si na to nedají pozor.
Ta nová technika se snaží udělat to tak, že to přežije dokonce i OCR. Nicméně ve chvíli, kdy někdo bude mít k dispozici alespoň dvě verze stejné knihy (a čím víc, tím líp), tak žádné vodoznaky nemají moc šancí :-)
jako myšlenkový koncept zajímavý, ale aby těch změn mohlo být hodně, bude muset být i dostatečně dlouhý text. To za prvé. A za druhé, nějak nechápu jak znalost původního majitele licence zabrání dalšímu šíření. A "čistou" verzi pro anonymizaci nikdo nepotřebuje, zhruba stačí, když se ze dvou verzí, které se budou lišit alespoň ve dvou "bitech", vytvoří třetí. Nepotřebuje znát všechna místa, kde se provádějí změny.
Bílé znaky, tabulátory, tvrdé mezery budou omezovat uživatele například při vyhledávání slov a jdou "Najít a nahradit".
Jak říkám, jako "vodoznak" to je zajímavý, ale jestli to zabrání šíření, když to ani není vidět, to pochybuji. To mi ten podpis od kosmas nebo alza přijde lepší.
Kdyz jsem zacal cist, take me napadlo v prvni rade "kodovani" pomoci whitespace, deleni slov a podobne - tedy "neviditelnymi" vecmi. Ale v tom odkazu je videt, ze se meni cela slova a slovni spojeni (bohuzel nemecky prisis neumim, takze zavaznost zmen nejsem schopen posoudit). Toto povazuji za odpornou zrudnost. Zvlast proto, ze tyto zameny bude zjevne delat nejaky SW automaticky.
Miluji treba knihy Terryho Pratchetta (v originale), a by i jedna mala zamena slova za jeho sysnonymum znicila vtip nebo zmenila vyzneni.
Doufam, ze se jedna pouze o nejaky informacni sum, ktery zase zanikne, protoze jinak by to znamenalo likvidaci kvalitni literatury.
Pokud půjde opravdu o synonyma a spol. tak je to pěkné mršení knih. Když uvážím klasické knihy a český trh, rozšířená kniha se nachází klidně i v 1-2 milionu domácností. U e-knih by to znamenalo asi trojnásobek čtenářů (kteří by si měli každý pořídit vlastní knihu (hu hu).
To jako chtějí v "případném budoucnu" (které bez ojebání pravidel, a přání "knihkupců", čtenáři nemůže nikdy nastat) každou z těch jedinečně zmršit? A udržovat databázi zkryplení? Měli by si čechouni pospíšit, aby si žádný větší trh nealokoval dříve jemu vyhovující kurvítka.
Co se úniků knih týká, dáme je všichni do čoudu, a zaplatíme si za pár korun aby je někdo ukradl a hodil veřejně na Internet. Pak nějakýmu novinářskýmu hovadu stovku aby o tom napsal. Taková menší, "lokální" akce, jednou za pět let, by mohla stačit.
Tak, milé děti. To už je pro dnešek vše, zítra si povíme zase jinou pohádku o hloupém, zlém a hamižném...