Hlavní navigace

Názor k článku Vytvořte elektronickou knihu s eCub od Filip Jirsák - Při jakékoli konverzi PDF musíte posuzovat také původní...

  • Článek je starý, nové názory již nelze přidávat.
  • 25. 7. 2011 18:08

    Filip Jirsák

    Při jakékoli konverzi PDF musíte posuzovat také původní dokument. Spousta PDF dokumentů je dělána jenom pro vizuální zobrazení pro člověka, takže je to jenom změť bloků, řádků, slov nebo jen písmena, která když se zobrazí na tom správném místě, člověk z toho má dojem odstavců, sloupců apod. Jenže na automatickou konverzi do formátu strukturovaného textu byste pak potřeboval umělou inteligenci (nebo aspoň slušný OCR program). A to ani nepíšu o tom, že ten takzvaný text ve skutečnosti mohou být jen křivky nebo dokonce bitmapový obrázek.