Při jakékoli konverzi PDF musíte posuzovat také původní dokument. Spousta PDF dokumentů je dělána jenom pro vizuální zobrazení pro člověka, takže je to jenom změť bloků, řádků, slov nebo jen písmena, která když se zobrazí na tom správném místě, člověk z toho má dojem odstavců, sloupců apod. Jenže na automatickou konverzi do formátu strukturovaného textu byste pak potřeboval umělou inteligenci (nebo aspoň slušný OCR program). A to ani nepíšu o tom, že ten takzvaný text ve skutečnosti mohou být jen křivky nebo dokonce bitmapový obrázek.