Nevim, jak HaT obstoji ve srovnani s czaccent (to necht vyzkousi nekdo jiny), ale postval jsem ho na vystup z http://www.root.cz/print.php4?id=2587 (vystup byl zbaven jakehokoliv formatovani tim, ze byl copy'n'paste z okna browseru). Ve vystupu bylo 2072 slov (= shluku nemezer; HaT pocita za slovo shluk pismen, kterych bylo pouze 2048, ale pro ucely tohoto porovnani tato odlisnost nevadi), z nichz bylo 172 chybne ohackovanych, coz je uspesnost asi 91%. Po analyze rozdilu je zrejme, ze vetsi trenovaci data by rozhodne pomohla, zvlaste paklize by v nich bylo vice z oblasti, kterou se clanek zabyva.