Vlákno názorů k článku Nová softwarová sklizeň (19. 1. 2005) od Stepan - Jelikoz jsem autor HaTu a vyrojily se zde...

Článek je starý, nové názory již nelze přidávat.

19. 1. 2005 12:50

Stepan (neregistrovaný)

Jelikoz jsem autor HaTu a vyrojily se zde nejake dotazy ohledne jeho fungovani, tak k tomu napisu par slov.

Je-li v databazi ulozena dvojice (predchozi slovo, aktualni slovo) ci (aktualni slovo, nasledujici slovo), pak se pouzije prislusna ohackovana varianta aktualniho slova. Paklize dany kontext v trenovacich datech viden nebyl, tak se vezme ohackovana varianta s nejvyssi cetnosti (ktera byla v trenovacich datech videna nejcasteji).

Nekdo se muze zeptat, co se stane, kdyz je stejny kontext pro vice ohackovanych variant. Odpoved zni: vybere se jedna "nahodne" (= podle poradi v hashi). Bylo by samozrejme lepsi, kdyby se vzala ta dvojice s nejvyssi cetnosti a je to zcela jiste chyba, ze se tak nedeje, nicmene uspesnost hackovani byla dost vysoka na to, abych si toho nevsiml :-)
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
19. 1. 2005 15:12

jie liu (neregistrovaný)

to zni pomerne dobre. Muzu se zeptat jak dobre tvuj skript obstoji v primem srovnani s czaccent? Kdyz do nej naladujes vzorek (~10 kB) ASCII textu a pak spocitas spatna slova? Jde mi o to zda to mam zacit pouzivat....

Kazdopadne ti dekuju, veci jako tohle jsou potreba jak sul a divim se ze nikomu krome mne palcive nechybi...
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
19. 1. 2005 17:01

Stepan (neregistrovaný)

Nevim, jak HaT obstoji ve srovnani s czaccent (to necht vyzkousi nekdo jiny), ale postval jsem ho na vystup z http://www.root.cz/print.php4?id=2587 (vystup byl zbaven jakehokoliv formatovani tim, ze byl copy'n'paste z okna browseru). Ve vystupu bylo 2072 slov (= shluku nemezer; HaT pocita za slovo shluk pismen, kterych bylo pouze 2048, ale pro ucely tohoto porovnani tato odlisnost nevadi), z nichz bylo 172 chybne ohackovanych, coz je uspesnost asi 91%. Po analyze rozdilu je zrejme, ze vetsi trenovaci data by rozhodne pomohla, zvlaste paklize by v nich bylo vice z oblasti, kterou se clanek zabyva.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
17. 11. 2006 11:07

Jakub Maléř

Jaktoze se mi nezobrazuje WWW: http://simpleway.cz v mezi vlozil a titulek?
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
17. 11. 2006 11:09

Jakub Maléř

tak jsem se sekl, myslel jsem http://www.simpleway.cz
(http://www.chcispolubydlici.cz)

Vlákno názorů k článku Nová softwarová sklizeň (19. 1. 2005) od Stepan - Jelikoz jsem autor HaTu a vyrojily se zde...

Dále u nás najdete

Změny a novinky od roku 2026 v kostce

Vánoční žně skončily. Právě teď je čas na pořádný věrnostní program

České čipy v roce 2025: Špičkový čip z Prahy jde do výroby

Abyste drželi krok v 2026, musíte umět pružně pracovat s daty i AI

Proč firmy v roce 2026 přecházejí na externí účetnictví?

Nenabízíte preferovaný způsob doručení? Zákazníci opustí košík

Podpora v nezaměstnanosti a při rekvalifikaci v roce 2026

Kdo všechno musí podat daňové přiznání k dani z příjmů za rok 2025?

Nastoupili jste loni na novou pozici v IT? Tak byste měli dostat přidáno

Zemřel Scott Adams, tvůrce slavného komiksu Dilber

Změny v pohotovostech: Kde všude je zavřeli

Evropu má závislosti na Big Tech zbavit open source

Chystá se právo na opravu. Co nám přinese v praxi?

Deepfake videa: Kde končí kreativita a začíná manipulace?

Bitcoinoví těžaři uzavřeli nejúspěšnější rok v historii

Vláda potvrdila konec televizních poplatků, náhradu nezná

Od roku 2026 rostou všechny důchody pomaleji

Satoshi Nakamoto: Vypátrala nová kniha identitu tvůrce bitcoinu?

Máte poslední den na přihlášení k paušální dani OSVČ

Daně 2026: Výhody pro startupy, družstevníky či majitele akcií