Odpověď na názor
Odpovídáte na názor k článku Vyhľadávanie v peer-to-peer sieťach.
Re: ants
celé vláknovyhrabal jsem na pocitaci 250MB "textovych souboru":
207MB pdf, 12MB html, 26MB rtf a 4,8 cisteho textu. vetsinou CZ, ENG, neco malo RU.
z toho vylezlo 30MB cisteho textu celkem. z toho jsem vyrobil jakz-takz pouzitelny slovnik (slovo = libovolny jedinecny retezec bez bilych znaku, delsi nez 2 znaky, obsahujici aspon jedno pismeno a-z a nekoncici na interpunkcni znamenko)
no a tenhle slovnik je jen 2.8MB veliky a obsahuje +-292K slov, coz je celkem v pohode.
btw pouzivate nekdo ANTs sit? je to fulltextove vyhledavani pouzitelne/uzitecne?
Pravidla pro diskutující
Přidáním čtenářského příspěvku do diskusí či fóra souhlasíte s tím, že budete dodržovat následující pravidla. Při jejich hrubém porušení se vystavujete riziku smazání příspěvku, jeho modifikaci, v krajním případě i zablokování přístupu do diskusí.
Redakce ze zásady nezasahuje do čtenářských diskusí a zavazuje se, že nebude mazat ani modifikovat příspěvky, kromě případů, kdy tyto porušují některé z následujících pravidel. V takové situaci je na zvážení redakce, zda příspěvek modifikuje s viditelným upozorněním, či přímo smaže. Redakce nikdy nemaže „nesouhlasné komentáře“ jen proto, že jsou nesouhlasné. Vítáme střet názorů, ale vždy v rámci slušné a kultivované debaty.
Příspěvky nesmí obsahovat:
- Vulgární či hrubé výrazy.
- Urážlivé výroky na adresu druhé osoby či skupiny osob.
- Texty, které mají za cíl jen vyprovokovat emotivní reakci (trolling).
- Rasové útoky či útoky na jakoukoliv jinou menšinu či skupinu obyvatel.
- Komerční nabídky a affiliate odkazy.
- Odkazy na warez, sériová čísla, licenční kódy, pornografii a další nevhodný materiál stejně jako žádosti o poskytnutí tohoto obsahu.
- Prokazatelně protiprávní obsah.
Informace o soukromí: U všech přidaných komentářů provozovatel ukládá IP adresu a hostname odesílatele. U neregistrovaných uživatelů se na webu zobrazuje část hostname, případně IP adresy, neumožňující identifikovat konkrétní počítač.
Povolené značky XHTML: a, br, code, em, li, ol, p, pre, strong, sub, sup, ul

