Názory k článku
Blokování AI v bludišti

Zasílat nově přidané názory e-mailem

Článek je starý, nové názory již nelze přidávat.

24. 1. 2025 15:38

Jakub Lobodáš

Ai je bohužel už "tak chytrá", že bludiště rozpozná a odejde...
Může to být okolo 2x cyklů a sama to detekuje. Takže sice hezký, ale moc nepoužitelné v praxi...
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
24. 1. 2025 20:11

Bez Podezdívky

Možná by to chtělo generovat víc balastu (který by se tvářil jako smysluplný obsah), aby ji to povodilo na delší dobu. Nejlepší by bylo proti ní postavit druhou AI, která by jí krmila kraviny, ale tam by se pak smazal ten nepoměr ve výpočetním výkonu na obou stranách a nebylo by to už výhodné.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
24. 1. 2025 20:14

bez preadivky

vsak to je v poradku ze to (brzo) pozna a vypadne, to je prave cilem
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
25. 1. 2025 17:56

Jakub Lobodáš

Odejde a přijde zpět s jiným "facem". Vtipem je, že na mimo veřejný internet toho je hromady, tudíž může se stát, že nějaký uživatel půjde na web a ono ho to hodí do bludiště (jak tomu bylo předtím), nebo vyrazí.
Todle maskování je známé od roku 2008, kde se to objevilo na PS3. Když si chtěl se přihlásit ze staršího, nebo JB. Stačilo udělat na PC proxy s ID a jel si dál. Pak byl náhodný uživatel navždy zablokovanej.
Historie se prostě opakuje.
O to jde. je to neúčinné, nebo 50/50 produktivní, protože je vedlejší nevyžádaný produkt....
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
24. 1. 2025 22:27

Jan Hrach

Stříbrný podporovatel

Netuším, jak tohle řeší webové crawlery, ale předpokládám, že destilace užitečného obsahu a detekce těchto pastí (často vzniklých i neúmyslně) musí být vyřešený problém od té doby, co existují fulltextové vyhledávače ("Google"), ne?

Mimochodem, když už jsme u toho, jak se vlastně řeší extrakce užitečného obsahu na stránce, aby se AI netrénovala na různých menu a patičkách? (fulltexty řeší něco podobného, ale tam to asi nebude tak akutní, protože stále se opakující menu automaticky dostane nižší váhu)
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
25. 1. 2025 7:08

nettreg

Mimochodem, když už jsme u toho, jak se vlastně řeší extrakce užitečného obsahu na stránce, aby se AI netrénovala na různých menu a patičkách?

Nevím, jak přesně to funguje, ale mám dobré zkušenousti s touto Python knihovnou: https://trafilatura.readthedocs.io/en/latest/

Používám například jako preproces článků pro TTS.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
28. 1. 2025 8:56

bez prezdivky ...

Uzitecnej text bude mit typicky aspon nekolik slov v odstavci a typicky ten odstavec nebude jeden. I takhle primitivni detekce ti bude ve valny vetsine pripadu stacit.

U vetsich webu se to na to pak proste manualne udelaji sablony.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
24. 1. 2025 23:20

NikdeKde

A proč blokovat? Právě naopak, přilákat a nakrmit tou správnou pravdou.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
25. 1. 2025 12:17

Jirasko

Mám pod správou úzce zaměřené profesní weby, vyšší statisíce stránek a AI roboti se mnohdy tak neomaleně dotazují, že vyberou všechny zdroje serveru. Není problém 300 spojení jednoho crawlera a dotazovat se několik týdnů a vlastně stále dokola na to samé.
Nemám v zásadě problém, že se AI naučí ze znalostí jiných a vydělává na tom. Neměla by ale zdroje přetěžovat, protože si na sebe poštve ty, kteří se o servery starají. A než kvůli AI desetkrát nebo stokrát navyšovat výkon, to si raději napíšete nějaký ten honeypot nebo jiný blokátor.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
25. 1. 2025 14:42

Jan Forman

Jo taky jsem viděl projekty z evropských peněz, kdy si někdo zaplatil velkou výpočetní kapacitu a konektivitu a pak jen donekonečna bagroval a bagroval neustále to samé s mírným odstupem (třeba hodinu) ve stovkách vláken v podstatě nepřetržitě.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
25. 1. 2025 13:38

????????????

Podívejme se na to z druhé strany, kdy bude stále běžnější, že informace je prezentována pomocí AI a nikoliv přímo ze zdroje. Stejně jako se weby optimalizují pro různé vyhledávače, možná má už teď smysl optimaliovat weby pro AI.

Aby za chvíli všechy weby nevypadaly jako jedna velká captcha, kdy text je rozházený v obrázku, aby to nevyžral robot, a člověk nad tím bude kroutit hlavou.

Stačí se podívat, co některé portály vymýšlejší proti blokátorům reklam...
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
26. 1. 2025 17:42

Glasny

zajímavé. ale tohle tady asi už mámé. různé clouflare ochrany.

a navíc, to opět používají Strany Zla i Strany dobra.
například phishingové blogy nebo redirectovací zlošinné domény. chovají se tak,, aby při dostatečné náhodném "otevření" provedl redirect koleček na cílovou "fake investiční nabídku" , ale při snaze to posléze "analyzovat" se stránka tváří jako svatoušek, asi používá nějaký timeouty delší než den, má něco jako xt_recent na IP, aby minimalizovala možnosti, aby si na ně někdo posvítíl
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
26. 1. 2025 19:57

Zdeno Sekerák

Jestli to te AI zatrhnete bude se ucit na balastu a podle toho bude vypadat.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
27. 1. 2025 9:30

Bez Podezdívky

A to ji jako provozovatelé webů mají v klidu nechat, ať její vlastník bez jakéhokoliv svolení vydělává na jimi vytvořených datech? To ať si milá AI bagruje balast, věřit se jí nedá tak jako tak.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
28. 1. 2025 8:58

bez prezdivky ...

Mno on kdyz to ten provozovatel dava verejne, tak proc ne pro AI? A kdyz je to za nejaky paywallem, tak se k tomu ani AI zadara nedostane ze?

Edit: A stejne je 99% vsechno na vsech webe obsano jinde, casto uplne stejnyma technikama i se stejnyma chybama.
28. 1. 2025, 08:59 editováno autorem komentáře
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
27. 1. 2025 10:10

Franta Kučera

No a? Jestli chce někdo kvalitní data, ať za ně zaplatí. Stejně jako jeho zákazníci platí za jeho natrénovaný model resp. služby. A když zachová princip copyleftu a udělá vše otevřené a svobodné, tak jsem ochotný mu k některým svým datům dát licenci zdarma.
- Zobrazit celé vlákno