Hlavní navigace

Jak pružné jsou internetové prohledávače? (2)

27. 4. 2000
Doba čtení: 3 minuty

Sdílet

Uplynulo již něco přes 70 dní od doby, kdy jsme testovali rychlost reakce prohledávačů Internetu na změny stránek. Od změny obsahu inkriminovaných stránek uběhlo již více než 100 dní, je tedy čas podívat se vyhledávačům znovu na zoubek.

18.1. 2000 jsme změnili design a celou strukturu firemních stránek a po zhruba měsíci nás zajímalo, zda o změně již vědí přední české i zahraniční vyhledávače. Jak to tenkrát dopadlo, si můžete přečíst zde.

A jak jsme dopadli dnes?

Kompas Seznam – o změně stále neví
… a potvrzuje tím, že je momentálně mrtvola, pracující údajně s půl roku starou databází. Prý se pracuje na nové verzi, takže se necháme překvapit, kdy se na kvalitě projeví švédské dolary (nebo koruny?).

Fulltext Centrum  – o změně ví
Minule jsem si postěžoval, že Centrum nachází jednu stránku v několika různých kódováních češtiny a vydává to za různé stránky. Byl jsem hned upozorněn, že si za to mohu sám, neb nemáme v rootu serveru soubor robots.txt, kterým lze prohledávání nepohodlných stránek zakázat. Napravil jsem a pomohlo to. Jenže jsem samozřejmě nepodchytil všechny varianty češtiny a některé se opět do Centra prodraly. Alespoň mám co ladit… Nechcete-li tedy, aby vaší stránku nacházelo Centrum (a samozřejmě i jiné vyhledávače respektující tento standard) milionkrát, použijte robots.txt, může vypadat třeba nějak takhle a pokud vás problematika web robotů zajímá více, navštivte určitě The Web Robots FAQ.

msn.atlas.cz
Atlas mě tentokrát pobavil:

Výsledky fulltextového hledání 4web /> Nebyl nalezen žádný odpovídající dokument, zkuste svůj dotaz přeformulovat.

?? Nevíte někdo jak srozumitelněji formulovat dotaz ‚najdi slovo 4web?‘. Nebo se opravdu veškeré zmínky o 4WeBu z databáze Atlasu ztratily?

UPDATE: Najednou jsme zase zpět a Atlas nás zná. Je to ale vtipálek…

Sherlock  – o změně neví
… a je na tom stejně jako před dvěma měsíci.

Najdi.to
Jak jsme již minule zjistili, najdi.to je jakýmsi hybridem fulltextu a katalogu, čili nelze dost dobře hodnotit rychlost jeho reakcí.

Search.cz
HTTP/1.0 403 Access Forbidden
No comment

Megatext.cz
jsem vyzkoušel na doporučení jednoho čtenáře a jsem velmi mile překvapen. Vzhledem k tomu, že na druhém místě výpisu uvádí odkaz na první článek na téma rychlost reakce vyhledávačů, který vyšel na ROOTovi 15.2.2000 a zná i článek o Glib C, který vyšel 13.3., je jeho reakce v porovnání s ostatními superrychlá. Megatext dokáže údajně zadané české slovo automaticky vyhledat ve všech pádech nebo i nepravidelných tvarech.

A vzhůru za hranice:

Alltheweb  – o změně ví
Můj favorit nezklamal a změnu již zaregistroval.

Google  – o změně ví
Podle očekávání i Google už o změnách ví.

Altavista  – o změně ví
Sice nás, narozdíl od jiných, nevypisuje na předních místech, ale o změně již také ví.

Northernlight  – o změně ví
Northernlight o změně jako jediný věděl už po 27 dnech a od minulého článku stačil náš server navštívit ještě jednou někdy v březnu, což znamená, že nás navštěvuje zhruba v měsíčních cyklech, to je slušné.

Hotbot  – o změně ví
Momentálně má údaje ze 7.4.2000.

ict ve školství 24

Infoseek – o změně ví
První zmínka o českém 4webu je oproti minulému pokusu o dvě místa níže – na 67. místě, tentokrát alespoň už se zaregistrovanou změnou.

Co z tohoto tříměsíčního pozorování plyne? Pokud chcete něco hledat v Čechách, je asi nejmoudřejší začít na Megatextu a pokračovat na Centrum. V zahraničí se zdá nejaktuálnější Northernlight. Zahraniční prohledávače navštíví vaší stránku zhruba jednou za jeden až tři měsíce. České (pokud jsou funkční) o něco častěji – měsíc až dva.
Výše uvedená doporučení platí, pokud chcete co nejčerstvější data. Není zohledňována velikost databáze a je možné, že rychleji reagující vyhledávač má menší databázi a tudíž nemusí mít potřebnou informaci. Stále platí, že nejlepší výsledek poskytne kombinace několika prohledávačů.

Autor článku

V roce 1998 jsem s Michalem vymyslel a založil Root.cz. Poslední článek na Roota jsem napsal v roce 2007. Teď píšu spíš na tomaskrause.cz a tvořím si bitcoinvkapse.cz.