Hlavní navigace

Jak pružné jsou internetové prohledávače? (2)

Tomáš Krause

Uplynulo již něco přes 70 dní od doby, kdy jsme testovali rychlost reakce prohledávačů Internetu na změny stránek. Od změny obsahu inkriminovaných stránek uběhlo již více než 100 dní, je tedy čas podívat se vyhledávačům znovu na zoubek.

18.1. 2000 jsme změnili design a celou strukturu firemních stránek a po zhruba měsíci nás zajímalo, zda o změně již vědí přední české i zahraniční vyhledávače. Jak to tenkrát dopadlo, si můžete přečíst zde.

A jak jsme dopadli dnes?

Kompas Seznam – o změně stále neví
… a potvrzuje tím, že je momentálně mrtvola, pracující údajně s půl roku starou databází. Prý se pracuje na nové verzi, takže se necháme překvapit, kdy se na kvalitě projeví švédské dolary (nebo koruny?).

Fulltext Centrum  – o změně ví
Minule jsem si postěžoval, že Centrum nachází jednu stránku v několika různých kódováních češtiny a vydává to za různé stránky. Byl jsem hned upozorněn, že si za to mohu sám, neb nemáme v rootu serveru soubor robots.txt, kterým lze prohledávání nepohodlných stránek zakázat. Napravil jsem a pomohlo to. Jenže jsem samozřejmě nepodchytil všechny varianty češtiny a některé se opět do Centra prodraly. Alespoň mám co ladit… Nechcete-li tedy, aby vaší stránku nacházelo Centrum (a samozřejmě i jiné vyhledávače respektující tento standard) milionkrát, použijte robots.txt, může vypadat třeba nějak takhle a pokud vás problematika web robotů zajímá více, navštivte určitě The Web Robots FAQ.

msn.atlas.cz
Atlas mě tentokrát pobavil:

Výsledky fulltextového hledání 4web /> Nebyl nalezen žádný odpovídající dokument, zkuste svůj dotaz přeformulovat.

?? Nevíte někdo jak srozumitelněji formulovat dotaz ‚najdi slovo 4web?‘. Nebo se opravdu veškeré zmínky o 4WeBu z databáze Atlasu ztratily?

UPDATE: Najednou jsme zase zpět a Atlas nás zná. Je to ale vtipálek…

Sherlock  – o změně neví
… a je na tom stejně jako před dvěma měsíci.

Najdi.to
Jak jsme již minule zjistili, najdi.to je jakýmsi hybridem fulltextu a katalogu, čili nelze dost dobře hodnotit rychlost jeho reakcí.

Search.cz
HTTP/1.0 403 Access Forbidden
No comment

Megatext.cz
jsem vyzkoušel na doporučení jednoho čtenáře a jsem velmi mile překvapen. Vzhledem k tomu, že na druhém místě výpisu uvádí odkaz na první článek na téma rychlost reakce vyhledávačů, který vyšel na ROOTovi 15.2.2000 a zná i článek o Glib C, který vyšel 13.3., je jeho reakce v porovnání s ostatními superrychlá. Megatext dokáže údajně zadané české slovo automaticky vyhledat ve všech pádech nebo i nepravidelných tvarech.

A vzhůru za hranice:

Alltheweb  – o změně ví
Můj favorit nezklamal a změnu již zaregistroval.

Google  – o změně ví
Podle očekávání i Google už o změnách ví.

Altavista  – o změně ví
Sice nás, narozdíl od jiných, nevypisuje na předních místech, ale o změně již také ví.

Northernlight  – o změně ví
Northernlight o změně jako jediný věděl už po 27 dnech a od minulého článku stačil náš server navštívit ještě jednou někdy v březnu, což znamená, že nás navštěvuje zhruba v měsíčních cyklech, to je slušné.

Hotbot  – o změně ví
Momentálně má údaje ze 7.4.2000.

Infoseek – o změně ví
První zmínka o českém 4webu je oproti minulému pokusu o dvě místa níže – na 67. místě, tentokrát alespoň už se zaregistrovanou změnou.

Co z tohoto tříměsíčního pozorování plyne? Pokud chcete něco hledat v Čechách, je asi nejmoudřejší začít na Megatextu a pokračovat na Centrum. V zahraničí se zdá nejaktuálnější Northernlight. Zahraniční prohledávače navštíví vaší stránku zhruba jednou za jeden až tři měsíce. České (pokud jsou funkční) o něco častěji – měsíc až dva.
Výše uvedená doporučení platí, pokud chcete co nejčerstvější data. Není zohledňována velikost databáze a je možné, že rychleji reagující vyhledávač má menší databázi a tudíž nemusí mít potřebnou informaci. Stále platí, že nejlepší výsledek poskytne kombinace několika prohledávačů.

Našli jste v článku chybu?
Vitalia.cz: Jsou čajové sáčky toxické?

Jsou čajové sáčky toxické?

Lupa.cz: Teletext je „internetem hipsterů“

Teletext je „internetem hipsterů“

Podnikatel.cz: Přehledná titulka, průvodci, responzivita

Přehledná titulka, průvodci, responzivita

Vitalia.cz: Znáte „černý detox“? Ani to nezkoušejte

Znáte „černý detox“? Ani to nezkoušejte

DigiZone.cz: „Black Friday 2016“: závěrečné zhodnocení

„Black Friday 2016“: závěrečné zhodnocení

Vitalia.cz: Co pomáhá dítěti při zácpě?

Co pomáhá dítěti při zácpě?

Lupa.cz: Insolvenční řízení kvůli cookies? Vítejte v ČR

Insolvenční řízení kvůli cookies? Vítejte v ČR

Vitalia.cz: I církev dnes vyrábí potraviny

I církev dnes vyrábí potraviny

120na80.cz: Na ucho teplý, nebo studený obklad?

Na ucho teplý, nebo studený obklad?

Podnikatel.cz: Udávání kvůli EET začalo

Udávání kvůli EET začalo

Lupa.cz: Proč firmy málo chrání data? Chovají se logicky

Proč firmy málo chrání data? Chovají se logicky

Lupa.cz: Propustili je z Avastu, už po nich sahá ESET

Propustili je z Avastu, už po nich sahá ESET

120na80.cz: Co všechno ovlivňuje ženskou plodnost?

Co všechno ovlivňuje ženskou plodnost?

Měšec.cz: Kdy vám stát dá na stěhování 50 000 Kč?

Kdy vám stát dá na stěhování 50 000 Kč?

Podnikatel.cz: Snížení DPH na 15 % se netýká všech

Snížení DPH na 15 % se netýká všech

Podnikatel.cz: K EET. Štamgast už peníze na stole nenechá

K EET. Štamgast už peníze na stole nenechá

120na80.cz: Pánové, pečujte o svoje přirození a prostatu

Pánové, pečujte o svoje přirození a prostatu

Lupa.cz: Co se dá měřit přes Internet věcí

Co se dá měřit přes Internet věcí

Vitalia.cz: Paštiky plné masa ho zatím neuživí

Paštiky plné masa ho zatím neuživí

Podnikatel.cz: Podnikatelům dorazí varování od BSA

Podnikatelům dorazí varování od BSA