Hlavní navigace

Lingea Lexicon - konečně linuxový slovník

27. 8. 2001
Doba čtení: 8 minut

Sdílet

Před nedávnem vyšla napjatě očekávaná linuxová verze slovníku Lingea Lexicon 2000, jejíž beta verzi jste mohli vidět na jaře na Linux Expu. Dnes vám přinášíme její recenzi, konkrétně verze velkého anglického slovníku.

První dojem

Slovníky Lingea Lexicon jsou na platformách Windows a MacOS poměrně populární a při letném seznámení s nimi na mne zapůsobily dojmem kvalitních produktů, takže když mi z Lingey přišel email, že vyšla linuxová verze slovníku, zajásal jsem. (Tento email jsem si vysloužil tím, že jsem o slovník projevil zájem na již zmíněném Expu, kde slibovali vydání slovníku během jednoho až dvou měsíců :) Vyrozuměl jsem, že v současnosti jsou pro Linux k dispozici pouze anglický a německý velký slovník za 1990,– Kč, levnější studijní bohužel (zatím?) ne.

I nelenil jsem a objednal anglický slovník, který mi přišel obratem po uhrazení faktury. Zabalen je v klasické krabici formátu A4, která bohužel přísluší k wokenní verzi a je na ní jenom malá přelepka „Verze pro Linux“. Krabice obsahuje kromě propagačních materiálů jedno vypalované CD-R (sic!) médium s černobílou papírovou (sic!) nálepkou místo potisku (optimisticky budu předpokládat, že to je specifická vlastnost první série určené k ukojení nedočkavců, jako jsem já). Dále je zde manuál k wokenní verzi a papír s poznámkami o linuxové verzi, z nichž se kromě trivialit typu „spusťte terminálovou konzoli a napište ./lexicon“ dozvíte pouze seznam funkcí, které v této verzi nejsou implementovány.

Zde musím zmínit nepříliš seriózní jednání Lingey. Firma se tváří, jako by linuxová verze byla plnohodnotnou sestřičkou té windowsové, i cena je stejná. Z emailu o vydání nové verze (ten je stále jediným zdrojem informací o linuxové verzi) jsem se dozvěděl pouze o dvou neimplementovaných drobnostech, konkrétně je to absence zachytávání obsahu schránky (to mi nevadí) a režimu „stay on top“ (koho to bolí, když tohle umí každý window manager?). Skutečnost je bohužel trošku horší, to se ale dozvíte až tehdy, když zaplatíte. K chybějícím funkcím se ještě vrátím.

První dojem tedy nic moc. Detaily, říkám si a nedočkavě vrážím médium do CD-ROM mechaniky.

Instalace

Úplně první věc, kterou mi instalační program řekl, bylo Segmentation fault. Po pár hodinách už mi bylo jasné, co to způsobuje – Lexicon je kompletně staticky linkovaný a statická verze GTK+ se nesnáší s tématy, která používají jiný než standardní renderovací engine. S pomocí zdrojáků GTK+ se mi podařilo najít řešení, stačí instalaci spustit příkazem GTK_RC_FILES=/et­c/gtk/gtkrc.cs ./setup (smazat ~/.gtkrc nestačí, obsahuje-li /etc/gtk/gtkrc nějaké divoké téma). Lexicon se mi takto úspěšně podařilo nainstalovat, i když mezi ostatními GTK+ aplikacemi vypadal se svým defaultním vzhledem jako mimozemšťan. Ještě jsem po instalačním programu opravil pěkně pitomě nastavená přístupová práva (spouštění pro všechny soubory a pro žádné z vytvořených adresářů) a záhy po spuštění Lexiconu se objevil další problém – můj Mandrake 8.0 má definice locales v /usr/share/locale, ne v /usr/lib/locale jako RedHat 7, jehož glibc autoři staticky přilinkovali, což s kompletně českým UI pěkně zamávalo. Bohužel ani po vytvoření symlinku nefungovala česká klávesnice. Takže jsem to vzdal a napsal technické podpoře.

Následovalo velmi příjemné překvapení v podobě rychlé odpovědi. Výsledkem naší korespondence bylo, že příští verze Lexiconu bude nejspíš linkovaná dynamicky a GTK+ bude na CD s ní. Během víkendu jsem dostal dynamicky slinkovanou binárku včetně opravy jedné z chybějících funkcí, která už běhá zcela bezproblémově. Takhle si představuju ideálně fungující technickou podporu, všechna čest!

Slovníková data

Slovník má přes 50 MB a dalšího téměř půl gigabajtu zaberou namluvená hesla (ta můžete nechat na CD). Deklarovaný rozsah je 170 000 hesel (přičemž 70 000 z nich je namluveno rodilým mluvčím) a 250 000 významů. Kromě anglicko-českého a česko-anglického slovníku je součástí Lexiconu i výkladový slovník WorldNet, což považuji za velké plus, protože si můžete překlady ověřit. Občas je to potřeba, některá hesla jsou přeložena nepřesně, ne-li špatně:

Tabulka č. 182
anglicky Lexicon WorldNet
nerd buran, křupan a student who studies excessively
geek měkkouš, pako, ťulpas a person with an unusual or odd personality
rationale odůvodněný  – (správně odůvodnění)

(uznávám, že to není úplně běžná slovní zásoba :)

Obecnou angličtinu pokrývá slovník slušně, odbornou terminologii ovšem příliš ne (to však od slovníků tohoto typu ani nelze očekávat). Hesla jsou roztříděna do tematických okruhů a popsána z hlediska syntaxe i sémantiky. V praxi to znamená, že se k danému heslu zobrazí i příslušná synonyma a antonyma, odvozená slova a slovní spojení, která je obsahují. Jenom příkladů je málo, většina hesel žádné nemá.

Slovník WorldNet je bohužel pojatý nějak divně a u spousty hesel chybí jejich výklad, namísto něj narazíte jenom na jakési kryptické odkazy, navíc zhusta mířící na sebe sama. Viz tento malý příklad:

    in other ways
      Adv
          in other ways:1, otherwise:3

nebo

    Arbor Day
      N
          Arbor Day:1
          day:5

Program

Jak již z předchozího vyplynulo, Lexicon používá knihovnu GTK+ (konečně komerční aplikace neběžící nad Motifem!). Uživatelské rozhraní je jednoduché a přehledné a na rozdíl od drtivé většiny konkurenčních slovníků (pro Windows) je navržené inteligentně. Doteď si pamatuji na demoverzi jakéhosi slovníku, který používal záložky k přepínání slovníkových náplní a navíc byl tak neuvěritelně pomalý, že člověku nezbylo, než se zájmem sledovat pozvolné překreslování UI :) Lexicon je naštěstí malá, rychle startující a svižně běžící aplikace. Jenom po kliknutí na ikonku „výslovnost“ následuje trošku nepříjemná pomlka.

Lexicon v plné kráse
Lexicon v plné kráse

Základní funkce slovníku asi nikoho nepřekvapí: do kolonky vlevo nahoře zadáte slovo a zobrazí se vám překlad. Lexicon ovšem názorně demonstruje, že i na tomto poli se dá mnohé vymyslet. Zdánlivě nepodstatným, ovšem práci se slovníkem výrazně usnadňujícím vylepšením je to, že nemusíte explicitně určit směr překladu – program sám pozná, v jakém jazyce vstup je. V případě nejednoznačných slov samozřejmě zobrazí oba směry. Dokonce ani není nutné slovo zadat v základním tvaru, protože Lexicon má zabudovanou kvalitní morfologickou analýzu a ve většině případů si základní tvar určí sám. Analýza dokonce funguje jak pro angličtinu, tak pro češtinu. V případě anglických slovníků lze navíc hledat hesla podle výslovnosti (musíte ovšem nejdřív zatrhnout volbu Fonetické vyhledávání schovanou v menu Hesla/Najít). Potřebujete ovšem trochu štěstí nebo cviku při odhadování toho pravého přepisu výslovnosti. K heslu „strike“ kupříkladu vede dotaz „straik“, ale už ne „strajk“. Lexicon je částečně imunní i k překlepům a málokdy se stane, že by k vašemu dotazu nenašel žádné heslo, vždy se snaží nabídnout alespoň něco.

Pohyb po slovníku je vyřešen velice pěkně, kromě standardního zadávání hesla můžete přecházet i na hesla tematicky nebo jazykově spřízněná (synonyma, slovní spojení, abecední okolí slova, …). Text hesel navíc funguje jako hypertext, takže ověření zpětných překladů je triviální (na screenshotu vidíte situaci, kdy jsem si pomocí kombinace Ctrl+levé tlačítko nechal zobrazit heslo „směřovat“ v pomocném okně). Má to ovšem i svoji stinnou stránku – do schránky nejde přenést celý text, ale jenom jednotlivé významy. Navíc nestačí pouhé označení myší, musíte stisknout Ctrl-C (a text se pak přesto nelogicky přenese do primary selection).

Konečně posledním navigačním prostředkem je fulltextové vyhledávání, podporující prohledávání nejen hesel, ale i jejich definic a příkladů. Zvládá základní logické operátory and, or, rozdíl („foo – bar“ najde výskyty foo neobsahující bar) i operátor + (and omezené na stejnou položku) a je pekelně rychlé.

Pokud toužíte po intenzivím sebevzdělávání, Lexicon vám může nabídnout učící režim, v němž se v několikasekun­dových intervalech zobrazují hesla z vybraných tematických okruhů. Komplementární režim zkoušení nenabízí žádné speciální funkce, dokonce je až nezdravě primitivní. Pouze totiž zobrazuje hesla a o tom, zda byla odpověď správná, nebo ne, rozhodujete vy (k čemuž vám Lexicon nabízí tlačítka „správně“, „špatně“ a „zobrazit heslo“). Takové zkoušení je opravdu jenom pro notorické poctivce mezi námi :)

Oproti windowsové verzi chybějí některé funkce, přičemž důvod jejich absence je mi záhadou, protože jsou buď platformově zcela nezávislé, nebo není problém je implementovat i pod Linuxem. Chybějící nápovědu vem čert, autoři však vynechali i užitečnou funkci Tvarosloví (k danému slovu zobrazí všechny tvary – velmi závislé na operačním systému…) a porovnávání správné výslovnosti s tím, co řeknete do mikrofonu. Absence Tvarosloví působí obzvláště hloupě ve spojitosti s rozpoznáváním tvaru vstupního slova. Pokud například zadám minulý čas „stood“, Lexicon správně zobrazí překlad slova „stand“, ale už si bohužel nemohu nechat vypsat časování inkriminovaného slovesa, díky němuž bych se dozvěděl, že minulý čas je opravdu „stood“.

Navíc se ve verzi z cédéčka zápis výslovnosti zobrazoval zcela nesmyslně (není se co divit, místo fontu s fonetickými znaky se používala helvetica). Tato chyba je už opravena ve verzi, kterou jsem dostal od technické podpory. Doufám, že Lingea má v plánu vydat bezplatné patche doplňující chybějící funkce. Bylo mi řečeno, že na září připravují další verzi, ale bohužel jsem z odpovědi nevyrozuměl, jestli ji stávající uživatelé automaticky dostanou.

CS24_early

Poměrně otravnou chybou je způsob, jakým Lexicon zachází s /dev/dsp. Pokud při spuštění Lexiconu používá zvukovou kartu nějaký jiný program, Lexicon se zablokuje a čeká na uvolnění zařízení, aniž by ovšem vypsal jakýkoliv výstup. Slušně vychované programy si zjistí, že /dev/dsp je zablokované a pokračují dál bez zvuku. (Já jsem díky tomuto chování konečně přešel na používání esd a mám po problému, Lexicon prostě spouštím jako esddsp lexicon.) Tip pro autory: knihovna libao je užitečný pomocník…

Pár slov závěrem

Přestože má Lexicon ještě svoje mouchy, rozhodně oceňuji odvahu, s kterou se Lingea vrhla na novou platformu (a zvláště, když jde o port komerčního desktopového produktu na převážně serverový systém, jehož uživatelé jsou zvyklí mít veškerý software zadarmo :) Žádný jiný výrobce slovníků o Linux nejeví nejmenší zájem a Lexicon je tak v současnosti jediný (a navíc kvalitní) slovník pro Linux. (Abych zabránil námitkám v diskusním fóru, předesílám, že xdict si podle mě označení slovník nezaslouží :) Osobně mi Lexicon 2000 zatím moc dobře slouží a doufám, že Lingee zájem o linuxový trh vydrží.

Byl pro vás článek přínosný?

Autor článku