od kedy pouzivam v pg utf-8 tak nieje problem :)
Názory k článku
Hezky česky v PostgreSQL
Re: utf-8
celé vláknoProblemem u unicode (utf-8) v pg jsou case-insensitivni regularni vyrazy. Ty se nam rozchodit nepodarilo. A take to_ascii() myslim funguje pouze pro omezenou mnozinu kodovani. Jinak pouzivame postgres k plne spokojenosti.
Jezovec
Re: utf-8
celé vláknoMokud nekdo doda prevodni tabulky pro jina kodovani tak to do to_ascii() rad pridam. Vice na zakkr@zf.jcu.cz.
Re: utf-8
celé vláknoNo, kdy o tom tak premyslim, ono to_ascii() z unicode asi ani neni mozne, protoze patrne neexistuji standardni prevody vsech unicodovych znaku na ascii sekvenci (viz. napr. vice ruznych prevodu cinstiny do latinky). My to resime vlastnimi castecnymi prevodnimi tabulkami, ktere misto neznamych znaku davaji '?'.
Pokud jde o unicode upper/lower case, to je soucasti unicode standardu, viz. http://www.unicode.org/Public/UNIDATA/CaseFolding.txt
Re: utf-8
celé vláknoPokud si vzpominam i transkripce je soucasti unicode stantartu^...
Re: utf-8
celé vláknoMokud nekdo doda prevodni tabulky pro jina kodovani tak to do to_ascii() rad pridam. Vice na zakkr@zf.jcu.cz.
A co ruzna abecedni trideni?
celé vláknoNetusi nekdo, jestli PgSQL bude nekdy v dohledne dobe podporovat ruzna abecedni trideni na urovni tabulek, nejlepe sloupcu? Ceske trideni je opravdu dost nekompatibilni s ostatnimi (diky "ch") a kdyz clovek pouziva vic jazyku najednou, tak ma problem. Dodatecne prerovnavani neni asi moc efektivni.
Re: A co ruzna abecedni trideni?
celé vláknoSortuje se dle locale a finalnim resenim problemu s locale by melo byt locale-per-column. Kdy to bude rict nedokazu, ale predpoklada se to snad v nejake budouci verzi.
Spatne trideni
celé vláknoAsi 3hodiny jsem sedivel u PostgreSQL 7.3.2 na Debianovi 3.0r1... Tridilo to porad spatne a spatne... Nastavoval jsem locales a porad to nepomahalo. Navic to psalo v initdb ze nemuze najit lc_messsages=''...
Nakonec jsem chybu nasel v locales v debianovi:
je potreba updatnout balicek locales a provest
localedef -i cs_CZ -f ISO-8859-2 cs_CZ
localedef -i en_US -f ISO-8859-1 en_US
Snad to nekomu usetri ty 3 hodiny :)
Aleq
Problém s českýn vyhledáváním
celé vláknoDíky Airie - drdoc@email.cz

