Vlákno názorů k článku Pohled pod kapotu JVM - průchod hodnotami atributů objektů uložených na haldě (heapu) od Chytrolin - V tabulce jednoduchych tyopu je napsano ze char...

Článek je starý, nové názory již nelze přidávat.

9. 1. 2013 2:14

Chytrolin (neregistrovaný)

V tabulce jednoduchych tyopu je napsano ze char ma rozsah 0..2^32-1 .
Pokud si matne, vzpominam, tak by mel byt jen 16bitovy, tedy s rozsahem 0..2^16-1 pravdepodbne kvuli tomu puvodnimu Unicodu, kde se zadalo ze 65536 znaku preci musi stacit kazdemu ....
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
9. 1. 2013 7:50

kvr (neregistrovaný)

Tak tak.

Jinak bych řekl, že 256 znaků musí stačit každému. Docela by mě zajímalo, jak by se celá Java zrychlila a zmenšila, kdyby String byl postaven na UTF-8. S tou velikostí by to šlo s těmito utilitami možná zjistit...
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
9. 1. 2013 9:59

Rax (neregistrovaný)

Mít stringy uvnitř aplikace v UTF-8 je produkt chovanců Chocholouška, protože se u každého znaku musí pracně zjišťovat, kolik byte vlastně má a proto se UTF-8 používá jenom pro uložení dat mimo aplikaci, například do XML nebo do databáze.
Java by se s použitím UTF-8 tedy ještě zásadně zpomalila.
A pomalost Javy není ani náhodou způsobena tím že stringy mají dva byte na znak.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
11. 1. 2013 8:15

Pavel Stěhule

Pokud budu vycházet z předpokladu, že nejčastějšími operacemi nad řetězci jsou kopírování, sčítání, porovnání řetězců a hledání podřetězce, tak ani při jedné z těchto operací se nemusí provádět zjišťování velikosti každého znaku v řetězci - naopak tyto operace budou rychlejší z důvodu téměř poloviční velikosti. Díky tomu můžete mít lepší využití CPU cache, můžete lépe využít operační paměť - velké množství řetězců se drží v různých caches.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
9. 1. 2013 10:48

Pavel Tišnovský

Zlatý podporovatel

Slo by to relativne jednoduse - projit JVM TI agentem pres vsechny char[] a otestovat, kolik je tam znaku > 127. To stejne s constant poolem.

Dokonce je mozny si upravit tridu String, StringBuffer a StringBuilder tak, aby namisto char[] pouzivala byte[] (protoze Stringy budou urcite ty tridy, kde se char[] vyuziva absolutne nejvic) a pri cteni/zapisu provadet prevod char->byte[] (UTF-8) a naopak. Ale bude to dost pomale rekl bych, ty posuny osmibitovych hodnot...
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
9. 1. 2013 11:21

kvr (neregistrovaný)

Kdyby bylo v UTF-8 úplně všechno, tak ty konverze prakticky vypadnou.
Co by se zpomalilo, jsou locale aware parsery, maps, atd. a těch je IMHO minimum (z hlediska podílu na CPU). Nehledě na to, že ty by měly správně být Unicode32 aware a tedy pomalé už tak :-)

S tou úpravou je to zajímavé, zkoušel to už někdo v praxi?
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
9. 1. 2013 13:41

Pavel Tišnovský

Zlatý podporovatel

To by chtelo otestovat na realnych aplikacich. Pravda je, ze spousta javovskych aplikaci neustale pracuje s XML, takze s UTF-8, tam ty konverze asi budou hooodne bolet. Hmm na takovym aplikacnim serveru co generuje stovky XHTML stranek za hodinu...
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
10. 1. 2013 16:22

Pavel Tišnovský

Zlatý podporovatel

Tak zatim jsem prisel na dve moznosti jak to vyuzit - bud si zkompilovat svoji OpenJDK s upravou tridy String nebo pres xbootclasspath tam nacpat svoji tridu String v runtime, coz vsak pravdepodobne nebude fungovat dokonale (kvuli constant poolu, ktery uz bude naplneny).
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
10. 1. 2013 20:59

kvr (neregistrovaný)

Hm, to by skoro stálo za test. Tedy myslím tu první možnost, ta druhá by asi byla dost problematická (nějak si nedokážu představit funkčnost reflection).
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
9. 1. 2013 10:33

Pavel Tišnovský

Zlatý podporovatel

Jo to se omlouvam, chyba copy & paste. Ma byt samozrejme 2^16-1.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
9. 1. 2013 10:35

Pavel Tišnovský

Zlatý podporovatel

Jeste pro jistotu doplnim, ze pokud se znak do toho rozsahu 0x0000 az 0xffff (ted to hodne zjendodusuju) nevleze, tak se ve stringu pouzije dvojice znaku. Ale v nasich koncinach to neni az tak aktualni rekl bych:)
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
9. 1. 2013 11:31

Rax (neregistrovaný)

To proto, že většina aplikací které podporují více než 255 znaků velmi rozumně používá UCS-2 a znaky nad 0xFFFF tak nejsou podporovány.
Až to bude aktuální, přejde se rovnou na 4 byte na znak, ale ne na UTF-16 nebo UTF-8.

Vlákno názorů k článku Pohled pod kapotu JVM - průchod hodnotami atributů objektů uložených na haldě (heapu) od Chytrolin - V tabulce jednoduchych tyopu je napsano ze char...

Dále u nás najdete

U všech zaměstnanců se bude hlásit dosažené vzdělání

Stát chystá vlastního mobilního operátora

JMHZ v otázkách zaměstnavatelů a odpovědích odborníků

Repasovaným mobilům vládnou iPhony. Co na to Android?

Magda Blouin vede lokální marketing v Schneinder Electric

Investory nejvíce lákají technologie, ale potřebují větší transparentnost

Od Sazky k Allwynu: Připomeňte si 70letý příběh legendární značky

Ruské drony prý zabíjí Ukrajince i kvůli Česku

Jen desetina nemocnic plní požadavky na kyberbezpečnost

Daně 2026: Návrat k bezlimitnímu osvobození příjmů a nové odpočty

Na magnetické rezonanci nedaleko Prahy mají volno

Prohlídka u praktika, která vám může zachránit srdce

Obchody stahují z prodeje dubajskou čokoládu a medy

Hemoroidy zhoršuje vysedávání s mobilem na záchodě

Quishing: Myslete, než skenujete, QR kód může být past

AI v podnikání: Buzzword, nebo realita?

České Epico slaví úspěch, vstupuje na švýcarský trh

Kontrolní hlášení

Kyberbezpečnost nemocnic v ČR se moc nelepší

První dítě dostalo lék, který odloží nástup cukrovky o několik let