Vlákno názorů k článku Vyrovnávací paměti a optimalizace programů od nxina - #include <stdio.h> #include <time.h> int main (void) { int i=0; //...

Článek je starý, nové názory již nelze přidávat.

17. 7. 2008 9:26

nxina (neregistrovaný)

#include <stdio.h>
#include <time.h>

int main (void)
{
int i=0;
// int *y = &i;
clock_t ticks1, ticks2;
ticks1 = clock();
while (i < 1000000000)
{
i++;
// y++;
}
ticks2 = clock();
printf("Done! %ld\n", ticks2-ticks1);
return 0;
}
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
17. 7. 2008 9:51

Jirka P (neregistrovaný)

Žeby proto, že za jednu smyčku inkrementuje i dvakrát? Koukal jste se do assembleru, jestli překladač na vaši hru s pointrem přistoupil?
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
17. 7. 2008 9:56

nxina (neregistrovaný)

Nekoukala, to ani neumím, ale v té odkomentované verzi dělá jen věci navíc, nechápu, jak to může být rychlejší.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
17. 7. 2008 10:37

Jirka (neregistrovaný)

No to tedy nedela. V cyklu skace po dvou, neprovadi polovinu podminek a skoku.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
17. 7. 2008 10:49

hisaak (neregistrovaný)

Jste si jisty ze dela jen polovinu podminek? Ja si to myslel na prvni pohled taky, ale nevypada to tak. Ja teda v cecku nic nenapsal uz hezkych par let, ale mam pocit, ze ten odkomentovany radek v cyklu by musel vypadat jinak, aby to "skakalo po dvou". Cekal bych tam neco jako (*y)++ a ne jen y++, protoze takhle to jen hybe s tim ukazatelem.

No, smiruji se s tim, ze je to na me moc slozite. :-)
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
17. 7. 2008 17:12

Jirka (neregistrovaný)

Mas pravdu! Ted jsem si to ale vyzkousel a odkementovana verze bezi o tri procenta dele. Takze otazku "Proc bezi rychleji?" pokladam za nesmyslnou. Uz s optimalizaci -O1 prekladac pozna prazdny cyklus a vysledek je v obou pripadech 0.

Pokud se v odkomentovane verzi zmeni 7. radek na int &y = i; a program se prelozi jako C++, dojde k zrychleni, ktere jsem popisoval, a to asi o 9 %.

Testovano na i686 AMD Athlon(tm) XP 1800+ AuthenticAMD GNU/Linux s gcc 4.1.2. Sypu si popel na hlavu.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
17. 7. 2008 17:18

Jirka (neregistrovaný)

Jo a ta Tvoje verze s radkem 13 ve tvaru (*y)++; je take zrychleni, ale jen asi o 5 % (i kdyz tedy to mereni je +-autobus).
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
17. 7. 2008 10:50

Michal Vyskocil (neregistrovaný)

Opravdu? Vždyť y++ prostě posunuje hodnotu ukazatele a samotná hodnota i se vůbec nemění. Schválně si tam přidej čítač a porovnej oba výstupy. Aby platilo to, co říkáš, muselo by být na onom řádku (*y)++.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
17. 7. 2008 11:47

kvr (neregistrovaný)

Popravde me prekvapuje, ze oba kody nebezi stejnou a to nulovou dobu. Mam tu gcc 3.4.4 a kupodivu neprijde na to, ze se tam vlastne nic nedeje.
Nicmene po odkomentovani mi kod rozhodne bezi pomaleji. Zatimco (s optimalizacemi) prvni jen dekrementuje v registru i, dokud nedojde na nulu, tak druhy jde skutecne 0-10000 a navic si jeste promennou nesmyslne uklada do pameti (asi vznikle zmatkem pri alokaci registru pro y, ktere se pak vyhodi). y spravne ignoruji oba kody.

V kterem prekladaci je to naopak?
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
17. 7. 2008 12:26

Pavel Tišnovský

Zlatý podporovatel

po optimalizaci (tusim snad staci -O2) by prekladac mel tu smycku nahradit prirazenim i=koncova_hodnota

mas vystup z gcc -S ? Docela by me to zajimalo, proc tam smycku ponechal.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
17. 7. 2008 13:05

mity (neregistrovaný)

Hmmm. Taky me to zaujalo. Vyzkousel jsem to tu prelozit na stroji na 64bitech pomoci gcc verze 4.1.2 20061115 prerelease (netlucte me, ja ten stroj nespravuju).

Pri zapnute optimalizaci (staci -O nebo -O1) to celou smycku vyhodi a program vypise 0.

Pokud ale pustim gcc bez jakehokoliv optimalizacniho prepinace, pak tu opravdu verze bez komentaru bezi rychleji: s komentarem okolo 3330000, bez komentare 2920000.

Koukal jsem trochu, co z toho gcc vyplodilo a podle mych chabych znalosti assembleru se mi jevi, ze ta verze s komentari v te smychce dela addl primo na misto v pameti, kdezto ta verze bez komentaru inkrementuje obe ty promenne v registrech.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
17. 7. 2008 15:51

Pavel Tišnovský

Zlatý podporovatel

Zajimave je to po kompilaci s Intelim prekladacem s rozbalenim smycek. Sice se jiz dneska spatne odhaduji parovani instrukci, naplneni instrukcnich pipeline atd, ale zda se me, ze Intel odvedl opravdu dobrou praci. Samozrejme je vhodne do te smycky dat neco, co prekladaci zabrani v jeji eliminaci, ale umozni jeji rozbaleni.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
17. 7. 2008 16:25

kvr (neregistrovaný)

3.4 (odkomentovano):
movl $0, -8(%ebp)
call _clock
movl %eax, %ebx
movl -8(%ebp), %eax
jmp L9
.p2align 4,,7
L11:
incl %eax
movl %eax, -8(%ebp)
L9:
cmpl $999999999, %eax
jle L11

Tedy i[mem] = 0; i[reg] = i[mem]; while (i[reg] < 9999999) i[mem] = ++i[reg];

Se zakomentovanym to vypada zhruba:
movl $99999999, %eax
L9:
decl %eax
jns L9

gcc 4.0 oboji prelozi jako posledni kod.

%eax (ani pripadne i[mem]) uz nikde cteno neni, takze v obou pripadech je i write-only, predpokladam, ze novejsi prekladac to vyhodi uplne.

Takze vysvetleni bude asi skutecne takove, jak pise kolega vedle, v debug modu gcc nacpe kolem tolik kodu, nad kterym nepremysli, ze muze delsi kod lip nacpat pipeliny

Komerční sdělení

ML Prague už po jedenácté přiváží světové odborníky na produkční AI

Vlákno názorů k článku Vyrovnávací paměti a optimalizace programů od nxina - #include &lt;stdio.h&gt; #include &lt;time.h&gt; int main (void) { int i=0; //...

Komerční sdělení

ML Prague už po jedenácté přiváží světové odborníky na produkční AI

Dále u nás najdete

Vzniká vakcína proti tuberkulóze, která nenenchá jizvičku na paži

OSVČ ušetří na minimálních zálohách sedm stovek měsíčně

Děti tráví hromadu času před obrazovkami. Co to znamená?

Mzdy ovlivní několik novinek. Měly by pomoci hlavně ženám

Soud zakázal televizní vysílání filmu Sbormistr

Qualcomm chce Nvidii konkurovat v provozu AI

Segment počítačů pod 500 dolarů do dvou let zcela zmizí

Daňové přiznání za rok 2025: Jak si snížit daň?

Unikátní studie Anthropicu odhaluje, co si lidé myslí o AI

Ceny benzínu a nafty stále rostou. Češi i Slováci to berou s humorem

Soud konstatoval, že Meta a YouTube způsobují závislost

„Limituje nás už prakticky jen rychlost světla“

Umělá inteligence už řídí i top manažery tuzemských firem

Český projekt umí hledět AI agentům pod ruce

Chytré televizory pod přísnějším dohledem?

Miliardy z EU, strach z hackerů a marný boj s tabulkovými platy (2.)

Nová zelená úsporám, nebo lobby bank? Sítě vřou kvůli úvěrům

Pokuta 80 tisíc za švarcsystém programátorů platí, potvrdil soud

ChatGPT spotřebuje stejně elektřiny jako některé státy

Dotazy a odpovědi kolem okruhu zaměstnanců pro účely JMHZ

Vlákno názorů k článku Vyrovnávací paměti a optimalizace programů od nxina - #include <stdio.h> #include <time.h> int main (void) { int i=0; //...