Obsah

1. Výpočty v systému pevné řádové čárky na platformě IBM PC (3. část)

2. Univerzální algoritmus CORDIC

3. Princip činnosti CORDICu: rotace vektoru okolo počátku souřadného systému





4. Modifikace výpočtu rotace vektoru pro algoritmus CORDIC

5. Náhrada výpočtu tangenty za bitový posun

6. Hodnoty úhlů, po kterých se provádí rotace vektoru

7. Výpočet funkcí sinus a kosinus pomocí algoritmu CORDIC





8. Úplný zdrojový kód programu pro výpočet funkcí sin a cos algoritmem CORDIC

9. Výsledky výpočtů goniometrických funkcí: absolutní a relativní chyby

10. Vizualizace výsledků pro 5, 7 a 10 iterací algoritmu CORDIC

11. Výpočet tangenty s využitím algoritmu CORDIC

12. Demonstrační příklad: realizace výpočtu funkce tan

13. Výsledky výpočtů hodnot funkce tan

14. Výpočet arkustangenty s využitím algoritmu CORDIC

15. Demonstrační příklad: realizace výpočtu funkce arctan

16. Výsledky výpočtů hodnot funkce arctan

17. FX varianty výpočtů prováděných algoritmem CORDIC

18. Repositář s demonstračními příklady

19. Literatura

20. Odkazy na Internetu

1. Výpočty v systému pevné řádové čárky na platformě IBM PC (3. část)

V předchozí části tohoto seriálu jsme si uvedli stručné informace o algoritmu CORDIC, neboli COordinate ROtation DIgital Computer. Připomeňme si ve stručnosti, že se jedná o výpočetní metodu využívající iteraci, kterou pro účely jednoduchého a rychlého výpočtu goniometrických funkcí bez použití násobiček a děliček navrhl a zpopularizoval Jack Volder už v polovině minulého století (viz literatura uvedená v devatenácté kapitole).

Později se ukázalo, že tuto metodu je možné po malých úpravách použít i pro výpočty dalších matematických funkcí, například arkustangenty, arkussinu, arkuskosinu, ale i pro vyčíslení délky vektoru či jeho rychlou rotaci o libovolný úhel; včetně transformace bodu či vektoru z polárních souřadnic do souřadnic kartézských. Již větší úpravy si vyžádala aplikace metody CORDIC pro výpočet hyperbolických funkcí (sinh(), cosh(), tanh()) a funkcí logaritmických. Základní myšlenka i princip práce tohoto algoritmu však zůstává prakticky stále stejný.

2. Univerzální algoritmus CORDIC

Vzhledem k tomu, že se při aplikaci algoritmu CORDIC využívají pouze ty nejzákladnější matematické operace (konkrétně bitový posun doleva a doprava, součet, rozdíl a porovnání dvou hodnot, na konci výpočtu pak součin či podíl), je možné CORDIC využít ve všech číslicových systémech, ve kterých je zapotřebí šetřit použitými prostředky, tj. počtem logických hradel, kapacitou obsazené paměti, možnostmi použitých čipů atd. CORDIC tak byl implementován a s úspěchem používán například v kalkulačkách, osmibitových mikrořadičích (řada Intel 8051 a Motorola 68HC11), osmibitových domácích počítačích (Atari, Sinclair ZX Spectrum atd.) a taktéž v mnoha specializovaných obvodech vytvořených pomocí programovatelných polí FPGA.

Zajímavá je implementace CORDICu na mikrořadičové stavebnici Basic STAMP. V největší míře však bylo CORDICu využito v některých matematických koprocesorech (FPU), protože bylo zjištěno, že některé funkční bloky zabezpečující chod CORDICu zůstávají stále stejné, bez ohledu na to, jaká funkce je počítána, což do značné míry zjednodušilo (a tím pádem i zlevnilo a zefektivnilo) výrobu FPU. Samozřejmě se také snížil počet hradel nutných pro implementaci goniometrických, hyperbolických a logaritmických funkcí.

3. Princip činnosti CORDICu: rotace vektoru okolo počátku souřadného systému

Princip činnosti algoritmu CORDIC vychází z vyjádření rotace vektoru o určitý (vhodný) úhel δ a z následné úpravy vzorce pro rotaci vektoru takovým způsobem, aby se eliminovaly zbytečně složité a časově náročné multiplikativní operace (typická rotace vyžaduje čtyři součiny a dva součty). Nejprve si napišme vzorce pro hodnoty funkcí sinus a kosinus součtu dvou úhlů. Jedná se o známé středoškolské vztahy používané pro úpravu výrazů s goniometrickými funkcemi:

sin(α+β) = sin α cos β + cos α sin β

cos(α+β) = cos α cos β – sin α sin β

Jak si ukážeme o několik odstavců níže, je možné tyto vzorečky použít pro vyjádření rotace vektoru. Vektor r, kterým budeme rotovat, může být vyjádřen souřadnicemi [x 0 , y 0 ], přičemž je možné provést převod z kartézských souřadnic do souřadnic polárních (což přímo vychází z definice funkcí sin a cos):

x 0 = r cos φ

y 0 = r sin φ

kde r představuje délku vektoru r a φ je úhel vektoru měřený od kladné horizontální poloosy souřadného systému. V případě, že vektor r bude rotován o úhel δ, změní se koncový bod vektoru tak, že bude ležet na kružnici o stejném poloměru r, ale úhel vektoru (opět měřený od kladné horizontální poloosy) se zvětší o δ. Tuto skutečnost je možné vyjádřit vztahy:

x r = r cos (φ+δ)

y r = r sin (φ+δ)

V dalším kroku je možné rozepsat výrazy cos (φ+δ) a sin (φ+δ) podle prvních dvou uvedených vzorečků a následně zpětně dosadit za výrazy r cos φ a r sin φ původní souřadnice vektoru r, tj. x 0 a y 0 :

x r = r (cos φ cos δ – sin φ sin δ) = x 0 cos δ – y 0 sin δ

y r = r (sin φ cos δ + cos φ sin δ) = x 0 sin δ + y 0 cos δ

Všimněte si, že se ve výsledných vztazích nevyskytuje ani hodnota r ani úhel původního vektoru φ. To znamená, že převod na polární souřadnice pro nás byl pouze matematickou pomůckou při odvozování vzorce pro rotaci vektoru a ve skutečnosti se nebude nikdy provádět.

Poznámka: vzorce pro rotaci jsou často používány a lze je vyjádřit i maticově.

4. Modifikace výpočtu rotace vektoru pro algoritmus CORDIC

V předchozí kapitole jsme si odvodili, že rotaci jakéhokoli vektoru o úhel δ je možné zapsat pomocí vztahů:

x r = x 0 cos δ – y 0 sin δ

y r = x 0 sin δ + y 0 cos δ

Pro účely algoritmu CORDIC se tento vztah dále upravuje. První úprava spočívá v tom, že se obě rovnice vydělí hodnotou cos δ, takže dostaneme vztahy:

x r / cos δ = x 0 – y 0 sin δ/cos δ

y r / cos δ = x 0 sin δ/cos δ + y 0

Pokud si uvědomíme skutečnost, že sin δ / cos δ = tan δ, můžeme pokračovat v úpravách:

x r / cos δ = x 0 – y 0 tan δ

y r / cos δ = y 0 + x 0 tan δ

a následně:

x r = cos δ(x 0 – y 0 tan δ)

y r = cos δ(y 0 + x 0 tan δ)

5. Náhrada výpočtu tangenty za bitový posun

Nyní přichází základní myšlenka, na které je CORDIC postaven. Pokud budeme volit úhel δ takovým vhodným způsobem, aby jeho tangenta nabývala hodnot 2-i (pro i>0), je možné tangentu ve vzorci nahradit násobením zvolenou hodnotou 2-i; v tomto případě je však možné násobení nahradit jednoduchým a přitom rychlým bitovým posunem. Omezení hodnoty tangenty na zvolenou sadu hodnot však znamená, že se vektor nemůže rotovat o libovolný úhel, ale pouze o úhel odpovídající tangentě z dané sady. To však není v praxi problém, protože rotaci o libovolný je možné zapsat pomocí série rotací (doprava či doleva), například:

δ=δ 1 +δ 2 -δ 3 +…

Naproti tomu, že se parciální rotace mohou provádět v obou směrech (tj. jak doprava, tak i doleva), můžeme místo hodnoty cos δ dosadit konstantu K i , protože platí cos δ=cos -δ. Nakonec místo tan δ přímo dosadíme mocninu dvojky 2-i a s využitím parametru d i směr rotace (parametr d i nabývá pouze hodnot +1 a –1):

x r =K i (x 0 – y 0 d i 2-i)

y r =K i (y 0 + x 0 d i 2-i)

Zbývá nám zjistit hodnotu konstanty K i . Platí:

K i =cos (arctan 2-i)=1/(1+2-2i)1/2

Limitně se součin hodnot K i (po nekonečně mnoha iteracích) blíží k 0,6073. To znamená, že touto hodnotou bude v některých případech nutné vydělit výsledek (v jiných případech nám naopak toto zesílení při rotaci vadit nebude, protože se například vyruší podílem).

Veškerá práce algoritmu CORDIC spočívá v tom, že se nastaví počáteční souřadnice vektoru r a iterativně se provádí rotace o předem známé úhly δ 1 …δ n tak, aby se dosáhlo požadované hodnoty rotace δ.

6. Hodnoty úhlů, po kterých se provádí rotace vektoru

Jak jsme si již uvedli v předchozí kapitole, musí tangenty úhlů použitých v algoritmu CORDIC splňovat podmínku tan δ=2-i (pro celočíselné hodnoty i). V případě, že budeme veškeré výpočty provádět v prvním kvadrantu (ve skutečnosti je však snadné počítat i ve čtvrtém kvadrantu), začíná se s úhlem 45°, tj. π/4, protože tan π/4=1. Další úhly použité při výpočtech jsou samozřejmě menší. O jaké hodnoty se v algoritmu CORDIC konkrétně jedná, nám dá přehled následující jednoduchý program:

#include <stdio.h> #include <math.h> #ifndef M_PI #define M_PI 3.14159265358979323846 #endif int main(void) { double tan_value=1.0; double delta; int i; for (i=0; i<10; i++) { delta=atan(tan_value)*180.0/M_PI; printf("%d\t%12.10f\t%12.9f

", i+1, tan_value, delta); tan_value/=2.0; } return 0; }

Výsledek běhu tohoto programu nám ukazuje, že se hodnoty úhlů postupně (logicky) zmenšují a to vždy na více než polovinu předchozí hodnoty (například 45/2<26 nebo 26/2<14). Z toho také vyplývá, že jakýkoli úhel v prvním a čtvrtém kvadrantu je opravdu možné složit ze součtu těchto úhlů (musíme je samozřejmě vhodně vybrat). Ideální by sice byly hodnoty odpovídající přesně polovině hodnoty úhlu předchozího, tj. řada úhlů 45°, 45/2°, 45/4°…, tím by se však porušila podmínka tan δ=2-i, díky níž je algoritmus CORDIC tak rychlý a přitom implementačně velmi jednoduchý:

i 21-i úhel δ 1 1.0000000000 45.000000000° 2 0.5000000000 26.565051177° 3 0.2500000000 14.036243468° 4 0.1250000000 7.125016349° 5 0.0625000000 3.576334375° 6 0.0312500000 1.789910608° 7 0.0156250000 0.895173710° 8 0.0078125000 0.447614171° 9 0.0039062500 0.223810500° 10 0.0019531250 0.111905677°

7. Výpočet funkcí sinus a kosinus pomocí algoritmu CORDIC

Nyní si konečně na reálném příkladu ukážeme, jakým způsobem je možné algoritmus CORDIC použít pro výpočet hodnot goniometrických funkcí sinus a kosinus pro zadaný vstupní úhel. Nejprve jsou spočteny tabulky úhlů a hodnota druhých záporných mocnin hodnoty 2 (viz též předchozí kapitolu). Při implementaci CORDICu na FPU či FPGA by se tyto tabulky samozřejmě znovu nevytvářely: tabulka úhlů by byla uložena v paměti (či masce obvodu) a tabulka mocnin hodnoty 2 by se triviálně implementovala pomocí bitových posunů:

// tabulka arkustangentu úhlů double atans[MAX_ITER]; // tabulka záporných celočíselných mocnin hodnoty 2 double pows[MAX_ITER]; // naplnění tabulek atans[] a pows[] void createTables(void) { int i; for (i = 0; i < MAX_ITER; i++) { double p = pow(2.0, -i); atans[i] = atan(p); pows[i] = p; } }

Po konstrukci a naplnění tabulek je již možné algoritmus CORDIC spustit. Počáteční souřadnice vektoru r jsou nastaveny na hodnotu [1, 0]:

// výpočet funkcí sin() a cos() pro zadaný úhel delta void sincos(double delta, double *sin_value, double *cos_value) { int i; double x0 = 1.0; // nastavení počátečních podmínek double y0 = 0.0; ... ... ...

Vektor je posléze v iterační smyčce rotován tak dlouho, dokud neproběhne daný počet iterací. Úhel vektoru r se přitom neustále přibližuje k zadanému úhlu δ, jelikož se v iterační smyčce adaptivně zadaný úhel buď zmenšuje či zvětšuje o hodnotu uloženou v tabulce atans[]:

double xn; for (i = 0; i < MAX_ITER; i++) { // iterační smyčka if (delta < 0) { // úhel je záporný => rotace doleva xn = x0 + y0 * pows[i]; y0 -= x0 * pows[i]; delta += atans[i]; } else { // úhel je kladný => rotace doprava xn = x0 - y0 * pows[i]; y0 += x0 * pows[i]; delta -= atans[i]; } x0 = xn; } ... ... ...

Výsledek, tj. hodnoty funkcí sinus a kosinus, je uložen v nových souřadnicích vektoru r (vynásobený o konstantu K) a to z toho důvodu, že vektor rotoval na jednotkové kružnici a souřadnice jakéhokoli bodu ležícího na jednotkové kružnici přímo odpovídají hodnotám sinu a kosinu úhlu tohoto bodu počítaného od kladné horizontální poloosy:

*sin_value = y0 * K; // opravit "zesílení" výsledku *cos_value = x0 * K; }

8. Úplný zdrojový kód programu pro výpočet funkcí sin a cos algoritmem CORDIC

Celý program, který vypočte tabulku hodnot funkcí sin a cos s využitím algoritmu CORDIC a následně ještě vyjádří absolutní a relativní chyby výpočtu, vypadá následovně:

// -------------------------------------------------------- // Výpočet hodnot funkcí sin() a cos() pomocí iteračního // algoritmu CORDIC. // -------------------------------------------------------- #include <math.h> #include <stdio.h> #ifndef M_PI #define M_PI 3.14159265358979323846 #endif // maximální počet iterací při běhu algoritmu #define MAX_ITER 10 // "zesílení" při rotacích #define K 0.6073 // tabulka arkustangentu úhlů double atans[MAX_ITER]; // tabulka záporných celočíselných mocnin hodnoty 2 double pows[MAX_ITER]; // naplnění tabulek atans[] a pows[] void createTables(void) { int i; for (i = 0; i < MAX_ITER; i++) { double p = pow(2.0, -i); atans[i] = atan(p); pows[i] = p; } } // výpočet funkcí sin() a cos() pro zadaný úhel delta void sincos(double delta, double *sin_value, double *cos_value) { int i; double x0 = 1.0; // nastavení počátečních podmínek double y0 = 0.0; double xn; for (i = 0; i < MAX_ITER; i++) { // iterační smyčka if (delta < 0) { // úhel je záporný => rotace doleva xn = x0 + y0 * pows[i]; y0 -= x0 * pows[i]; delta += atans[i]; } else { // úhel je kladný => rotace doprava xn = x0 - y0 * pows[i]; y0 += x0 * pows[i]; delta -= atans[i]; } x0 = xn; } *sin_value = y0 * K; // opravit "zesílení" výsledku *cos_value = x0 * K; } int main(void) { int i; createTables(); for (i = 0; i <= 90; i++) { // výpočetní smyčka double delta; // úhel, ze kterého se počítá sin a cos double sin_value; // vypočtené hodnoty double cos_value; double sin_error; // absolutní chyby double cos_error; delta = i * M_PI / 180.0; // převod úhlu na radiány sincos(delta, &sin_value, &cos_value); // výpočet sinu a kosinu sin_error = fabs(sin_value - sin(delta)); // výpočet absolutních chyb cos_error = fabs(cos_value - cos(delta)); // tisk výsledků printf("%02d\t%12.10f\t%12.10f\t%12.10f\t%12.10f\t%8.3f%%\t%8.3f%%

", i, sin_value, cos_value, sin_error, cos_error, (sin_value != 0.0) ? 100.0 * sin_error / fabs(sin_value) : 0.0, (cos_value != 0.0) ? 100.0 * cos_error / fabs(cos_value) : 0.0); } return 0; } // finito

9. Výsledky výpočtů goniometrických funkcí: absolutní a relativní chyby

Výsledek běhu předchozího programu je zobrazen v následující tabulce. Kromě vypočtených hodnot sinů a kosinů zadaného úhlu je spočtena i absolutní a relativní chyba, přičemž je zapotřebí upozornit na to, že relativní chyba pro obě krajní hodnoty (ty by měly vyjít nulové) je poněkud zavádějící. V každém případě však výsledky běhu algoritmu pro deset iterací nejsou špatné, zvláště když si uvědomíme, že se v každé iteraci provádělo pouze několik základních operací, konkrétně dva bitové posuvy a tři součty (či rozdíly):

vstupní vypočtená hodnota vypočtená hodnota absolutní chyba absolutní chyba relativní chyba relativní chyba úhel sin() cos() sin() cos() sin() cos() 00 0.0011726802 1.0000761814 0.0011726802 0.0000761814 100.000% 0.008% 01 0.0167806202 0.9999360752 0.0006717863 0.0000883801 4.003% 0.009% 02 0.0363058568 0.9994176447 0.0014063601 0.0000268177 3.874% 0.003% 03 0.0519144682 0.9987285075 0.0004214880 0.0000989728 0.812% 0.010% 04 0.0714093909 0.9975241564 0.0016529171 0.0000398938 2.315% 0.004% 05 0.0858859660 0.9963821278 0.0012697767 0.0001874297 1.478% 0.019% 06 0.1053286152 0.9945147694 0.0008001519 0.0000071260 0.760% 0.001% 07 0.1208522102 0.9927479474 0.0010171332 0.0002017957 0.842% 0.020% 08 0.1401999641 0.9902008452 0.0010268631 0.0000672235 0.732% 0.007% 09 0.1556537948 0.9878894877 0.0007806702 0.0002011471 0.502% 0.020% 10 0.1749154013 0.9846615389 0.0012672237 0.0001462141 0.724% 0.015% 11 0.1902784482 0.9818084619 0.0005305471 0.0001812785 0.279% 0.018% 12 0.2092807371 0.9779342089 0.0013690463 0.0002133919 0.654% 0.022% 13 0.2245344811 0.9745450275 0.0004165732 0.0001749627 0.186% 0.018% 14 0.2435223655 0.9699745364 0.0016004699 0.0003211899 0.657% 0.033% 15 0.2586475676 0.9660513338 0.0001714775 0.0001255075 0.066% 0.013% 16 0.2774481762 0.9608206145 0.0018108204 0.0004410814 0.653% 0.046% 17 0.2924243921 0.9563690285 0.0000526874 0.0000642725 0.018% 0.007% 18 0.3073310520 0.9516834391 0.0016859423 0.0006269228 0.549% 0.066% 19 0.3251452218 0.9457453825 0.0004229326 0.0002268069 0.130% 0.024% 20 0.3435512762 0.9392157709 0.0015311329 0.0004768498 0.446% 0.051% 21 0.3581836921 0.9337334665 0.0001842574 0.0001530400 0.051% 0.016% 22 0.3763350045 0.9265666237 0.0017284111 0.0006172309 0.459% 0.067% 23 0.3907657879 0.9205736488 0.0000346594 0.0000687953 0.009% 0.007% 24 0.4050994316 0.9143567106 0.0016372115 0.0008112530 0.404% 0.089% 25 0.4228792420 0.9062708704 0.0002609802 0.0000369167 0.062% 0.004% 26 0.4368623186 0.8996138385 0.0015088282 0.0008197922 0.345% 0.091% 27 0.4543481744 0.8909104782 0.0003576747 0.0000960460 0.079% 0.011% 28 0.4682106568 0.8837038670 0.0012609060 0.0007562742 0.269% 0.086% 29 0.4853645826 0.8743997745 0.0005549624 0.0002199326 0.114% 0.025% 30 0.4989670003 0.8667096840 0.0010329997 0.0006842803 0.207% 0.079% 31 0.5157967696 0.8568006981 0.0007586947 0.0003666026 0.147% 0.043% 32 0.5291205039 0.8486372819 0.0007987604 0.0005891857 0.151% 0.069% 33 0.5446674419 0.8387437758 0.0000284069 0.0000732079 0.005% 0.009% 34 0.5577055299 0.8301314870 0.0014873735 0.0010939144 0.267% 0.132% 35 0.5738098078 0.8190824429 0.0002333714 0.0000696014 0.041% 0.008% 36 0.5865371490 0.8100172323 0.0012481033 0.0010002379 0.213% 0.123% 37 0.6022307543 0.7984183504 0.0004157312 0.0002171596 0.069% 0.027% 38 0.6146302652 0.7889127841 0.0010312101 0.0009020305 0.168% 0.114% 39 0.6299202599 0.7767587849 0.0005998689 0.0003871766 0.095% 0.050% 40 0.6418729918 0.7669112114 0.0009146178 0.0008667682 0.142% 0.113% 41 0.6567280845 0.7542293861 0.0006690555 0.0004801942 0.102% 0.064% 42 0.6684306187 0.7438778473 0.0006999876 0.0007330218 0.105% 0.099% 43 0.6828308344 0.7306817333 0.0008324743 0.0006719683 0.122% 0.092% 44 0.6941513412 0.7199358716 0.0005070292 0.0005960713 0.073% 0.083% 45 0.7062435465 0.7080775359 0.0008632347 0.0009707547 0.122% 0.137% 46 0.7199358716 0.6941513412 0.0005960713 0.0005070292 0.083% 0.073% 47 0.7306817333 0.6828308344 0.0006719683 0.0008324743 0.092% 0.122% 48 0.7438778473 0.6684306187 0.0007330218 0.0006999876 0.099% 0.105% 49 0.7542293861 0.6567280845 0.0004801942 0.0006690555 0.064% 0.102% 50 0.7669112114 0.6418729918 0.0008667682 0.0009146178 0.113% 0.142% 51 0.7767587849 0.6299202599 0.0003871766 0.0005998689 0.050% 0.095% 52 0.7889127841 0.6146302652 0.0009020305 0.0010312101 0.114% 0.168% 53 0.7984183504 0.6022307543 0.0002171596 0.0004157312 0.027% 0.069% 54 0.8100172323 0.5865371490 0.0010002379 0.0012481033 0.123% 0.213% 55 0.8190824429 0.5738098078 0.0000696014 0.0002333714 0.008% 0.041% 56 0.8301314870 0.5577055299 0.0010939144 0.0014873735 0.132% 0.267% 57 0.8387437758 0.5446674419 0.0000732079 0.0000284069 0.009% 0.005% 58 0.8486372819 0.5291205039 0.0005891857 0.0007987604 0.069% 0.151% 59 0.8568006981 0.5157967696 0.0003666026 0.0007586947 0.043% 0.147% 60 0.8667096840 0.4989670003 0.0006842803 0.0010329997 0.079% 0.207% 61 0.8743997745 0.4853645826 0.0002199326 0.0005549624 0.025% 0.114% 62 0.8837038670 0.4682106568 0.0007562742 0.0012609060 0.086% 0.269% 63 0.8909104782 0.4543481744 0.0000960460 0.0003576747 0.011% 0.079% 64 0.8996138385 0.4368623186 0.0008197922 0.0015088282 0.091% 0.345% 65 0.9062708704 0.4228792420 0.0000369167 0.0002609802 0.004% 0.062% 66 0.9143567106 0.4050994316 0.0008112530 0.0016372115 0.089% 0.404% 67 0.9205736488 0.3907657879 0.0000687953 0.0000346594 0.007% 0.009% 68 0.9265666237 0.3763350045 0.0006172309 0.0017284111 0.067% 0.459% 69 0.9337334665 0.3581836921 0.0001530400 0.0001842574 0.016% 0.051% 70 0.9392157709 0.3435512762 0.0004768498 0.0015311329 0.051% 0.446% 71 0.9457453825 0.3251452218 0.0002268069 0.0004229326 0.024% 0.130% 72 0.9516834391 0.3073310520 0.0006269228 0.0016859423 0.066% 0.549% 73 0.9563690285 0.2924243921 0.0000642725 0.0000526874 0.007% 0.018% 74 0.9608206145 0.2774481762 0.0004410814 0.0018108204 0.046% 0.653% 75 0.9660513338 0.2586475676 0.0001255075 0.0001714775 0.013% 0.066% 76 0.9699745364 0.2435223655 0.0003211899 0.0016004699 0.033% 0.657% 77 0.9745450275 0.2245344811 0.0001749627 0.0004165732 0.018% 0.186% 78 0.9779342089 0.2092807371 0.0002133919 0.0013690463 0.022% 0.654% 79 0.9818084619 0.1902784482 0.0001812785 0.0005305471 0.018% 0.279% 80 0.9846615389 0.1749154013 0.0001462141 0.0012672237 0.015% 0.724% 81 0.9878894877 0.1556537948 0.0002011471 0.0007806702 0.020% 0.502% 82 0.9902008452 0.1401999641 0.0000672235 0.0010268631 0.007% 0.732% 83 0.9927479474 0.1208522102 0.0002017957 0.0010171332 0.020% 0.842% 84 0.9945147694 0.1053286152 0.0000071260 0.0008001519 0.001% 0.760% 85 0.9963821278 0.0858859660 0.0001874297 0.0012697767 0.019% 1.478% 86 0.9975241564 0.0714093909 0.0000398938 0.0016529171 0.004% 2.315% 87 0.9987285075 0.0519144682 0.0000989728 0.0004214880 0.010% 0.812% 88 0.9994176447 0.0363058568 0.0000268177 0.0014063601 0.003% 3.874% 89 0.9999360752 0.0167806202 0.0000883801 0.0006717863 0.009% 4.003% 90 1.0000761814 0.0011726802 0.0000761814 0.0011726802 0.008% 100.000%

10. Vizualizace výsledků pro 5, 7 a 10 iterací algoritmu CORDIC

Numerické výsledky z předchozí kapitoly nám sice dají poměrně dobrý přehled o numerických chybách algoritmu CORDIC (které ovšem do značné míry závisí na počtu provedených iterací), ovšem taktéž je vhodné se podívat na to, jaký je průběh vypočtených funkcí sin a cos v porovnání s očekávaným průběhem. Pro tento účel si můžeme nechat průběhy porovnat například s využitím knihovny Matplotlib:

import numpy as np import matplotlib.pyplot as plt data_10_iter=[ ... ... ... ] data_7_iter=[ ... ... ... ] data_5_iter=[ ... ... ... ] def plot_results(data, filename, offset=0): a = np.array(data) plt.plot(a[:,0], a[:,1], "r-", label="cordic") plt.plot(a[:,0], offset+np.sin(np.deg2rad(a[:,0])), "b-", label="numpy") # přidání legendy plt.legend(loc="upper left") # povolení zobrazení mřížky plt.grid(True) # uložení do souboru plt.savefig(filename) # zobrazení grafu plt.show() # vysledky plot_results(data_5_iter, "cordic_5_iterations.png", offset=0) plot_results(data_7_iter, "cordic_7_iterations.png", offset=0.02) plot_results(data_10_iter, "cordic_10_iterations.png", offset=0.02)

V prvním případě jsou průběhy zobrazeny přesně tak, jak byly vypočteny:

Obrázek 1: Výpočet hodnot funkce sin algoritmem CORDIC pro pět iterací výpočtu. Autor: tisnik, podle licence: Rights Managed

Ve druhém a třetím případě je křivka s očekávaným průběhem posunuta o vzdálenost 0,02 jednotek vertikálním směrem, protože jinak by se oba průběhy překrývaly a nebyly by vidět žádné (podstatné) rozdíly:

Obrázek 2: Výpočet hodnot funkce sin algoritmem CORDIC pro sedm iterací výpočtu. Korektní průběh je posunut. Autor: tisnik, podle licence: Rights Managed

Obrázek 3: Výpočet hodnot funkce sin algoritmem CORDIC pro deset iterací výpočtu. Korektní průběh je posunut. Autor: tisnik, podle licence: Rights Managed

11. Výpočet tangenty s využitím algoritmu CORDIC

Výpočet goniometrické funkce tangent je odvozen z výše popsaného algoritmu pro výpočet funkcí sin() a cos(), jelikož je možné použít známý vztah:

tan α=sin α / cos α

Funkce sin() a cos() se pomocí algoritmu CORDIC počítají současně, výpočet dokonce není možné žádným způsobem rozdělit, neboť obě hodnoty jsou na sobě závislé (rotace vektoru). To znamená, že tangentu je možné vypočítat s podobnou složitostí, jako tyto dvě funkce. Jediný rozdíl spočívá v tom, že není zapotřebí obě vypočtené hodnoty násobit konstantou K i , protože se hodnota této konstanty vzájemným vydělením vypočtených hodnot vyruší. Na druhou stranu se musí aplikovat dělení, které se v některých případech (jednodušší FPU bez děličky) opět řeší iteračními metodami. Vzhledem k tomu, že se vzájemně dělí dvě obecně nepřesné hodnoty, relativní chyba výsledku (obecně) roste, přesněji řečeno, je součtem relativních chyb obou mezivýsledků. Z tohoto důvodu se při výpočtu tangenty používá větší počet iterací, než je nutné pro samostatný výpočet funkcí sin() a cos().

12. Demonstrační příklad: realizace výpočtu funkce tan

V této kapitole je uveden výpis demonstračního příkladu, který slouží pro výpočet goniometrické funkce tangent. Všimněte si, že před vlastním iteračním výpočtem je proveden test na vstup nulové hodnoty. Je to z toho důvodu, že pro nulový úhel (a také úhel blízký úhlu pravému) je relativní chyba velká a test na nulovou vstupní hodnotu je implementačně velmi jednoduchý: při HW realizaci postačuje hradlo AND s více vstupy. Na konci iteračního výpočtu je ošetřen stav, kdy je vypočtená tangenta nekonečná, tj. jedná se buď o úhel +90° nebo –90° (π/2 resp. -π/2). V tomto případě je vrácena hodnota +∞ nebo -∞ (jedná se o makra podle normy C99).

// -------------------------------------------------------- // Výpočet hodnot funkce tan() pomocí iteračního algoritmu // CORDIC. // -------------------------------------------------------- #include <math.h> #include <stdio.h> #ifndef M_PI #define M_PI 3.14159265358979323846 #endif // maximální počet iterací při běhu algoritmu #define MAX_ITER 10 // "zesílení" při rotacích #define K 0.6073 // tabulka arkustangentu úhlů double atans[MAX_ITER]; // tabulka záporných celočíselných mocnin hodnoty 2 double pows[MAX_ITER]; // naplnění tabulek atans[] a pows[] void createTables(void) { int i; for (i = 0; i < MAX_ITER; i++) { double p = pow(2.0, -i); atans[i] = atan(p); pows[i] = p; } } // výpočet funkce tan() pro zadaný úhel delta double tan_cordic(double delta) { int i; double x0 = 1.0; // nastavení počátečních podmínek double y0 = 0.0; double xn; if (delta==0) return 0.0; // ošetření nulového úhlu for (i = 0; i < MAX_ITER; i++) { // iterační smyčka if (delta < 0) { // úhel je záporný => rotace doleva xn = x0 + y0 * pows[i]; y0 -= x0 * pows[i]; delta += atans[i]; } else { // úhel je kladný => rotace doprava xn = x0 - y0 * pows[i]; y0 += x0 * pows[i]; delta -= atans[i]; } x0 = xn; } if (x0 == 0) // ošetření tangenty pravého úhlu if (y0 > 0) return INFINITY; else return -INFINITY; else return y0/x0; } int main(void) { int i; createTables(); for (i = 0; i <= 90; i++) { // výpočetní smyčka double delta; // úhel, ze kterého se počítá sin a cos double tan_value; // vypočtené hodnoty double tan_error; // absolutní chyby delta = i * M_PI / 180.0; // převod úhlu na radiány tan_value = tan_cordic(delta); // výpočet funkce tan tan_error = fabs(tan_value-tan(delta)); // výpočet absolutních chyb // tisk výsledků printf("%02d\t%14.10f\t%14.10f\t%12.10f\t%8.3f%%

", i, tan_value, tan(delta), tan_error, tan_error==0.0 ? 0:100.0*tan_error/tan(delta)); } return 0; } // finito

13. Výsledky výpočtů hodnot funkce tan

Výsledky běhu demonstračního příkladu z předchozí kapitoly jsou vypsány v následující tabulce:

úhel tan() podle CORDIC tan() podle FPU absolutní chyba relativní chyba 00 0,0000000000 0,0000000000 0,0000000000 0,00% 01 0,0167816929 0,0174550649 0,0006733720 3,86% 02 0,0363270120 0,0349207695 0,0014062425 4,03% 03 0,0519805611 0,0524077793 0,0004272182 0,82% 04 0,0715866282 0,0699268119 0,0016598162 2,37% 05 0,0861978187 0,0874886635 0,0012908448 1,48% 06 0,1059095535 0,1051042353 0,0008053183 0,77% 07 0,1217350391 0,1227845609 0,0010495218 0,85% 08 0,1415874009 0,1405408347 0,0010465662 0,74% 09 0,1575619507 0,1583844403 0,0008224896 0,52% 10 0,1776401275 0,1763269807 0,0013131468 0,74% 11 0,1938040418 0,1943803091 0,0005762673 0,30% 12 0,2140028799 0,2125565617 0,0014463183 0,68% 13 0,2303992887 0,2308681911 0,0004689025 0,20% 14 0,2510605756 0,2493280028 0,0017325728 0,69% 15 0,2677368774 0,2679491924 0,0002123150 0,08% 16 0,2887616814 0,2867453858 0,0020162957 0,70% 17 0,3057652260 0,3057306815 0,0000345445 0,01% 18 0,3229341180 0,3249196962 0,0019855782 0,61% 19 0,3437978423 0,3443276133 0,0005297710 0,15% 20 0,3657852506 0,3639702343 0,0018150164 0,50% 21 0,3836037852 0,3838640350 0,0002602498 0,07% 22 0,4061607605 0,4040262258 0,0021345346 0,53% 23 0,4244807446 0,4244748162 0,0000059284 0,00% 24 0,4430431000 0,4452286853 0,0021855853 0,49% 25 0,4666146246 0,4663076582 0,0003069665 0,07% 26 0,4856109365 0,4877325886 0,0021216521 0,44% 27 0,5099818506 0,5095254495 0,0004564011 0,09% 28 0,5298275522 0,5317094317 0,0018818794 0,35% 29 0,5550831516 0,5543090515 0,0007741002 0,14% 30 0,5757025789 0,5773502692 0,0016476903 0,29% 31 0,6020032089 0,6008606190 0,0011425899 0,19% 32 0,6234942951 0,6248693519 0,0013750568 0,22% 33 0,6493847795 0,6494075932 0,0000228137 0,00% 34 0,6718279437 0,6745085168 0,0026805731 0,40% 35 0,7005519564 0,7002075382 0,0003444182 0,05% 36 0,7241045321 0,7265425280 0,0024379959 0,34% 37 0,7542797006 0,7535540501 0,0007256505 0,10% 38 0,7790851887 0,7812856265 0,0022004378 0,28% 39 0,8109599430 0,8097840332 0,0011759098 0,15% 40 0,8369586757 0,8390996312 0,0021409555 0,26% 41 0,8707272570 0,8692867378 0,0014405192 0,17% 42 0,8985757825 0,9004040443 0,0018282618 0,20% 43 0,9345119814 0,9325150861 0,0019968952 0,21% 44 0,9641849623 0,9656887748 0,0015038125 0,16% 45 0,9974099032 1,0000000000 0,0025900968 0,26% 46 1,0371454016 1,0355303138 0,0016150878 0,16% 47 1,0700772381 1,0723687100 0,0022914719 0,21% 48 1,1128721912 1,1106125148 0,0022596764 0,20% 49 1,1484652535 1,1503684072 0,0019031537 0,17% 50 1,1948021199 1,1917535926 0,0030485273 0,26% 51 1,2331065284 1,2348971565 0,0017906282 0,15% 52 1,2835566823 1,2799416322 0,0036150501 0,28% 53 1,3257681457 1,3270448216 0,0012766760 0,10% 54 1,3810160766 1,3763819205 0,0046341561 0,34% 55 1,4274458745 1,4281480067 0,0007021322 0,05% 56 1,4884763418 1,4825609685 0,0059153733 0,40% 57 1,5399190611 1,5398649638 0,0000540973 0,00% 58 1,6038639132 1,6003345290 0,0035293841 0,22% 59 1,6611207136 1,6642794824 0,0031587687 0,19% 60 1,7370080258 1,7320508076 0,0049572182 0,29% 61 1,8015318914 1,8040477553 0,0025158639 0,14% 62 1,8874065642 1,8807264653 0,0066800989 0,36% 63 1,9608540947 1,9626105055 0,0017564108 0,09% 64 2,0592616947 2,0503038416 0,0089578531 0,44% 65 2,1430961381 2,1445069205 0,0014107824 0,07% 66 2,2571167455 2,2460367739 0,0110799716 0,49% 67 2,3558194635 2,3558523658 0,0000329023 0,00% 68 2,4620792981 2,4750868534 0,0130075554 0,53% 69 2,6068564457 2,6050890647 0,0017673810 0,07% 70 2,7338445118 2,7474774195 0,0136329076 0,50% 71 2,9086860855 2,9042108777 0,0044752078 0,15% 72 3,0966068440 3,0776835372 0,0189233068 0,61% 73 3,2704830864 3,2708526185 0,0003695321 0,01% 74 3,4630633646 3,4874144438 0,0243510793 0,70% 75 3,7350103188 3,7320508076 0,0029595113 0,08% 76 3,9831024743 4,0107809335 0,0276784592 0,69% 77 4,3402911778 4,3314758743 0,0088153035 0,20% 78 4,6728343111 4,7046301095 0,0317957983 0,68% 79 5,1598511079 5,1445540160 0,0152970920 0,30% 80 5,6293587144 5,6712818196 0,0419231052 0,74% 81 6,3467099468 6,3137515147 0,0329584321 0,52% 82 7,0627753134 7,1153697224 0,0525944090 0,74% 83 8,2145617824 8,1443464280 0,0702153544 0,86% 84 9,4420188415 9,5143644542 0,0723456127 0,76% 85 11,6012216411 11,4300523028 0,1711693383 1,50% 86 13,9690892768 14,3006662567 0,3315769799 2,32% 87 19,2379608497 19,0811366877 0,1568241620 0,82% 88 27,5277250976 28,6362532829 1,1085281853 3,87% 89 59,5887437442 57,2899616308 2,2987821135 4,01%

14. Výpočet arkustangenty s využitím algoritmu CORDIC

Výpočet arkustangenty se provádí poněkud odlišným způsobem, než výše uvedený výpočet sinu, kosinu či tangenty. Stále se však jedná o aplikaci velmi univerzálního principu, který algoritmus CORDIC představuje. Využívá se zde takzvaný vektorový režim výpočtu, ve kterém se – na rozdíl od výše popsaného rotačního režimu výpočtu – iterativně snažíme dosáhnout toho, aby se vynulovala hodnota uložená v registru y, tj. aby rotovaný vektor ležel na kladné či záporné horizontální poloose.

Výsledek běhu algoritmu CORDIC není v tomto případě uložen v registrech x nebo y (ty mají jiný význam), ale naopak v registru delta, který měl v rotačním režimu úlohu arbitru o směru rotace (ve vektorovém režimu tuto úlohu převzala hodnota v registru y, resp. přesněji řečeno znaménko hodnoty v tomto registru uložené).

Vstupem algoritmu jsou počáteční hodnoty x a y (ty byly u předchozích metod jedničkové resp. nulové), přičemž se počítá arctan(y/x). To je velmi praktické, protože takto je možné vypočítat i arkustangentu kladného a záporného nekonečna (1/0 resp. –1/0), což jsou legální operace (stejným způsobem tento problém řeší standardní céčkovská knihovní funkce atan2()). Demonstrační příklad na výpočet arkustangenty je, spolu s tabulkou výsledků, uveden v navazujících kapitolách.

Poznámka: v této kapitole sice mluvíme o registrech, čímž se odkazujeme na HW implementaci CORDICu. Naše SW implementace bude (pochopitelně) namísto registrů používat proměnné se stejnými názvy.

15. Demonstrační příklad: realizace výpočtu funkce arctan

V této kapitole je uveden výpis demonstračního příkladu, který provádí výpočet arkustangenty na základě čitatele a jmenovatele zlomku, tj. provádí se stejná operace, jaká je představována céčkovskou funkcí atan2(). Po překladu a spuštění tohoto příkladu se vypočte tabulka arkustangent pro hodnoty z intervalu 0,0 – 1,0, které odpovídají úhlům 0° – 45° (tj. 0 – π/4):

// -------------------------------------------------------- // Výpočet hodnot funkce atan() pomocí iteračního algoritmu // CORDIC. // -------------------------------------------------------- #include <math.h> #include <stdio.h> #ifndef M_PI #define M_PI 3.14159265358979323846 #endif // maximální počet iterací při běhu algoritmu #define MAX_ITER 10 // "zesílení" při rotacích #define K 0.6073 // tabulka arkustangentu úhlů double atans[MAX_ITER]; // tabulka záporných celočíselných mocnin hodnoty 2 double pows[MAX_ITER]; // naplnění tabulek atans[] a pows[] void createTables(void) { int i; for (i = 0; i < MAX_ITER; i++) { double p = pow(2.0, -i); atans[i] = atan(p); pows[i] = p; } } // výpočet funkce atan() pro zadané souřadnice x, y double atan_cordic(double y, double x) { int i; double x0 = x; // nastavení počátečních podmínek double y0 = y; double xn; double delta = 0.0; for (i = 0; i < MAX_ITER; i++) { // iterační smyčka if (y0 > 0) { // kladná polorovina => rotace doleva xn = x0 + y0 * pows[i]; y0 -= x0 * pows[i]; delta += atans[i]; } else { // záporná polorovina => rotace doprava xn = x0 - y0 * pows[i]; y0 += x0 * pows[i]; delta -= atans[i]; } x0 = xn; } return delta; // výsledek je uložen v akumulátoru úhlu } int main(void) { double i; createTables(); for (i = 0.0; i < 1.05; i += 0.05) { // výpočetní smyčka double atan_value; // vypočtená hodnoty double atan_error; // absolutní chyba double atan_float; // korektní hodnota atan_value = atan_cordic((double)i, 1.0) * 180.0 / M_PI; // výpočet funkce atan atan_float = atan(i) * 180.0 / M_PI; atan_error = fabs(atan_value - atan_float); // výpočet absolutní chyby // tisk výsledků printf("%3.2f\t%14.10f\t%14.10f\t%12.10f\t%8.3f%%

", i, atan_value, atan_float, atan_error, atan_float == 0 ? 0 : 100.0 * atan_error / atan_float); } // důkaz, že atan se spočte i pro nekonečno, tj. pravý úhel: printf("

atan nekonecna: %f

", atan_cordic(1.0, 0.0) * 180.0 / M_PI); return 0; } // finito

16. Výsledky výpočtů hodnot funkce arctan

V následující tabulce je ukázán výstup z předchozího programu spolu s absolutními a relativními chybami oproti hodnotě vypočtené pomocí standardní céčkovské funkce atan():

Poměr x:y arctan() podle CORDICu arctan() podle FPU absolutní chyba relativní chyba 0.00 –0.0671844765 0.0000000000 0.0671844765 0.000% 0.05 2.7517773513 2.8624052261 0.1106278749 3.865% 0.10 5.8218220046 5.7105931375 0.1112288671 1.948% 0.15 8.5064148794 8.5307656099 0.0243507306 0.285% 0.20 11.4158019957 11.3099324740 0.1058695216 0.936% 0.25 14.0934211874 14.0362434679 0.0571777195 0.407% 0.30 16.7781233252 16.6992442340 0.0788790912 0.472% 0.35 19.1966552419 19.2900462192 0.0933909773 0.484% 0.40 21.8812481167 21.8014094864 0.0798386303 0.366% 0.45 24.1192165378 24.2277453180 0.1085287801 0.448% 0.50 26.5731353460 26.5650511771 0.0080841690 0.030% 0.55 28.8111037672 28.8107937430 0.0003100242 0.001% 0.60 31.0480756412 30.9637565321 0.0843191092 0.272% 0.65 32.9990805987 33.0238675558 0.0247869571 0.075% 0.70 35.0132393733 34.9920201986 0.0212191747 0.061% 0.75 36.8027131694 36.8698976458 0.0671844765 0.182% 0.80 38.5930605898 38.6598082541 0.0667476643 0.173% 0.85 40.3755607029 40.3645365731 0.0110241298 0.027% 0.90 41.9420967692 41.9872124958 0.0451157267 0.107% 0.95 43.5077609186 43.5311992856 0.0234383670 0.054% 1.00 44.9257030151 45.0000000000 0.0742969849 0.165%

17. FX varianty výpočtů prováděných algoritmem CORDIC

V předchozích kapitolách jsme si uvedli, jakým způsobem je možné algoritmus CORDIC použít pro výpočet goniometrických funkcí s hodnotami uloženými ve formátu plovoucí řádové binární čárky (FP). Tentýž algoritmus je však po mírné modifikaci možné použít i při práci s formátem pevné řádové binární čárky (FX) a dá se říci, že teprve zde se plně ukazuje jeho implementační jednoduchost a současně i velká vyjadřovací síla – pomocí jednoho iteračního postupu je možné vypočítat poměrně velké množství navzájem značně odlišných funkcí, přičemž paměťové nároky algoritmu jsou minimální a rovnají se tabulce s cca deseti až dvaceti prvky s rozsahem 32 (popř. pouze 16) bitů. To je výhodné především při implementaci na mikrořadičích (oblíbená řada 8051, PICy, řada 68HC11 atd.) a také při práci s programovatelnými obvody typu FPGA.

Tímto velmi zajímavým tématem se budeme zabývat příště.

18. Repositář s demonstračními příklady

Demonstrační příklady napsané v assembleru, které jsou určené pro překlad s využitím assembleru NASM, byly uloženy do Git repositáře, který je dostupný na adrese https://github.com/tisnik/8bit-fame. Jednotlivé demonstrační příklady si můžete v případě potřeby stáhnout i jednotlivě bez nutnosti klonovat celý (dnes již poměrně rozsáhlý) repositář:

19. Literatura

Andraka, Ray: „A survey of CORDIC algorithms for FPGA based computers“,

ACM, 1998 Despain, A.M.:„Fourier Transform Computations Using CORDIC Iterations“,

IEEE Transactions on Computers, Volume 23, strany 993–1001, 1974 Mazenc C., Merrheim, X., Muller, J.M.: „Computing Functions Arccos and Arcsin Using CORDIC“,

IEEE Transactions on Computers, Volume 42, strany 118–122, 1993 Volder, Jack: „Binary computation algorithms for coordinate rotation and function generation“,

Convair Report IAR-1, 1956 Volder, Jack: „The CORDIC Trigonometric Computing Technique“,

IRE Transactions on Electronic Computing, Vol EC-8, strany 330–334, 1959 NVIDIA Corporation: „Floating-Point Specials on the GPU“,

2005 Grant R. Griffin: CORDIC FAQ,

http://www.dspguru.com/in­fo/faqs/cordic.htm Andraka Consulting Group, Inc.: What is all this CORDIC stuff anyhow?,

http://www.andraka.com/cordic.htm Cyliax Ingo: CORDIC (COordinate Rotation DIgital Computer), the swiss army knife for computing math functions…

http://www.ee.ualberta.ca/cou­rses/ee401/microboard/cor­dic_CCink.html

20. Odkazy na Internetu