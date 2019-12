11. Trojúhelníkové matice

1. Popis vybraných balíčků nabízených projektem Gonum

Na článek Gophernotes: kombinace interaktivního prostředí Jupyteru s jazykem Go, který je součástí seriálu o programovacím jazyku Go, dnes navážeme. Popíšeme si totiž možnosti vybraných balíčků nabízených projektem Gonum. Opět použijeme interaktivní smyčku jazyka Go (REPL) implementovanou projektem Gomacro, protože právě zcela interaktivní prostředí (realizované buď v terminálu, nebo v projektech typu Jupyter Notebook) je pro testování možností nových či neznámých knihoven takřka ideálním nástrojem.

Popis instalace balíčků Gonum a Gomacro byl uveden minule, takže si dnes již můžeme smyčku REPL Gomacra přímo spustit. V případě, že je adresář $HOME/go/bin vložen do proměnné prostředí PATH, bude možné Gomacro spustit příkazem gomacro:

$ gomacro // GOMACRO, an interactive Go interpreter with generics and macros // Copyright (C) 2018-2019 Massimiliano Ghilardi <https://github.com/cosmos72/gomacro> // License MPL v2.0+: Mozilla Public License version 2.0 or later <http://mozilla.org/MPL/2.0/> // This is free software with ABSOLUTELY NO WARRANTY. // // Type :help for help gomacro>

Poznámka: opět je nutné již před popisem jednotlivých funkcí a metod připomenout, že knihovny pro numerické a symbolické výpočty podporované v rámci projektu Gonum nejsou ze syntaktického hlediska tak dobře integrovány, jako je tomu například ve specializovaných jazycích R a Julia či v Pythonu doplněném o balíčky NumPy a SciPy. Je tomu tak z toho prostého důvodu, že jazyk Go (ve verzi 1.x) nepodporuje přetěžování operátorů, takže například není možné implementovat maticové operace „přirozenou“ cestou (zrovna příklad NumPy ukazuje, že přetěžování operátorů, pokud je použito v rozumné míře, může být v praxi velmi užitečné). Tato vlastnost programovacího jazyka Go je nejvíce viditelná právě u maticových a vektorových operacích, kde i vytvoření řezu je nutné implementovat samostatnou funkcí.

2. Pomocný balíček gonum.org/v1/gonum/floats

Prvním balíčkem, s nímž se v dnešním článku setkáme, je pomocný balíček (knihovna) s plným jménem gonum.org/v1/gonum/floats, k jehož funkcím budeme přistupovat pouze s využitím poslední části názvu – floats. Tento balíček slouží k operacím prováděným nad řezy (slice) a poli (array) hodnot typu float64. Jedná se tedy o velmi užitečné rozšíření základní knihovny programovacího jazyka Go, díky jehož existenci lze ušetřit psaní mnoha programových smyček (nalezení maximálního či minimálního prvku, výpočet sumy všech prvků atd.). Možnosti tohoto balíčku otestujeme přímo v interaktivní smyčce (REPL) implementované v rámci projektu Gomacro, už jen z toho důvodu, že v výstupů je patrná jak hodnota výsledku (výsledků), tak i její typ.

Nejprve je pochopitelně nutné balíček importovat:

gomacro> import "gonum.org/v1/gonum/floats"

Následně vytvoříme dvojici řezů, z nichž každý ukazuje na pole o šesti prvcích (mnoho dále popsaných operací vyžaduje, aby oba řezy měly shodný počet prvků):

gomacro> x := []float64{1,2,3,4,5,6} gomacro> y := []float64{1,5,3,5,5,0}

Funkce Min a Max vyhledají prvek s poli s minimální resp. maximální hodnotou (vrací se přímo hodnota takového prvku):

gomacro> floats.Min(x) 1 // float64 gomacro> floats.Max(x) 6 // float64

Podobným způsobem lze najít indexy prvků s minimální resp. maximální hodnotou:

gomacro> floats.MinIdx(x) 0 // int gomacro> floats.MaxIdx(x) 5 // int gomacro> floats.MinIdx(y) 5 // int gomacro> floats.MaxIdx(y) 1 // int

Poznámka: povšimněte si, že pokud existuje několik prvků s totožnou hodnotou, vrátí se index prvního z nich.

Funkce Sum vrátí součet prvků v poli, funkce Prod naopak výsledek součinu všech prvků:

gomacro> floats.Sum(x) 21 // float64 gomacro> floats.Prod(x) 720 // float64

Porovnání všech prvků ve dvou řezech zajišťuje funkce Equal:

gomacro> floats.Equal(x,x) true // bool

Porovnání všech prvků, ovšem na podobnost (do určitého rozsahu), nikoli na totožnost:

x := []float64{1, 2, 3, 4, 5, 6} y := []float64{1, 2, 3, 4, 5, 6} z := []float64{1.0, 2.2, 2.8, 4.2, 4.8, 6.0} fmt.Printf("x: %v

", x) fmt.Printf("y: %v

", y) fmt.Printf("z: %v

", z) fmt.Printf("x~=y (±0,10)?: %t

", floats.EqualApprox(x, y, 0.1)) fmt.Printf("x~=z (±0,05)?: %t

", floats.EqualApprox(x, z, 0.05)) fmt.Printf("x~=z (±0,09)?: %t

", floats.EqualApprox(x, z, 0.09)) fmt.Printf("x~=z (±0,10)?: %t

", floats.EqualApprox(x, z, 0.10)) fmt.Printf("x~=z (±0,11)?: %t

", floats.EqualApprox(x, z, 0.11))

S výsledky:

x: [1 2 3 4 5 6] y: [1 2 3 4 5 6] z: [1 2.2 2.8 4.2 4.8 6] x~=y (±0,10)?: true x~=z (±0,05)?: false x~=z (±0,09)?: false x~=z (±0,10)?: true x~=z (±0,11)?: true

NaN (Not a Number) jsou považovány za shodné (v obecném případě to ovšem neplatí, protože porovnání dvou NaN na ekvivalenci vrací podle normy hodnotu false a nikoli true). Poznámka: existují i další možnosti porovnání, například porovnání hodnot ze dvou řezů, přičemž dvě hodnoty(Not a Number) jsou považovány za shodné (v obecném případě to ovšem neplatí, protože porovnání dvouna ekvivalenci vrací podle normy hodnotua nikoli).

3. Další funkce z balíčku gonum.org/v1/gonum/floats

Popišme si ještě některé další vybrané funkce, které nalezneme v balíčku gonum.org/v1/gonum/floats. Často používanou funkcí je funkce provádějící skalární součin prvků ze dvou řezů o shodné délce:

gomacro> floats.Dot(x, x) 91 // float64 gomacro> floats.Dot(x, y) 65 // float64

Následující dvě funkce nazvané Reverse a Scale změní obsah původního řezu. Nejedná se tedy o funkce v matematickém významu (což je zvláštní, protože toto chování neodpovídá pravidlům, které knihovna Gonum v jiných balíčcích dodržuje).

Otočení všech prvků v řezu:

gomacro> floats.Reverse(x) gomacro> x [6 5 4 3 2 1] // []float64

Změna měřítka prvků (vynásobení každého prvku konstantou):

gomacro> floats.Scale(10, x) gomacro> x [60 50 40 30 20 10] // []float64

Užitečná je i funkce nazvaná Within, která vrací index i takového prvku z řezu s, pro který platí s[i] <= v < s[i+1]. Funkci lze použít pouze pro řezy, v nichž jsou prvky seřazeny vzestupně a současně řez obsahuje alespoň dva prvky (tyto podmínky jsou testovány a pokud nejsou splněny, vyvolá se panic):

gomacro> x := []float64{1,2,3,4,5,6} gomacro> floats.Within(x, 3) 2 // int gomacro> floats.Within(x, 3.5) 2 // int gomacro> floats.Within(x, 10) -1 // int

Vypočítat můžeme i takzvanou kumulativní sumu, což je nový řez, jehož první prvek je zkopírován z původního řezu, druhý prvek obsahuje hodnotu prvního sečtenou z hodnotou druhého prvku atd.:

gomacro> floats.CumSum(x, y) [1 6 9 14 19 19] // []float64 gomacro> floats.CumSum(x, x) [1 7 16 30 49 68] // []float64

Zajímavá je funkce nazvaná Argsort. Tato funkce setřídí řez předaný v prvním parametru, navíc ovšem do dalšího řezu (ten musí být vytvořen) vloží původní indexy prvků. Tento druhý řez tedy musí být typu []int a nikoli []float64:

gomacro> y [1 5 3 5 5 0] // []float64 gomacro> indexes := [6]int{} gomacro> floats.Argsort(y, indexes)

Řez y by měl být po provedení operace Argsort setříděn a navíc by řez indexes měl obsahovat původní indexy v nesetříděném řezu:

gomacro> y [0 1 3 5 5 5] // []float64 gomacro> indexes [5 0 2 1 3 4] // [6]int

Poznámka: zajímavé v tomto kontextu je, že balíček Gonum prozatím nenabízí plnohodnotné „indexování“ s využitím obsahu jiného řezu, tedy operaci, kterou najdeme jak v jazyku Julia, tak i v knihovně NumPy pro programovací jazyk Python.

4. Jednorozměrné vektory

Nyní se vrátíme k popisu balíčku gonum.org/v1/gonum/mat, s jehož základním použitím jsme se již seznámili minule. Ovšem v předchozím článku jsme se zabývali převážně popisem práce s běžnými čtvercovými a obdélníkovými maticemi, i když možnosti tohoto balíčku jsou ve skutečnosti větší. Pracovat lze i s vektory, které jsou (minimálně z pohledu balíčku mat) sloupcové. Výchozím typem vektorů je datová struktura vecdense představující vektor s měnitelnými (mutable) prvky. Interně se jedná o pole prvků, a proto je zde použito slovo „dense“

Nový sloupcový vektor se vytvoří konstruktorem nazvaným NewVecDense, a to následujícím způsobem:

gomacro> v := mat.NewVecDense(10, nil) gomacro> mat.Formatted(v) ⎡0⎤ ⎢0⎥ ⎢0⎥ ⎢0⎥ ⎢0⎥ ⎢0⎥ ⎢0⎥ ⎢0⎥ ⎢0⎥ ⎣0⎦ // fmt.Formatter

V případě, že budeme chtít vektor inicializovat prvky se známou hodnotou, použijeme sice stejný konstruktor, ale namísto druhé hodnoty nil lze předat řez s hodnotami typu float64. Volání konstruktoru tedy bude vypadat následovně:

gomacro> v := mat.NewVecDense(10, []float64{1,2,3,4,5,6,7,8,9,10}) gomacro> mat.Formatted(v) ⎡ 1⎤ ⎢ 2⎥ ⎢ 3⎥ ⎢ 4⎥ ⎢ 5⎥ ⎢ 6⎥ ⎢ 7⎥ ⎢ 8⎥ ⎢ 9⎥ ⎣10⎦ // fmt.Formatter

U vektorů lze zjistit jejich velikost (délka zde vlastně odpovídá výšce) a taktéž kapacitu:

gomacro> v.Len() 10 // int gomacro> v.Cap() 10 // int

Metoda Dims vrací dimenzi vektoru – n řádků a jeden sloupec:

gomacro> v.Dims() 10 // int 1 // int

Pochopitelně je možné vytvořit i řádkový vektor o to maticovou operací transpozice zapisovanou metodou se jménem T:

gomacro> v.T() {Matrix:0xc001792870} // gonum.org/v1/gonum/mat.Matrix gomacro> mat.Formatted(v.T()) [ 1 2 3 4 5 6 7 8 9 10] // fmt.Formatter

Poznámka: výsledkem je v tomto případě matice s jedním řádkem.

5. Získání řezu (slice) z vektoru

Často je zapotřebí z vektoru získat pouze určitou část. V případě polí a řezů (jakožto základních datových typů programovacího jazyka Go) je pro tento účel použit operátor řezu (slice), ovšem u vektorů typu vecdense je namísto toho nutné použít metodu nazvanou SliceVec. Použití této metody je snadné, i když nutno podotknout, že ne tak čitelné, jako použití skutečného operátoru pro provedení řezu.

Nejprve vytvoříme nový vektor s deseti prvky:

gomacro> v := mat.NewVecDense(10, []float64{1,2,3,4,5,6,7,8,9,10})

Následně vytvoříme řez tvořený prvky s indexy 4 a 5:

gomacro> mat.Formatted(v.SliceVec(4, 6)) ⎡5⎤ ⎣6⎦ // fmt.Formatter

Poznámka: povšimněte si, že první prvek řezu je určen „včetně“, zatímco druhý prvek „kromě“ (uzavřený vs. otevřený interval).

Podobně lze vytvořit řez obsahující všechny původní prvky:

gomacro> mat.Formatted(v.SliceVec(0, 9)) ⎡1⎤ ⎢2⎥ ⎢3⎥ ⎢4⎥ ⎢5⎥ ⎢6⎥ ⎢7⎥ ⎢8⎥ ⎣9⎦ // fmt.Formatter

Indexy prvků musí být kladná čísla – jinými slovy to znamená, že není povolena počítat indexy od konce vektoru tak, jak to známe z některých jiných knihoven:

gomacro> mat.Formatted(v.SliceVec(0, -1)) mat: index out of range

Řez vektoru je skutečným řezem ve smyslu, že se jedná o „pohled“ na původní vektor. V dalším příkladu vytvoříme řez nazvaný w, jehož obsah je nepřímo změněn modifikací obsahu původního vektoru v:

gomacro> v := mat.NewVecDense(10, []float64{1,2,3,4,5,6,7,8,9,10}) gomacro> w := v.SliceVec(0, 9) gomacro> mat.Formatted(w) ⎡1⎤ ⎢2⎥ ⎢3⎥ ⎢4⎥ ⎢5⎥ ⎢6⎥ ⎢7⎥ ⎢8⎥ ⎣9⎦ // fmt.Formatter gomacro> v.SetVec(5, 100) gomacro> mat.Formatted(w) ⎡ 1⎤ ⎢ 2⎥ ⎢ 3⎥ ⎢ 4⎥ ⎢ 5⎥ ⎢100⎥ ⎢ 7⎥ ⎢ 8⎥ ⎣ 9⎦ // fmt.Formatter

6. Čtení a modifikace prvků vektoru

Způsob nastavení nové hodnoty prvku vektoru jsme již viděli v předchozí kapitole. Pro tento účel se používá metoda nazvaná SetVec; opět tedy platí, že nelze použít přetížený operátor:

gomacro> v := mat.NewVecDense(10, []float64{1,2,3,4,5,6,7,8,9,10}) gomacro> for i := 0; i < v.Len(); i++ { . . . . v.SetVec(i, 1.0 / float64(i)) . . . . }

Změněný vektor bude mít opět deset prvků:

gomacro> mat.Formatted(v) ⎡ +Inf⎤ ⎢ 1⎥ ⎢ 0.5⎥ ⎢ 0.3333333333333333⎥ ⎢ 0.25⎥ ⎢ 0.2⎥ ⎢0.16666666666666666⎥ ⎢0.14285714285714285⎥ ⎢ 0.125⎥ ⎣ 0.1111111111111111⎦ // fmt.Formatter

Existují dvě metody určené pro přečtení hodnoty prvku z vektoru. První metoda se jmenuje At a používá se i pro čtení prvků z dvourozměrných matic (u sloupcových vektorů je druhý index vždy nulový):

gomacro> for i := 0; i < v.Len(); i++ { . . . . fmt.Printf("%10.6f

", v.At(i, 0)) . . . . } +Inf 1.000000 0.500000 0.333333 0.250000 0.200000 0.166667 0.142857 0.125000 0.111111

Druhá metoda se jmenuje AtVec a předává se jí jen jediný index:

gomacro> for i := 0; i < w.Len(); i++ { . . . . fmt.Printf("%10.6f

", w.AtVec(i)) . . . . } 10.000000 0.000000 20.000000 0.000000 30.000000

7. Operace nad vektory

V této kapitole si popíšeme některé další operace, které lze provádět s vektory. Nejdříve vytvoříme dvojici vektorů, které budou použity v dalších příkazech:

gomacro> v1 := mat.NewVecDense(5, nil) gomacro> v2 := mat.NewVecDense(5, []float64{1,0,2,0,3}) gomacro> mat.Formatted(v1) ⎡0⎤ ⎢0⎥ ⎢0⎥ ⎢0⎥ ⎣0⎦ // fmt.Formatter gomacro> mat.Formatted(v2) ⎡1⎤ ⎢0⎥ ⎢2⎥ ⎢0⎥ ⎣3⎦ // fmt.Formatter

Třetí vektor bude použit jako cíl pro některé operace:

gomacro> v := mat.NewVecDense(5, nil)

Operace součtu dvou vektorů realizovaná metodou – modifikuje se v ní příjemce (receiver):

gomacro> v.AddVec(v1, v2) gomacro> mat.Formatted(v) ⎡1⎤ ⎢0⎥ ⎢2⎥ ⎢0⎥ ⎣3⎦ // fmt.Formatter gomacro> v.AddVec(v2, v2) gomacro> mat.Formatted(v) ⎡2⎤ ⎢0⎥ ⎢4⎥ ⎢0⎥ ⎣6⎦ // fmt.Formatter

Operace rozdílu vektorů, opět s modifikací příjemce:

gomacro> v.SubVec(v1, v2) gomacro> mat.Formatted(v) ⎡-1⎤ ⎢ 0⎥ ⎢-2⎥ ⎢ 0⎥ ⎣-3⎦ // fmt.Formatter

Změna měřítka, tj. vynásobení všech prvků vektoru nějakou konstantou:

gomacro> v.ScaleVec(10.0, v2) gomacro> mat.Formatted(v) ⎡10⎤ ⎢ 0⎥ ⎢20⎥ ⎢ 0⎥ ⎣30⎦ // fmt.Formatter

Vynásobení dvou vektorů stylem prvek po prvku (nejedná se o vektorový součin):

gomacro> v.MulElemVec(v2, v2) gomacro> mat.Formatted(v) ⎡1⎤ ⎢0⎥ ⎢4⎥ ⎢0⎥ ⎣9⎦ // fmt.Formatter

Podporována je i operace vynásobení matice a vektoru, samozřejmě za předpokladu, že počet sloupců matice bude odpovídat počtu řádků sloupcového vektoru:

gomacro> m := mat.NewDense(3, 3, []float64{1,0,0,0,1,0,0,0,1}) gomacro> v3 := mat.NewVecDense(3, []float64{2,3,4}) gomacro> v := mat.NewVecDense(3, nil) gomacro> v.MulVec(m, v3) gomacro> mat.Formatted(v) ⎡2⎤ ⎢3⎥ ⎣4⎦ // fmt.Formatter

Vynásobení vektoru maticí reprezentující otočení okolo z-ové osy o 90°:

gomacro> m := mat.NewDense(3, 3, []float64{0,-1,0,1,0,0,0,0,1}) gomacro> v.MulVec(m, v3) gomacro> mat.Formatted(v) ⎡-3⎤ ⎢ 2⎥ ⎣ 4⎦ // fmt.Formatter

Skalární součin dvou vektorů o stejné velikosti:

gomacro> mat.Dot(v1, v2) 0 // float64 gomacro> mat.Dot(v2, v2) 14 // float64

Získání prvku s největší a nejmenší hodnotou:

gomacro> mat.Max(v) 4 // float64 gomacro> mat.Min(v) -3 // float64

Součet všech prvků vektoru:

gomacro> mat.Sum(v) 3 // float64

8. Obecné dvourozměrné matice

I obecné dvourozměrné matice byly popsány v předchozí části seriálu o programovacím jazyce Go, takže si jen ve stručnosti shrňme některé základní operace. Matici vytváříme konstruktorem NewDense:

gomacro> d := mat.NewDense(6, 5, nil) gomacro> mat.Formatted(d) ⎡0 0 0 0 0⎤ ⎢0 0 0 0 0⎥ ⎢0 0 0 0 0⎥ ⎢0 0 0 0 0⎥ ⎢0 0 0 0 0⎥ ⎣0 0 0 0 0⎦ // fmt.Formatter

Konstrukce matice s inicializací jejich prvků:

gomacro> d := mat.NewDense(4, 3, []float64{1,2,3,4,5,6,7,8,9,10,11,12}) gomacro> mat.Formatted(d) ⎡ 1 2 3⎤ ⎢ 4 5 6⎥ ⎢ 7 8 9⎥ ⎣10 11 12⎦ // fmt.Formatter

Druhá matice, tentokrát se třemi řádky a čtyřmi sloupci:

gomacro> d := mat.NewDense(3, 4, []float64{1,2,3,4,5,6,7,8,9,10,11,12}) gomacro> mat.Formatted(d) ⎡ 1 2 3 4⎤ ⎢ 5 6 7 8⎥ ⎣ 9 10 11 12⎦ // fmt.Formatter

Čtvercová matice 3×3 prvky:

gomacro> m := mat.NewDense(3, 3, []float64{1,2,3,4,5,6,7,8,9}) gomacro> mat.Formatted(m) ⎡1 2 3⎤ ⎢4 5 6⎥ ⎣7 8 9⎦ // fmt.Formatter

Přečtení i-tého sloupce matice. Výsledkem je v tomto případě běžný řez programovacího jazyka Go:

gomacro> mat.Col(nil, 0, m) [1 4 7] // []float64 gomacro> mat.Col(nil, 1, m) [2 5 8] // []float64 gomacro> mat.Col(nil, 2, m) [3 6 9] // []float64 gomacro> mat.Col(nil, 3, m) mat: column index out of range

Přečtení j-tého řádku matice. Výsledkem je v tomto případě opět běžný řez programovacího jazyka Go:

gomacro> mat.Row(nil, 0, m) [1 2 3] // []float64 gomacro> mat.Row(nil, 1, m) [4 5 6] // []float64 gomacro> mat.Row(nil, 2, m) [7 8 9] // []float64 gomacro> mat.Row(nil, 3, m) mat: column index out of range

Výpočet determinantu matice 3×3 prvky:

gomacro> mat.Det(m) 6.66133814775094e-16 // float64

Opět můžeme použít funkce pro získání prvku s nejmenší hodnotou, největší hodnotou a pro součet (sumu) všech prvků v matici:

gomacro> mat.Min(m) 1 // float64 gomacro> mat.Max(m) 9 // float64 gomacro> mat.Sum(m) 45 // float64

Poslední zajímavou metodou je metoda, která vrací diagonální matici (všechny prvky kromě prvků na hlavní diagonále jsou nulové):

gomacro> mat.Formatted(m.DiagView()) ⎡1 0 0⎤ ⎢0 5 0⎥ ⎣0 0 9⎦ // fmt.Formatter

9. Symetrické matice

V knihovně mat existuje i konstruktor pro symetrické matice. Chování tohoto konstruktoru je ovšem poněkud zvláštní – předat je mu totiž nutné všechny prvky odpovídající velikosti matice. Například pro matici 3×3 prvky (symetrická matice je vždy čtvercová) je nutné konstruktoru předat devět hodnot prvků, i když se z těchto hodnot použije jen šest prvků (horní trojúhelníková matice):

gomacro> s := mat.NewSymDense(3, []float64{1,2,3,4,5,6,7,8,9}) gomacro> mat.Formatted(s) ⎡1 2 3⎤ ⎢2 5 6⎥ ⎣3 6 9⎦ // fmt.Formatter

Tyto matice mají zachovávají většinu základních vlastností běžných matic, tj. můžeme například získat informace o jejich kapacitě, velikosti (v jednotlivých dimenzích) atd.:

gomacro> s.Caps() 3 // int 3 // int gomacro> s.Dims() 3 // int 3 // int

Vytvořit je možné i transformovanou matici, což je ovšem jen kopie matice původní:

gomacro> mat.Formatted(s.T()) ⎡1 2 3⎤ ⎢2 5 6⎥ ⎣3 6 9⎦ // fmt.Formatter

Prvky symetrické matice se nastavují metodou SetSym (jiná metoda ani není k dispozici). Tato metoda pochopitelně zachovává „symetričnost“ matice, tj. změní se buď jeden prvek na hlavní diagonále nebo dvojice prvků:

gomacro> s.SetSym(1, 0, -100) gomacro> mat.Formatted(s) ⎡ 1 -100 3⎤ ⎢-100 5 6⎥ ⎣ 3 6 9⎦ // fmt.Formatter

10. Diagonální matice

Další variantou matic jsou diagonální matice. Ty lze vytvořit konstruktorem NewDiagDense:

gomacro> d := mat.NewDiagDense(10, nil) gomacro> mat.Formatted(d) ⎡0 0 0 0 0 0 0 0 0 0⎤ ⎢0 0 0 0 0 0 0 0 0 0⎥ ⎢0 0 0 0 0 0 0 0 0 0⎥ ⎢0 0 0 0 0 0 0 0 0 0⎥ ⎢0 0 0 0 0 0 0 0 0 0⎥ ⎢0 0 0 0 0 0 0 0 0 0⎥ ⎢0 0 0 0 0 0 0 0 0 0⎥ ⎢0 0 0 0 0 0 0 0 0 0⎥ ⎢0 0 0 0 0 0 0 0 0 0⎥ ⎣0 0 0 0 0 0 0 0 0 0⎦ // fmt.Formatter

Konstruktoru je možné předat hodnoty všech prvků na hlavní diagonále:

gomacro> d := mat.NewDiagDense(10, []float64{1,2,3,4,5,6,7,8,9,10}) gomacro> mat.Formatted(d) ⎡ 1 0 0 0 0 0 0 0 0 0⎤ ⎢ 0 2 0 0 0 0 0 0 0 0⎥ ⎢ 0 0 3 0 0 0 0 0 0 0⎥ ⎢ 0 0 0 4 0 0 0 0 0 0⎥ ⎢ 0 0 0 0 5 0 0 0 0 0⎥ ⎢ 0 0 0 0 0 6 0 0 0 0⎥ ⎢ 0 0 0 0 0 0 7 0 0 0⎥ ⎢ 0 0 0 0 0 0 0 8 0 0⎥ ⎢ 0 0 0 0 0 0 0 0 9 0⎥ ⎣ 0 0 0 0 0 0 0 0 0 10⎦ // fmt.Formatter

A opět jsou k dispozici metody pro získání základních informací o existující matici:

gomacro> d.Diag() 10 // int gomacro> d.Dims() 10 // int 10 // int

Pro nastavení hodnoty prvku diagonální matice se používá metoda SetDiag:

gomacro> d := mat.NewDiagDense(10, []float64{1,2,3,4,5,6,7,8,9,10}) gomacro> d.SetDiag(1, 100) gomacro> mat.Formatted(d) ⎡ 1 0 0 0 0 0 0 0 0 0⎤ ⎢ 0 100 0 0 0 0 0 0 0 0⎥ ⎢ 0 0 3 0 0 0 0 0 0 0⎥ ⎢ 0 0 0 4 0 0 0 0 0 0⎥ ⎢ 0 0 0 0 5 0 0 0 0 0⎥ ⎢ 0 0 0 0 0 6 0 0 0 0⎥ ⎢ 0 0 0 0 0 0 7 0 0 0⎥ ⎢ 0 0 0 0 0 0 0 8 0 0⎥ ⎢ 0 0 0 0 0 0 0 0 9 0⎥ ⎣ 0 0 0 0 0 0 0 0 0 10⎦ // fmt.Formatter

11. Trojúhelníkové matice

V knihovně mat jsou vývojářům k dispozici i funkce a metody určené pro práci s trojúhelníkovými maticemi. Opět si nejprve řekněme, jakým způsobem se tyto matice vytváří. Použít můžeme konstruktor NewTriDense, kterému se předává jak velikost trojúhelníkové matice (je pochopitelně čtvercová), tak i to, zda se jedná o horní či dolní trojúhelníkovou matici. A opět platí, že je nutné zapsat všechny prvky trojúhelníkové matice, i když se ve skutečnosti využijí pouze hodnoty prvků na hlavní diagonále a horním resp. dolním trojúhelníku.

Horní trojúhelníková matice se vytváří takto:

gomacro> t1 := mat.NewTriDense(3, mat.Upper, []float64{1,2,3,4,5,6,7,8,9}) gomacro> mat.Formatted(t1) ⎡1 2 3⎤ ⎢0 5 6⎥ ⎣0 0 9⎦ // fmt.Formatter

Dolní trojúhelníková matice inicializovaná shodnými hodnotami se konstruuje následovně:

gomacro> t2 := mat.NewTriDense(3, mat.Lower, []float64{1,2,3,4,5,6,7,8,9}) gomacro> mat.Formatted(t2) ⎡1 0 0⎤ ⎢4 5 0⎥ ⎣7 8 9⎦ // fmt.Formatter

Získat můžeme pohled obsahující pouze prvky na hlavní diagonále:

gomacro> mat.Formatted(t1.DiagView()) ⎡1 0 0⎤ ⎢0 5 0⎥ ⎣0 0 9⎦ // fmt.Formatter gomacro> mat.Formatted(t2.DiagView()) ⎡1 0 0⎤ ⎢0 5 0⎥ ⎣0 0 9⎦ // fmt.Formatter

Trojúhelníkové matice lze transponovat, čímž se z horní matice stane dolní a naopak:

gomacro> mat.Formatted(t1.T()) ⎡1 0 0⎤ ⎢2 5 0⎥ ⎣3 6 9⎦ // fmt.Formatter gomacro> mat.Formatted(t2.T()) ⎡1 4 7⎤ ⎢0 5 8⎥ ⎣0 0 9⎦ // fmt.Formatter

Pro nastavení hodnot prvků trojúhelníkové matice slouží metoda NewTriDense, která zajistí, aby se neměnily prvky v té části trojúhelníkové matice, které musí být nulové:

gomacro> t1 := mat.NewTriDense(3, mat.Upper, []float64{1,2,3,4,5,6,7,8,9}) gomacro> t1.SetTri(2, 0, 100) mat: triangular set out of bounds gomacro> t1.SetTri(0, 2, 100) gomacro> mat.Formatted(t1) ⎡ 1 2 100⎤ ⎢ 0 5 6⎥ ⎣ 0 0 9⎦ // fmt.Formatter

12. Balíček stat

Třetím balíčkem, s jehož možnostmi se dnes ve stručnosti seznámíme, je balíček nazvaný stat. Najdeme v něm různé funkce a metody, které se týkají především statistických výpočtů, ovšem například i lineární regrese (proložení naměřených či vypočtených bodů úsečkou) apod. Většina základních funkcí pracuje s hodnotami uloženými v řezu hodnot typu float64, většinou doplněných o další řez obsahující váhy hodnot (výchozí váhou je 1.0). Podrobnější informace o možnostech tohoto balíčku budou uvedeny příště.

13. Výpočet průměrů, rozptylů a směrodatných odchylek

Základní funkcí, která má všeobecné využití, je výpočet aritmetického průměru (AM=Arithmetic Mean). Tato funkce se v knihovně stat jmenuje Mean. Této funkci se předává řez s hodnotami a popř. i další řez s vahami. Pokud je druhým parametrem hodnota nil, budou váhy všech prvků rovny 1.0:

gomacro> stat.Mean([]float64{1,2,3,4,5}, nil) 3 // float64 gomacro> stat.Mean([]float64{1,2,3,4,5}, []float64{1,1,1,1,1}) 3 // float64 gomacro> stat.Mean([]float64{1,2,3,4,5}, []float64{1,1,1,1,10}) 4.285714285714286 // float64

K dispozici je i funkce pro výpočet geometrického průměru (GM=Geometric Mean) se stejnými vlastnostmi, jako je tomu u výše zmíněné funkce Mean:

gomacro> stat.GeometricMean([]float64{1,2,3,4,5}, nil) 2.605171084697352 // float64 gomacro> stat.GeometricMean([]float64{1,2,3,4,5}, []float64{1,1,1,1,1}) 2.605171084697352 // float64 gomacro> stat.GeometricMean([]float64{1,2,3,4,5}, []float64{1,1,1,1,10}) 3.9614192356754674 // float64

Vypočítat lze i harmonický průměr (HM=Harmonic Mean), a to s využitím funkce HarmonicMean:

gomacro> stat.HarmonicMean([]float64{1,2,3,4,5}, nil) 2.1897810218978098 // float64 gomacro> stat.HarmonicMean([]float64{1,2,3,4,5}, []float64{1,1,1,1,1}) 2.1897810218978098 // float64 gomacro> stat.HarmonicMean([]float64{1,2,3,4,5}, []float64{1,1,1,1,10}) 3.4285714285714293 // float64

V dalších příkladech budeme používat pole o sto prvcích naplněné náhodnými hodnotami:

gomacro> import "math/rand" gomacro> ys := [100]float64{} gomacro> for i := 0; i < len(ys); i++ { . . . . ys[i] = 50.0 - float64(i) + 2.0*rand.Float64() - 1.0 . . . . }

Výpočet aritmetického průměru:

gomacro> stat.Mean(ys[:], nil) 0.48154185382982606 // float64

Výpočet směrodatné odchylky a standardní chyby (SE):

gomacro> stat.StdDev(ys[:], nil) 28.95847713231853 // float64 gomacro> stat.StdErr(stat.StdDev(ys[:], nil), 100) 2.895847713231853 // float64

Aritmetický průměr i směrodatnou odchylku lze vypočítat jedinou funkcí MeanStdDev, která vrací dvojici hodnot:

gomacro> stat.MeanStdDev(ys[:], nil) 0.48154185382982606 // float64 28.95847713231853 // float64

14. Výpočet entropie

Vypočítat lze i entropii pro hodnoty, které se v sekvenci vyskytují s různou pravděpodobností. Touto funkcí a jejím konkrétním významem se budeme podrobněji zabývat příště, takže jen krátce:

gomacro> stat.Entropy([]float64{0.25, 0.25, 0.25, 0.25}) 1.3862943611198906 // float64 gomacro> stat.Entropy([]float64{0.20, 0.20, 0.20, 0.40}) 1.3321790402101223 // float64 gomacro> stat.Entropy([]float64{0.10, 0.10, 0.10, 0.70}) 0.9404479886553264 // float64 gomacro> stat.Entropy([]float64{0.00, 0.00, 0.00, 1.00}) 0 // float64

Poznámka: v posledním příkladu se hodnoty vyskytovaly se 100% pravděpodobností, takže entropie takové zprávy je nulová.

15. Korelace

V knihovně stat nalezneme i funkce pro výpočet korelace. Nejdříve si však připravíme dvojici řezů, které pro výpočet korelace využijeme:

gomacro> x := []float64{1,2,3,4,5,6} gomacro> y := []float64{1,5,3,5,5,0}

Korelace řezu se sebou samým:

gomacro> stat.Correlation(x, x, nil) 1 // float64 gomacro> stat.Correlation(y, y, nil) 1 // float64

Korelace mezi dvěma řezy:

gomacro> stat.Correlation(x, y, nil) -0.07195396418966687 // float64

Korelace mezi různými řezy, jejichž korespondující prvky se vždy liší pouze o jedničku:

gomacro> z := []float64{2,3,4,5,6,7} gomacro> stat.Correlation(x, z, nil) 1 // float64

V dalším příkladu vypočítáme korelaci mezi vzestupnou a sestupnou řadou šesti hodnot (zde se jedná o antikorelaci):

gomacro> w := []float64{6,5,4,3,2,1} gomacro> stat.Correlation(x, w, nil) -1 // float64

16. Kovariance

Pro výpočet kovariance (https://cs.wikipedia.org/wi­ki/Kovariance) slouží funkce Covariance, která může sloužit pro zjištění, zda jsou dvě veličiny či naměřené hodnoty na sobě lineárně závislé či nikoli:

gomacro> stat.Covariance(x, x, nil) 3.5 // float64 gomacro> stat.Covariance(x, y, nil) -0.3 // float64 gomacro> stat.Covariance(x, z, nil) 3.5 // float64 gomacro> stat.Covariance(x, w, nil) -3.5 // float64

17. Lineární regrese

Poslední funkcí, se kterou se dnes setkáme, je funkce určená pro výpočet lineární regrese (tedy proložení úsečky naměřenými hodnotami). Nejdříve si připravíme dvojici řezů obsahujících x-ové a y-ové hodnoty:

gomacro> xs := []float64{1,2,3,4,5} gomacro> ys := []float64{2,3,4,5,6}

Dále vypočteme posun a směrnici úsečky, kterou proložíme mezi naměřenými body (tato úsečka bude procházet všemi body):

gomacro> stat.LinearRegression(xs, ys, nil, false) 1 // float64 1 // float64

Posledním parametrem si můžeme vynutit, aby úsečka procházela počátkem souřadného systému (což ovšem pro tyto konkrétní hodnoty moc nedává význam):

gomacro> stat.LinearRegression(xs, ys, nil, true) 0 // float64 1.2727272727272727 // float64

Zkusme nyní použít odlišné hodnoty, které představují body na úsečce, která neprochází počátkem souřadného systému:

gomacro> xs := []float64{1,2,3,4,5} gomacro> ys := []float64{-2,0,2,4,6} gomacro> stat.LinearRegression(xs, ys, nil, false) -4 // float64 2 // float64

Nyní je posun roven –4 a směrnice 2.

Praktičtěji zaměřený příklad pro body, které se nepatrně odchylují od ideálního průběhu funkce:

gomacro> import "math/rand" gomacro> xs := [100]float64{} gomacro> ys := [100]float64{} gomacro> for i := 0; i < len(xs); i++ { . . . . xs[i] = float64(i) . . . . }

Výpočet y-ových souřadnic bodů:

gomacro> for i := 0; i < len(ys); i++ { . . . . ys[i] = 50.0 - float64(i) + 2.0*rand.Float64() - 1.0 . . . . }

Výpočet lineární regrese (posunu a směrnice):

gomacro> stat.LinearRegression(xs[:], ys[:], nil, false) 49.88218549333264 // float64 -0.9979928007980367 // float64

Obrázek 1: Průběh funkce (s náhodnými výchylkami), kterou lze proložit úsečkou s posunem cca 50 a směrnicí cca –1.0.

Můžeme si vynutit, aby úsečka procházela počátkem souřadného systému (což opět pro tyto konkrétní hodnoty nemá význam):

gomacro> stat.LinearRegression(xs[:], ys[:], nil, true) 0 // float64 -0.24600005466739383 // float64

18. Obsah následující části seriálu

V navazující části seriálu o programovacím jazyku Go si ukážeme možnosti nabízené dalšími balíčky z knihovny Gonum. Bude se jednat zejména o balíčky s funkcemi pro numerickou derivaci a integraci, práci s náhodnými hodnotami (resp. jejich sekvencemi), práci s grafovými strukturami aj.

19. Repositář s demonstračními příklady

Zdrojové kódy všech dnes použitých demonstračních příkladů byly uloženy do Git repositáře, který je dostupný na adrese https://github.com/tisnik/go-root (stále na GitHubu :-). V případě, že nebudete chtít klonovat celý repositář (ten je ovšem – alespoň prozatím – velmi malý, dnes má přibližně pět až šest megabajtů), můžete namísto toho použít odkazy na jednotlivé příklady, které naleznete v následující tabulce:

