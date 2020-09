11. Přístup k prvkům dvojrozměrného pole

1. Programovací jazyk R: pole a další podporované datové typy

Ve druhé části seriálu o doménově specifickém programovacím jazyku R jsme se zabývali popisem práce s primárním datovým typem tohoto jazyka. Připomeňme si, že se jednalo o vektory (vector), což je homogenní a současně i měnitelný (mutable) datový typ, který může obsahovat logické hodnoty, celá čísla, čísla s plovoucí čárkou, komplexní čísla, popř. řetězce. Ovšem v jazyku R je možné pracovat i s hodnotami, které jsou odlišného datového typu. A právě s těmito dalšími typy se seznámíme dnes. Při popisu všech datových typů budeme opět používat relativně velké množství demonstračních příkladů, které je možné buď zapsat přímo do konzole jazyka R, použít jednoduchá IDE dostupná online [1] [2] [3] nebo pro jejich spuštění použít nástroj Rscript (ten je součástí standardní sady nástrojů jazyka R):

$ Rscript Usage: /path/to/Rscript [--options] [-e expr [-e expr2 ...] | file] [args] --options accepted are --help Print usage and exit --version Print version and exit --verbose Print information on progress --default-packages=list Where 'list' is a comma-separated set of package names, or 'NULL' or options to R, in addition to --no-echo --no-restore, such as --save Do save workspace at the end of the session --no-environ Don't read the site and user environment files --no-site-file Don't read the site-wide Rprofile --no-init-file Don't read the user R profile --restore Do restore previously saved objects at startup --vanilla Combine --no-save, --no-restore, --no-site-file --no-init-file and --no-environ 'file' may contain spaces but not shell metacharacters Expressions (one or more '-e <expr>') may be used *instead* of 'file' See also ?Rscript from within R

2. Konstrukce jednorozměrného a dvojrozměrného pole

V této kapitole si ukážeme způsob konstrukce jednorozměrného a dvojrozměrného pole. Jednorozměrné pole je ve skutečnosti vektorem, který má ovšem specifikován atribut dim, což je další vektor obsahující specifikaci informace o dimenzích pole. Pokud například pole vytvoříme ze šestiprvkového vektoru a vektor s dimenzemi bude jednoprvkový c(6), vytvoří se jednorozměrné pole se šesticí prvků. Povšimněte si způsobu konstrukce pole pomocí funkce array:

> data <- c(1, 2, 3, 4, 5, 6) > dimension1 <- c(6) > > a1 <- array(data, dim=dimension1) > print(a1) [1] 1 2 3 4 5 6

Poznámka: jednorozměrné pole se neliší od vektoru.

Dimenzi pole lze získat funkcí dim:

> print(dim(a1)) [1] 6

Alternativně je ovšem možné pole vytvořit i zdánlivým přiřazením hodnoty do návratové hodnoty funkce dim(a1):

> a1 <- c(1, 2, 3, 4, 5, 6) > print(a1) > dim(a1) <- c(6) > print(a1)

Nyní si ukažme vytvoření pole s jedním řádkem a šesti sloupci:

> data <- c(1, 2, 3, 4, 5, 6) > dimension2 <- c(1, 6) > > a2 <- array(data, dim=dimension2) > print(a2) [,1] [,2] [,3] [,4] [,5] [,6] [1,] 1 2 3 4 5 6

Naopak pole se šesti řádky a jedním sloupcem (sloupcový vektor) se vytvoří:

> data <- c(1, 2, 3, 4, 5, 6) > dimension2 <- c(6, 1) > > a2 <- array(data, dim=dimension2) > print(a2) [1] 1 2 3 4 5 6 [,1] [1,] 1 [2,] 2 [3,] 3 [4,] 4 [5,] 5 [6,] 6

Popř.:

> a2 <- c(1, 2, 3, 4, 5, 6) > print(a2) > dimension2 <- c(1, 6) > dim(a2) <- dimension2 > print(a2)

3. Plnohodnotná dvojrozměrná pole

Nyní si ukažme konstrukci dvojrozměrného pole se třemi řádky a dvěma sloupci:

> data <- c(1, 2, 3, 4, 5, 6) > dimension1 <- c(3, 2) > > a1 <- array(data, dim=dimension1) > print(a1) [,1] [,2] [1,] 1 4 [2,] 2 5 [3,] 3 6

A naopak – pole se třemi sloupci a dvěma řádky:

> > dimension2 <- c(2, 3) > > a2 <- array(data, dim=dimension2) > print(a2) [,1] [,2] [,3] [1,] 1 3 5 [2,] 2 4 6

Poznámka: z předchozích dvou příkladů je patrné, jakým způsobem se pole naplňuje prvky. Plnění v těchto případech probíhalo po sloupcích, což odpovídá chování FORTRANu (a nikoli céčka).

Alternativní způsob se specifikací dimenze pole až po jeho vytvoření:

data <- c(1, 2, 3, 4, 5, 6) dimension1 <- c(3, 2) a1 <- array(data, dim=dimension1) print(a1) dimension2 <- c(2, 3) a2 <- array(data, dim=dimension2) print(a2)

Samozřejmě můžeme vektor představující zdroj dat vytvořit i s využitím range, tedy zápisu prvek1:prvekN:

> data <- 1:12 > dimension1 <- c(3, 4) > > a1 <- array(data, dim=dimension1) > print(a1) [,1] [,2] [,3] [,4] [1,] 1 4 7 10 [2,] 2 5 8 11 [3,] 3 6 9 12 > dimension2 <- c(4, 3) > > a2 <- array(data, dim=dimension2) > print(a2) [,1] [,2] [,3] [1,] 1 5 9 [2,] 2 6 10 [3,] 3 7 11 [4,] 4 8 12

4. Chování ve chvíli, kdy zdrojový vektor neobsahuje dostatečný počet prvků

V dalším demonstračním příkladu se pokusíme vytvořit pole 3×4 prvky, ovšem zdrojem bude vektor obsahující pouze trojici prvků. Nejedná se o chybu, protože v tomto případě dojde k opakování prvků zdrojového vektoru až do chvíle, kdy se výsledné pole zcela naplní:

> data <- 1:3 > dimension1 <- c(3, 4) > > a1 <- array(data, dim=dimension1) > print(a1) [,1] [,2] [,3] [,4] [1,] 1 1 1 1 [2,] 2 2 2 2 [3,] 3 3 3 3

Dtto při pokusu o vytvoření pole s rozměry 4×3 prvky:

> > data <- 1:4 > dimension2 <- c(4, 3) > > a2 <- array(data, dim=dimension2) > print(a2) [,1] [,2] [,3] [1,] 1 1 1 [2,] 2 2 2 [3,] 3 3 3 [4,] 4 4 4

Tohoto chování můžeme využít při konstrukci pole, které obsahuje pouze nulové prvky (nebo samozřejmě jinou konstantní hodnotu):

data <- 0 dimension1 <- c(3, 4) a1 <- array(data, dim=dimension1) print(a1) data <- 0 dimension2 <- c(4, 3) a2 <- array(data, dim=dimension2) print(a2)

S výsledky:

[,1] [,2] [,3] [,4] [1,] 0 0 0 0 [2,] 0 0 0 0 [3,] 0 0 0 0 [,1] [,2] [,3] [1,] 0 0 0 [2,] 0 0 0 [3,] 0 0 0 [4,] 0 0 0

5. Pole se třemi dimenzemi

Pole může být i vícedimenzionální. V dalším demonstračním příkladu postupně vytvoříme pole o rozměrech 2×3×4 prvky, 3×2×4 prvky a konečně 4×3×2 prvky. Ve všech případech bude zdrojem hodnot prvků vektor obsahující celočíselné hodnoty 1, 2, … 24 (což přesně odpovídá požadovanému počtu prvků výsledných trojrozměrných polí):

> data <- 1:24 > > print("2x3x4") [1] "2x3x4" > dimension1 <- c(2, 3, 4) > a1 <- array(data, dim=dimension1) > print(a1) , , 1 [,1] [,2] [,3] [1,] 1 3 5 [2,] 2 4 6 , , 2 [,1] [,2] [,3] [1,] 7 9 11 [2,] 8 10 12 , , 3 [,1] [,2] [,3] [1,] 13 15 17 [2,] 14 16 18 , , 4 [,1] [,2] [,3] [1,] 19 21 23 [2,] 20 22 24

Poznámka: povšimněte si, jak se tiskne trojrozměrné pole. Vždy se nejdříve vytiskne poslední dimenze (ta je v R nejvyšší) a posléze již 2D matice.

Změna tvaru pole:

> print("3x2x4") [1] "3x2x4" > dimension2 <- c(3, 2, 4) > a2 <- array(data, dim=dimension2) > print(a2) , , 1 [,1] [,2] [1,] 1 4 [2,] 2 5 [3,] 3 6 , , 2 [,1] [,2] [1,] 7 10 [2,] 8 11 [3,] 9 12 , , 3 [,1] [,2] [1,] 13 16 [2,] 14 17 [3,] 15 18 , , 4 [,1] [,2] [1,] 19 22 [2,] 20 23 [3,] 21 24

A poslední změna tvaru pole:

> print("4x3x2") [1] "4x3x2" > dimension3 <- c(4, 3, 2) > a3 <- array(data, dim=dimension3) > print(a3) , , 1 [,1] [,2] [,3] [1,] 1 5 9 [2,] 2 6 10 [3,] 3 7 11 [4,] 4 8 12 , , 2 [,1] [,2] [,3] [1,] 13 17 21 [2,] 14 18 22 [3,] 15 19 23 [4,] 16 20 24

Alternativně je ovšem možné dimenzi specifikovat až přiřazením do existujícího vektoru:

print("2x3x4") a1 <- 1:24 dimension1 <- c(2, 3, 4) dim(a1) <- dimension1 print(a1) print("3x2x4") a2 <- 1:24 dimension2 <- c(3, 2, 4) dim(a2) <- dimension2 print(a2) print("4x3x2") a3 <- 1:24 dimension3 <- c(4, 3, 2) dim(a3) <- dimension3 print(a3)

Výsledky budou v tomto případě odpovídat předchozím třem příkladům.

6. Opakování prvků při konstrukci trojrozměrných polí

Opět si ukažme chování programovacího jazyka R ve chvíli, kdy zdrojový vektor nebude obsahovat všechny potřebné prvky:

data <- 1:12

Vektor obsahuje pouze dvanáct prvků, ovšem vyžadujeme konstrukci trojrozměrného pole s celkem 24 prvky. Prvky se tedy musí opakovat:

> print("2x3x4") [1] "2x3x4" > dimension1 <- c(2, 3, 4) > a1 <- array(data, dim=dimension1) > print(a1) , , 1 [,1] [,2] [,3] [1,] 1 3 5 [2,] 2 4 6 , , 2 [,1] [,2] [,3] [1,] 7 9 11 [2,] 8 10 12 , , 3 [,1] [,2] [,3] [1,] 1 3 5 [2,] 2 4 6 , , 4 [,1] [,2] [,3] [1,] 7 9 11 [2,] 8 10 12

Dtto pro odlišný tvar trojrozměrného pole:

> print("3x2x4") [1] "3x2x4" > dimension2 <- c(3, 2, 4) > a2 <- array(data, dim=dimension2) > print(a2) , , 1 [,1] [,2] [1,] 1 4 [2,] 2 5 [3,] 3 6 , , 2 [,1] [,2] [1,] 7 10 [2,] 8 11 [3,] 9 12 , , 3 [,1] [,2] [1,] 1 4 [2,] 2 5 [3,] 3 6 , , 4 [,1] [,2] [1,] 7 10 [2,] 8 11 [3,] 9 12

Poslední varianta:

> print("4x3x2") [1] "4x3x2" > dimension3 <- c(4, 3, 2) > a3 <- array(data, dim=dimension3) > print(a3) , , 1 [,1] [,2] [,3] [1,] 1 5 9 [2,] 2 6 10 [3,] 3 7 11 [4,] 4 8 12 , , 2 [,1] [,2] [,3] [1,] 1 5 9 [2,] 2 6 10 [3,] 3 7 11 [4,] 4 8 12

Alternativní způsob zápisu – specifikace dimenze původně jednorozměrného vektoru:

data <- 1:12 print("2x3x4") dimension1 <- c(2, 3, 4) a1 <- array(data, dim=dimension1) print(a1) print("3x2x4") dimension2 <- c(3, 2, 4) a2 <- array(data, dim=dimension2) print(a2) print("4x3x2") dimension3 <- c(4, 3, 2) a3 <- array(data, dim=dimension3) print(a3)

A konečně naplnění trojrozměrného pole nulami:

data <- 0 print("2x3x4") dimension1 <- c(2, 3, 4) a1 <- array(data, dim=dimension1) print(a1) print("3x2x4") dimension2 <- c(3, 2, 4) a2 <- array(data, dim=dimension2) print(a2) print("4x3x2") dimension3 <- c(4, 3, 2) a3 <- array(data, dim=dimension3) print(a3)

S výsledky:

[1] "2x3x4" , , 1 [,1] [,2] [,3] [1,] 0 0 0 [2,] 0 0 0 , , 2 [,1] [,2] [,3] [1,] 0 0 0 [2,] 0 0 0 , , 3 [,1] [,2] [,3] [1,] 0 0 0 [2,] 0 0 0 , , 4 [,1] [,2] [,3] [1,] 0 0 0 [2,] 0 0 0 [1] "3x2x4" , , 1 [,1] [,2] [1,] 0 0 [2,] 0 0 [3,] 0 0 , , 2 [,1] [,2] [1,] 0 0 [2,] 0 0 [3,] 0 0 , , 3 [,1] [,2] [1,] 0 0 [2,] 0 0 [3,] 0 0 , , 4 [,1] [,2] [1,] 0 0 [2,] 0 0 [3,] 0 0 [1] "4x3x2" , , 1 [,1] [,2] [,3] [1,] 0 0 0 [2,] 0 0 0 [3,] 0 0 0 [4,] 0 0 0 , , 2 [,1] [,2] [,3] [1,] 0 0 0 [2,] 0 0 0 [3,] 0 0 0 [4,] 0 0 0

7. Pojmenování řádků a sloupců pole

Řádky, popř. sloupce pole je možné pojmenovat, což může být v praxi poměrně užitečné. Jména řádků jsou uložena do samostatného vektoru, stejně jako jména sloupců. Způsob nastavení je ukázán na následujícím demonstračním příkladu:

> data <- 1:12 > dimension <- c(4, 3) > > row.names <- c("row1", "row2", "row3", "row4") > column.names <- c("column1", "column2", "column3") > > a1 <- array(data, dim=dimension, dimnames=list(row.names, column.names)) > print(a1) column1 column2 column3 row1 1 5 9 row2 2 6 10 row3 3 7 11 row4 4 8 12

Poznámka: vektory se jmény jsou uloženy do proměnných, které obsahují ve svém jménu tečku. V tomto případě se jedná o viditelné oddělení dvou slov od sebe – tečka tedy nemá speciální význam. Ostatně tečka se zapisuje jednodušeji než například podtržítko, VůbecNemluvěOVelbloudíNotaci, v níž navíc k viditelnému oddělení slov nedochází.

8. Pojmenování třetí dimenze trojrozměrného pole

Pojmenovat lze i vyšší dimenze trojrozměrných, čtyřrozměrných atd. polí. V následujícím demonstračním příkladu je název třetí dimenze uložen v proměnné nazvané matrix.names:

> data <- 1:24 > dimension <- c(4, 3, 2) > > matrix.names <- c("matrix1", "matrix2") > row.names <- c("row1", "row2", "row3", "row4") > column.names <- c("column1", "column2", "column3") > > a1 <- array(data, dim=dimension, dimnames=list(row.names, column.names, matrix.names)) > print(a1)

Při výpisu obsahu pole a1 se namísto indexů použijí všechny uvedené názvy, což vede k poněkud čitelnějším výstupům:

, , matrix1 column1 column2 column3 row1 1 5 9 row2 2 6 10 row3 3 7 11 row4 4 8 12 , , matrix2 column1 column2 column3 row1 13 17 21 row2 14 18 22 row3 15 19 23 row4 16 20 24

Poznámka: jazyk R kontroluje, zda počet názvů odpovídá velikosti jednotlivých dimenzí, tj. počtu sloupců, počtu řádků, počtu matic atd.

9. Čtyřrozměrné pole

Jen pro úplnost si ukažme, jakým způsobem je možné zkonstruovat čtyřrozměrná pole. Základem bude vektor se dvaceti čtyřmi prvky, který je použit v konstruktoru:

data <- 1:24

Pole s tvarem 2×2×2×3 prvky:

> print("2x2x2x3") [1] "2x2x2x3" > dimension1 <- c(2, 2, 2, 3) > a1 <- array(data, dim=dimension1) > print(a1) , , 1, 1 [,1] [,2] [1,] 1 3 [2,] 2 4 , , 2, 1 [,1] [,2] [1,] 5 7 [2,] 6 8 , , 1, 2 [,1] [,2] [1,] 9 11 [2,] 10 12 , , 2, 2 [,1] [,2] [1,] 13 15 [2,] 14 16 , , 1, 3 [,1] [,2] [1,] 17 19 [2,] 18 20 , , 2, 3 [,1] [,2] [1,] 21 23 [2,] 22 24

Pole s tvarem 2×2×3×2 prvky:

> print("2x2x3x2") [1] "2x2x3x2" > dimension2 <- c(2, 2, 3, 2) > a2 <- array(data, dim=dimension2) > print(a2) , , 1, 1 [,1] [,2] [1,] 1 3 [2,] 2 4 , , 2, 1 [,1] [,2] [1,] 5 7 [2,] 6 8 , , 3, 1 [,1] [,2] [1,] 9 11 [2,] 10 12 , , 1, 2 [,1] [,2] [1,] 13 15 [2,] 14 16 , , 2, 2 [,1] [,2] [1,] 17 19 [2,] 18 20 , , 3, 2 [,1] [,2] [1,] 21 23 [2,] 22 24

Pole s tvarem 2×3×2×2 prvky:

> print("2x3x2x2") [1] "2x3x2x2" > dimension3 <- c(2, 3, 2, 2) > a3 <- array(data, dim=dimension3) > print(a3) , , 1, 1 [,1] [,2] [,3] [1,] 1 3 5 [2,] 2 4 6 , , 2, 1 [,1] [,2] [,3] [1,] 7 9 11 [2,] 8 10 12 , , 1, 2 [,1] [,2] [,3] [1,] 13 15 17 [2,] 14 16 18 , , 2, 2 [,1] [,2] [,3] [1,] 19 21 23 [2,] 20 22 24

Pole s tvarem 3×2×2×2 prvky:

> print("3x2x2x2") [1] "3x2x2x2" > dimension4 <- c(3, 2, 2, 2) > a4 <- array(data, dim=dimension4) > print(a4) , , 1, 1 [,1] [,2] [1,] 1 4 [2,] 2 5 [3,] 3 6 , , 2, 1 [,1] [,2] [1,] 7 10 [2,] 8 11 [3,] 9 12 , , 1, 2 [,1] [,2] [1,] 13 16 [2,] 14 17 [3,] 15 18 , , 2, 2 [,1] [,2] [1,] 19 22 [2,] 20 23 [3,] 21 24

Alternativně lze samozřejmě použít přiřazení vektoru s tvarem pole do výsledku funkce dim:

print("2x2x2x3") a1 <- 1:24 dimension1 <- c(2, 2, 2, 3) dim(a1) <- dimension1 print(a1) print("2x2x3x2") a2 <- 1:24 dimension2 <- c(2, 2, 3, 2) dim(a2) <- dimension2 print(a2) print("2x3x2x2") a3 <- 1:24 dimension3 <- c(2, 3, 2, 2) dim(a3) <- dimension3 print(a3) print("3x2x2x2") a4 <- 1:24 dimension4 <- c(3, 2, 2, 2) dim(a4) <- dimension4 print(a4)

Poznámka: konstrukci vícerozměrných polí si již ukazovat nebudeme.

10. Pojmenování třetí a čtvrté dimenze čtyřrozměrného pole

Pro úplnost si ještě uveďme, že pojmenovat lze nejenom řádky, sloupce a popř. celé submatice trojrozměrného pole, ale i větší prvky u polí s více dimenzemi:

> data <- 1:24 > > hypermatrix.names <- c("hypermatrix A", "hypermatrix B", "hypermatrix C") > matrix.names <- c("matrix1", "matrix2") > row.names <- c("row1", "row2") > column.names <- c("column1", "column2") > > print("2x2x2x3") [1] "2x2x2x3" > dimension <- c(2, 2, 2, 3) > a1 <- array(data, dim=dimension, dimnames=list(row.names, column.names, matrix.names, hypermatrix.names)) > print(a1) , , matrix1, hypermatrix A column1 column2 row1 1 3 row2 2 4 , , matrix2, hypermatrix A column1 column2 row1 5 7 row2 6 8 , , matrix1, hypermatrix B column1 column2 row1 9 11 row2 10 12 , , matrix2, hypermatrix B column1 column2 row1 13 15 row2 14 16 , , matrix1, hypermatrix C column1 column2 row1 17 19 row2 18 20 , , matrix2, hypermatrix C column1 column2 row1 21 23 row2 22 24

Poznámka: lze pracovat i s poli s větším počtem dimenzí, ovšem demonstrační příklady si ukazovat nebudeme – byly by stále velmi podobné.

11. Přístup k prvkům dvojrozměrného pole

Připomeňme si, že programovací jazyk R umožňuje (pochopitelně) přístup k prvkům jednorozměrných vektorů. Indexy začínají od jedničky a zapisují se do hranatých závorek:

> v <- 1:12 > print(v[1]) [1] 1

Pokud se použije záporný index, vrátí se vektor, ovšem prvek s daným indexem (převedeným na absolutní hodnotu) je odfiltrován:

> v <- 1:12 > print(v[-1]) [1] 2 3 4 5 6 7 8 9 10 11 12

Poznámka: toto chování je značně odlišné například od Pythonu, v němž má záporný index jiný význam.

Vybrat je možné i větší množství prvků. V tomto případě se nepoužije index, ale vektor s indexy:

> v <- 1:12 > print(v[4:6]) [1] 4 5 6

Resp. obecněji:

> v <- 1:12 > print(v[c(2,4,6,8)]) [1] 2 4 6 8

Podobně můžeme přistupovat i k prvkům dvojrozměrných, trojrozměrných atd. polí. Indexy se zapisují do mezi jednu dvojici hranatých závorek a oddělují se od sebe čárkou – to je opět odlišné od některých „céčkovských“ jazyků, v nichž je každý index zapsán v samostatné dvojici závorek:

> data <- 1:12 > dimension <- c(4, 3) > > row.names <- c("row1", "row2", "row3", "row4") > column.names <- c("column1", "column2", "column3") > > a1 <- array(data, dim=dimension, dimnames=list(row.names, column.names)) > > print(a1) column1 column2 column3 row1 1 5 9 row2 2 6 10 row3 3 7 11 row4 4 8 12

Přečtení prvku z prvního řádku a prvního sloupce:

> print(a1[1, 1]) [1] 1

Přečtení prvků ze čtvrtého řádku:

> print(a1[4, 1]) [1] 4 > print(a1[4, 2]) [1] 8 > print(a1[4, 3]) [1] 12

Poznámka: indexy začínají od jedničky, takže „první řádek“ má skutečně index roven jedné a nikoli nule.

12. Získání celého řádku dvojrozměrného pole

Zajímavé a dosti užitečné je, že pokud vynecháme jeden z indexů, vrátí se všechny prvky v dané dimenzi. To zní poměrně složitě, ovšem po pohledu na další demonstrační příklad bude celý koncept patrný:

> data <- 1:12 > dimension <- c(4, 3) > > row.names <- c("row1", "row2", "row3", "row4") > column.names <- c("column1", "column2", "column3") > > a1 <- array(data, dim=dimension, dimnames=list(row.names, column.names)) > > print(a1) column1 column2 column3 row1 1 5 9 row2 2 6 10 row3 3 7 11 row4 4 8 12

Zápisem a1[1,] (tedy druhý index chybí) se vrátí celý první řádek:

> print(a1[1,]) column1 column2 column3 1 5 9

Podobně můžeme přečíst celý druhý řádek atd.:

> print(a1[2,]) column1 column2 column3 2 6 10

Poznámka: stejným způsobem jsou řešena i vícerozměrná pole.

13. Získání celého sloupce dvojrozměrného pole

Zajímavé je, že je podporován i opačný zápis, tj. vynechání prvního indexu namísto indexu druhého (resp. posledního):

a1[,1]

Podívejme se nyní na ucelený demonstrační příklad, ve kterém se vybírají celé sloupce. Povšimněte si, že i když se jedná o výběr sloupců, jsou vráceny ve formě jednorozměrného pole (popis řádků je však zachován):

> data <- 1:12 > dimension <- c(4, 3) > > row.names <- c("row1", "row2", "row3", "row4") > column.names <- c("column1", "column2", "column3") > > a1 <- array(data, dim=dimension, dimnames=list(row.names, column.names)) > > print(a1) column1 column2 column3 row1 1 5 9 row2 2 6 10 row3 3 7 11 row4 4 8 12 > print(a1[,1]) row1 row2 row3 row4 1 2 3 4 > > print(a1[,2]) row1 row2 row3 row4 5 6 7 8

14. Záporné indexy při přístupu k prvkům pole

Víme již, že při výběru prvku z vektoru lze použít záporný index. V takovém případě se vrátí vektor, ovšem prvek s daným indexem (převedeným na absolutní hodnotu) je odfiltrován:

> v <- 1:12 > print(v[-1]) [1] 2 3 4 5 6 7 8 9 10 11 12

Jak jsou však záporné indexy interpretovány u dvojrozměrných či vícerozměrných polí? Můžeme si to otestovat na dalším příkladu. Nejdříve pole zkonstruujeme a pro větší přehlednost pojmenujeme jeho řádky a sloupce:

> data <- 1:12 > dimension <- c(4, 3) > > row.names <- c("row1", "row2", "row3", "row4") > column.names <- c("column1", "column2", "column3") > > a1 <- array(data, dim=dimension, dimnames=list(row.names, column.names)) > > print(a1) column1 column2 column3 row1 1 5 9 row2 2 6 10 row3 3 7 11 row4 4 8 12

Nyní vybereme řádek s indexem –2 a druhý sloupec. Druhý sloupec obsahuje prvky 5, 6, 7 a 8, ovšem prvek 6 není vybrán, neboť leží na druhém řádku, který je odfiltrován. Výsledkem je tedy tříprvkový vektor:

> print(a1[-2, 2]) row1 row3 row4 5 7 8

Podobně můžeme vybrat druhý řádek, tedy prvky 2, 6 a 10 a všechny sloupce kromě druhého (tím nám z vektoru vypadne prvek s hodnotou 6):

> print(a1[2, -2]) column1 column3 2 10

A konečně při použití dvojice indexů –2, –2 se vybere původní pole, ovšem bez druhého sloupce a současně i bez druhého řádku:

> print(a1[-2, -2]) column1 column3 row1 1 9 row3 3 11 row4 4 12

Podobně můžeme postupovat i u vícerozměrných polí:

a1 <- 1:24 dimension1 <- c(2, 3, 4) dim(a1) <- dimension1 print(a1) print("----------") print(a1[-1, 1, 1]) print("----------") print(a1[1, -1, 1]) print("----------") print(a1[-1, 1, -1])

S výsledky:

, , 1 [,1] [,2] [,3] [1,] 1 3 5 [2,] 2 4 6 , , 2 [,1] [,2] [,3] [1,] 7 9 11 [2,] 8 10 12 , , 3 [,1] [,2] [,3] [1,] 13 15 17 [2,] 14 16 18 , , 4 [,1] [,2] [,3] [1,] 19 21 23 [2,] 20 22 24 [1] "----------" [1] 2 [1] "----------" [1] 3 5 [1] "----------" [1] 8 14 20

15. Filtrace řádků při výběru s využitím záporných indexů

Nyní můžeme zkombinovat dvě výběrové techniky popsané v předchozích kapitolách:

Výběr celých řádků tím, že se vynechá index sloupce. Filtrace řádků s určitým indexem v případě, že se použije záporný index.

Podívejme se na kód demonstračního příkladu. Nejdříve se zkonstruuje dvojrozměrné pole:

> data <- 1:12 > dimension <- c(4, 3) > > row.names <- c("row1", "row2", "row3", "row4") > column.names <- c("column1", "column2", "column3") > > a1 <- array(data, dim=dimension, dimnames=list(row.names, column.names)) > > print(a1) column1 column2 column3 row1 1 5 9 row2 2 6 10 row3 3 7 11 row4 4 8 12

Výběr všech řádků kromě prvního:

> print(a1[-1, ]) column1 column2 column3 row2 2 6 10 row3 3 7 11 row4 4 8 12

Výběr všech řádků kromě druhého:

> print(a1[-2, ]) column1 column2 column3 row1 1 5 9 row3 3 7 11 row4 4 8 12

Výběr všech řádků kromě třetího:

> print(a1[-3, ]) column1 column2 column3 row1 1 5 9 row2 2 6 10 row4 4 8 12

Řádky, které se mají vybírat, mohou být reprezentovány vektorem:

data <- 1:12 dimension <- c(4, 3) row.names <- c("row1", "row2", "row3", "row4") column.names <- c("column1", "column2", "column3") a1 <- array(data, dim=dimension, dimnames=list(row.names, column.names)) print(a1[c(4,1), ])

S výsledkem:

column1 column2 column3 row4 4 8 12 row1 1 5 9

16. Filtrace sloupců při výběru s využitím záporných indexů

Logicky bude následovat podobný demonstrační příklad, ovšem s filtrací sloupců. V tomto příkladu se z původního dvojrozměrného pole získá nové pole, které bude mít shodný počet řádků s polem zdrojovým, ovšem sloupce budou filtrovány (vždy bude jeden z nich vynechán):

> data <- 1:12 > dimension <- c(4, 3) > > row.names <- c("row1", "row2", "row3", "row4") > column.names <- c("column1", "column2", "column3") > > a1 <- array(data, dim=dimension, dimnames=list(row.names, column.names)) > > print(a1) column1 column2 column3 row1 1 5 9 row2 2 6 10 row3 3 7 11 row4 4 8 12 > print(a1[, -1]) column2 column3 row1 5 9 row2 6 10 row3 7 11 row4 8 12 > print(a1[, -2]) column1 column3 row1 1 9 row2 2 10 row3 3 11 row4 4 12 > print(a1[, -3]) column1 column2 row1 1 5 row2 2 6 row3 3 7 row4 4 8

Výběr konkrétních sloupců s využitím výběrového vektoru:

data <- 1:12 dimension <- c(4, 3) row.names <- c("row1", "row2", "row3", "row4") column.names <- c("column1", "column2", "column3") a1 <- array(data, dim=dimension, dimnames=list(row.names, column.names)) print(a1) print(a1[, c(3,2,1)]) print(a1[, c(3,1)]) print(a1[, c(1,1,1,1)])

S výsledky:

column1 column2 column3 row1 1 5 9 row2 2 6 10 row3 3 7 11 row4 4 8 12 column3 column2 column1 row1 9 5 1 row2 10 6 2 row3 11 7 3 row4 12 8 4 column3 column1 row1 9 1 row2 10 2 row3 11 3 row4 12 4 column1 column1 column1 column1 row1 1 1 1 1 row2 2 2 2 2 row3 3 3 3 3 row4 4 4 4 4

17. Operace provedená nad korespondujícími prvky dvou polí

Na dvojici polí lze aplikovat běžné aritmetické operátory. Ty jsou vždy aplikovány na korespondující prvky polí, operace se tedy provádí prvek po prvku. Příkladem může být „součet polí“, který vlastně v případě dvojrozměrných polí odpovídá součtu matic:

> data1 <- c(1, 2, 3, 4, 5, 6) > data2 <- -6:-1 > > dimension <- c(3, 2) > > a1 <- array(data1, dim=dimension) > print(a1) [,1] [,2] [1,] 1 4 [2,] 2 5 [3,] 3 6 > > a2 <- array(data2, dim=dimension) > print(a2) [,1] [,2] [1,] -6 -3 [2,] -5 -2 [3,] -4 -1 > > print(a1 + a2) [,1] [,2] [1,] -5 1 [2,] -3 3 [3,] -1 5

Pole ovšem musí mít stejné rozměry (stejný tvar):

data1 <- c(1, 2, 3, 4, 5, 6) data2 <- -6:-1 dimension1 <- c(3, 2) a1 <- array(data1, dim=dimension1) print(a1) dimension2 <- c(2, 3) a2 <- array(data2, dim=dimension2) print(a2) print(a1 + a2)

Pokus o spuštění tohoto příkladu skončí s chybou:

[,1] [,2] [1,] 1 4 [2,] 2 5 [3,] 3 6 [,1] [,2] [,3] [1,] -6 -4 -2 [2,] -5 -3 -1 Error in a1 + a2 : non-conformable arrays Calls: print Execution halted

I dělení se provádí prvek po prvky, nejedná se tedy o pokus o dělení matic (tedy výpočet inverzní matice a vynásobení první matice s inverzí matice druhé):

> data1 <- c(1, 2, 3, 4, 5, 6) > data2 <- -6:-1 > > dimension <- c(3, 2) > > a1 <- array(data1, dim=dimension) > print(a1) [,1] [,2] [1,] 1 4 [2,] 2 5 [3,] 3 6 > > a2 <- array(data2, dim=dimension) > print(a2) [,1] [,2] [1,] -6 -3 [2,] -5 -2 [3,] -4 -1 > > print(a1 / a2) [,1] [,2] [1,] -0.1666667 -1.333333 [2,] -0.4000000 -2.500000 [3,] -0.7500000 -6.000000

18. Od dvojrozměrných polí k maticím

V předchozím textu jsme se bavili převážně o polích – jednorozměrných, dvojrozměrných i vícerozměrných. U dvojrozměrných polí jsem se snažil vynechat označení „matice“, a to z toho důvodu, že matice (matrix) jsou v programovacím jazyku R samostatným datovým typem odlišným od polí. A skutečně – mezi poli a maticemi je několik rozdílů:

# Pole Matice 1 typ array typ matrix 2 1, 2, 3 … N dimenzí striktně dvě dimenze (2D struktura) 3 homogenní typ homogenní typ 4 založeno na jediném vektoru s info o dimenzích složeno ze sady vektorů shodné délky 5 používáno primárně pro uložení dat používáno primárně pro transformaci dat 6 relativně malé množství operací plná sada „maticových“ operací 7 nadmnožina nad maticemi speciální případ pole se dvěma dimenzemi 8 konstruktor array konstruktor matrix

Poznámka: homogenní typ je takový datový typ (nebo chcete-li kontejner), který může obsahovat prvky shodného datového typu, například pouze celá čísla.

Poznámka2: na matice se tedy můžeme dívat jako na podmnožinu konkrétních typů polí (tedy méně obecný datový typ), pro které jsou ovšem k dispozici specializované operace.

Matice si podrobně popíšeme příště, ovšem již nyní si můžeme ukázat způsob jejich konstrukce. Pro vytvoření matice se používá konstruktor nazvaný matrix, kterému se předá vektor s daty (hodnotami prvků), počet řádků a počet sloupců (popř. obráceně):

> data <- 1:12 > > m1 <- matrix(data, nrow=1, ncol=12) > print(m1) [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11] [,12] [1,] 1 2 3 4 5 6 7 8 9 10 11 12 > > m2 <- matrix(data, nrow=2, ncol=6) > print(m2) [,1] [,2] [,3] [,4] [,5] [,6] [1,] 1 3 5 7 9 11 [2,] 2 4 6 8 10 12 > > m3 <- matrix(data, nrow=3, ncol=4) > print(m3) [,1] [,2] [,3] [,4] [1,] 1 4 7 10 [2,] 2 5 8 11 [3,] 3 6 9 12 > > m4 <- matrix(data, nrow=4, ncol=3) > print(m4) [,1] [,2] [,3] [1,] 1 5 9 [2,] 2 6 10 [3,] 3 7 11 [4,] 4 8 12 > > m5 <- matrix(data, nrow=6, ncol=2) > print(m5) [,1] [,2] [1,] 1 7 [2,] 2 8 [3,] 3 9 [4,] 4 10 [5,] 5 11 [6,] 6 12 > > m6 <- matrix(data, nrow=12, ncol=1) > print(m6) [,1] [1,] 1 [2,] 2 [3,] 3 [4,] 4 [5,] 5 [6,] 6 [7,] 7 [8,] 8 [9,] 9 [10,] 10 [11,] 11 [12,] 12

Opět můžeme využít toho, že pokud je vektor se zdrojovými daty kratší, než vyžaduje konstrukce matice, je postupně prodlužován. Takto se například vytvoří nulová matice:

zero <- 0 m1 <- matrix(zero, nrow=10, ncol=10) print(m1)

S výsledky:

[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [1,] 0 0 0 0 0 0 0 0 0 0 [2,] 0 0 0 0 0 0 0 0 0 0 [3,] 0 0 0 0 0 0 0 0 0 0 [4,] 0 0 0 0 0 0 0 0 0 0 [5,] 0 0 0 0 0 0 0 0 0 0 [6,] 0 0 0 0 0 0 0 0 0 0 [7,] 0 0 0 0 0 0 0 0 0 0 [8,] 0 0 0 0 0 0 0 0 0 0 [9,] 0 0 0 0 0 0 0 0 0 0 [10,] 0 0 0 0 0 0 0 0 0 0

Podrobnější informace o způsobech využití matic si popíšeme v navazující části tohoto seriálu.

19. Repositář s demonstračními příklady

Zdrojové kódy všech dnes použitých demonstračních příkladů byly uloženy do nového Git repositáře, který je dostupný na adrese https://github.com/tisnik/r-examples V případě, že z nějakého důvodu nebudete chtít klonovat celý repositář (ten je ovšem – alespoň prozatím – velmi malý, dnes má stále jen jednotky kilobajtů), můžete namísto toho použít odkazy na jednotlivé demonstrační příklady, které naleznete v následující tabulce:

# Příklad Stručný popis Cesta 1 01-array-construction-1D.R konstrukce jednorozměrného pole https://github.com/tisnik/r-examples/blob/master/03-arrays/01-array-construction-1D.R 2 02-array-set-dimensions-1D.R změna dimenzí vektoru a jeho převod na jednorozměrné pole https://github.com/tisnik/r-examples/blob/master/03-arrays/02-array-set-dimensions-1D.R 3 03-array-construction-1D-column-vector.R řádkové a sloupcové vektory https://github.com/tisnik/r-examples/blob/master/03-arrays/03-array-construction-1D-column-vector.R 4 04-array-set-dimensions-1D-column-vector.R řádkové a sloupcové vektory https://github.com/tisnik/r-examples/blob/master/03-arrays/04-array-set-dimensions-1D-column-vector.R 5 05-array-construction-2D.R konstrukce dvojrozměrného pole https://github.com/tisnik/r-examples/blob/master/03-arrays/05-array-construction-2D.R 6 06-array-set-dimensions-2D.R změna dimenzí vektoru a jeho převod na dvojrozměrné pole https://github.com/tisnik/r-examples/blob/master/03-arrays/06-array-set-dimensions-2D.R 7 07-array-construction-2D-range.R použití operátoru range při konstrukci zdroje dat https://github.com/tisnik/r-examples/blob/master/03-arrays/07-array-construction-2D-range.R 8 08-array-construction-2D-not-enough-values.R opakování prvků vektoru při konstrukci dvojrozměrného pole https://github.com/tisnik/r-examples/blob/master/03-arrays/08-array-construction-2D-not-enough-values.R 9 09-array-construction-2D-fill-with-zeros.R vytvoření dvojrozměrného pole s nulovými prvky https://github.com/tisnik/r-examples/blob/master/03-arrays/09-array-construction-2D-fill-with-zeros.R 10 10-array-set-dimensions-2D-fill-with-zeros-error.R nefunkční alternativa k předchozímu příkladu https://github.com/tisnik/r-examples/blob/master/03-arrays/10-array-set-dimensions-2D-fill-with-zeros-error.R 11 11-array-construction-3D.R konstrukce trojrozměrného pole https://github.com/tisnik/r-examples/blob/master/03-arrays/11-array-construction-3D.R 12 12-array-set-dimensions-3D.R změna dimenzí vektoru a jeho převod na trojrozměrné pole https://github.com/tisnik/r-examples/blob/master/03-arrays/12-array-set-dimensions-3D.R 13 13-array-construction-3D-not-enough-values.R opakování prvků vektoru při konstrukci trojrozměrného pole https://github.com/tisnik/r-examples/blob/master/03-arrays/13-array-construction-3D-not-enough-values.R 14 14-array-construction-3D-fill-with-zero.R vytvoření trojrozměrného pole s nulovými prvky https://github.com/tisnik/r-examples/blob/master/03-arrays/14-array-construction-3D-fill-with-zero.R 15 15-rows-columns-names.R pojmenování řádků a sloupců dvojrozměrného pole https://github.com/tisnik/r-examples/blob/master/03-arrays/15-rows-columns-names.R 16 16-matrix-name-3D.R pojmenování řádků, sloupců a třetí dimenze trojrozměrného pole https://github.com/tisnik/r-examples/blob/master/03-arrays/16-matrix-name-3D.R 17 17-array-construction-4D.R konstrukce čtyřrozměrného pole https://github.com/tisnik/r-examples/blob/master/03-arrays/17-array-construction-4D.R 18 18-array-set-dimensions-4D.R změna dimenzí vektoru a jeho převod na čtyřrozměrné pole https://github.com/tisnik/r-examples/blob/master/03-arrays/18-array-set-dimensions-4D.R 19 19-matrix-name-4D.R pojmenování řádků, sloupců a třetí i čtvrté dimenze čtyřrozměrného pole https://github.com/tisnik/r-examples/blob/master/03-arrays/19-matrix-name-4D.R 20 20-access-item.R přístup k prvkům pole https://github.com/tisnik/r-examples/blob/master/03-arrays/20-access-item.R 21 21-access-row.R přístup k celým řádkům pole https://github.com/tisnik/r-examples/blob/master/03-arrays/21-access-row.R 22 22-access-column.R přístup k celým sloupcům pole https://github.com/tisnik/r-examples/blob/master/03-arrays/22-access-column.R 23 23-negative-index.R negativní (záporné) indexy při přístupu k prvkům pole https://github.com/tisnik/r-examples/blob/master/03-arrays/23-negative-index.R 24 24-access-row-negative-index.R přístup k celým řádkům s využitím negativních indexů https://github.com/tisnik/r-examples/blob/master/03-arrays/24-access-row-negative-index.R 25 25-access-column-negative-index.R přístup k celým sloupcům s využitím negativních indexů https://github.com/tisnik/r-examples/blob/master/03-arrays/25-access-column-negative-index.R 26 26-array-add.R součet odpovídajících prvků dvou polí https://github.com/tisnik/r-examples/blob/master/03-arrays/26-array-add.R 27 27-array-sub.R rozdíl odpovídajících prvků dvou polí https://github.com/tisnik/r-examples/blob/master/03-arrays/27-array-sub.R 28 28-array-mul.R součin odpovídajících prvků dvou polí https://github.com/tisnik/r-examples/blob/master/03-arrays/28-array-mul.R 29 29-array-div.R podíl odpovídajících prvků dvou polí https://github.com/tisnik/r-examples/blob/master/03-arrays/29-array-div.R 30 30-matrix-construction.R konstrukce dvojrozměrné matice z pole https://github.com/tisnik/r-examples/blob/master/03-arrays/30-matrix-construction.R

