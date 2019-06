11. Metody pro přidání a ubrání prvku z proudu

12. Funkce vyššího řádu a jejich použití při zpracování proudů

13. Výběr prvků na základě zadaného kritéria: metoda Filter

14. Aplikace funkce na každý prvek proudu: metoda Map

15. Zavolání specifikované callback funkce pro každý prvek proudu: metoda ForEach

16. Seřazení prvků na základě jejich porovnání: metoda Sort

17. Kombinace více operací na proud: Filter→Map→ForEach

18. Použití metody Reduce pro zpracování všech prvků proudu

19. Repositář s demonstračními příklady

20. Odkazy na Internetu

1. Datové struktury s líným vyhodnocováním v programovacím jazyce Go

V seriálu o programovacím jazyce Clojure, který na serveru Root vycházel, jsme se již mnohokrát setkali s pojmem sekvence, popř. nekonečné sekvence nebo dokonce lazy sekvence. Jedná se o datovou abstrakci, která je sice velmi jednoduchá na pochopení, ale o to užitečnější v praxi – ostatně velká část standardní knihovny programovacího jazyka Clojure je na sekvencích založena. Pro ty programátory, kteří programovací jazyk Clojure znají a současně používají i Python, je určena minimalisticky pojatá knihovna nazvaná clj, kterou jsme si již taktéž popsali v samostatném článku. Ovšem jak je tomu v jazyku Go? Tento programovací jazyk ve své základní knihovně žádný podobný koncept (alespoň prozatím) nenabízí, ovšem existuje jeden balíček, který implementuje mechanismus podobný lazy sekvencím. Tento balíček, který se jmenuje Koazee, si dnes popíšeme a ukážeme si jeho možnosti a omezení na několika demonstračních příkladech.

Předností všech líně vyhodnocovaných typů je fakt, že se operace aplikované například na dlouhou sekvenci údajů aplikují až ve chvíli, kdy je to nezbytně nutné, tj. když nějaká jiná část programu nutně potřebuje použít výslednou hodnotu. Ovšem v praxi se ukazuje, že mnohdy nepotřebujeme znát všechny výsledné hodnoty, takže líné vyhodnocování může vést k úsporám strojového času. Představte si například systém, v němž je zdrojem dat dlouhé XML generované například nějakým B2B nástrojem. Pokud potřebujeme z tohoto XML získat jen jediný údaj (například na základě xpath), asi není nejlepším řešením celé XML parsovat, vytvořit DOM a poté procházet obsahem získané datové struktury a v ní hledat požadovaný prvek. Lepší bude využít „proudový“ přístup a nechat obsah XML zpracovávat postupně. A právě podobný koncept je využíván i línými sekvencemi v jazyku Clojure a líně vyhodnocovanými proudy v případě kombinace Go+Koazee.

Koazee, popíšeme si nejprve ve stručnosti sekvence a lazy sekvence tak, jak jsou implementovány přímo v programovacím jazyce Clojure. Posléze se podíváme na to, do jaké míry byl úspěšný převod tohoto konceptu do programovacího jazyka Go. Jazyky Clojure a Go jsou totiž v mnoha ohledech diametrálně odlišné – Go je v tomto porovnání nízkoúrovňový jazyk se všemi z toho plynoucími důsledky (nižší míra abstrakce atd.). Poznámka: abychom pochopili, jaké funkce nalezneme v knihovně, popíšeme si nejprve ve stručnosti sekvence a lazy sekvence tak, jak jsou implementovány přímo v programovacím jazyce Clojure. Posléze se podíváme na to, do jaké míry byl úspěšný převod tohoto konceptu do programovacího jazyka Go. Jazyky Clojure a Go jsou totiž v mnoha ohledech diametrálně odlišné – Go je v tomto porovnání nízkoúrovňový jazyk se všemi z toho plynoucími důsledky (nižší míra abstrakce atd.).

2. Sekvence a lazy sekvence v programovacím jazyku Clojure

Mnoho funkcí a maker, které nalezneme ve standardní knihovně programovacího jazyka Clojure souvisí s takzvanými sekvencemi. Tímto termínem se označuje programové rozhraní, které svými základními možnostmi zhruba odpovídá iterátorům známým z programovacího jazyka Java. V Clojure existuje velké množství funkcí, které dokážou pracovat se sekvencemi, ať již se jedná o běžné sekvence (jejichž prvky jsou přímo uloženy v operační paměti), nebo takzvané líné sekvence (lazy sekvence), které nové prvky vytváří či zjišťují až při konkrétním přístupu na tyto prvky. Mezi tyto funkce patří například sort, sort-by, take či flatten. Díky tomu, že všechny standardní kolekce (seznamy, vektory, …) jsou současně i sekvencemi, lze tyto funkce aplikovat i na kolekce, ovšem ve skutečnosti jsou sekvencemi i další typy objektů, zejména pak I/O proudy (tímto směrem se posunuly i standardní knihovny Javy), řetězce (což jsou sekvence znaků) atd.

Poznámka: i funkce, které zdánlivě mění sekvenci, tj. přidávají do ní prvky, mažou prvky, řadí prvky atd., ve skutečnosti původní sekvenci nijak nemodifikují a vrátí namísto toho sekvenci novou. Základní myšlenka jazyka Clojure – prakticky všechny hodnoty jsou neměnitelné – je tak rozšířena i na sekvence. Neměnitelnost (immutability) se zde vztahuje k „tvaru“ sekvence, protože je možné, aby samotné prvky sekvence měnitelné byly (i když se s měnitelnými prvky v praxi setkáme jen velmi zřídka).

Naprostý základ pro práci se sekvencemi tvoří trojice funkcí nazvaných first, rest a next. Funkce first vrací první prvek v sekvenci, popř. speciální hodnotu nil v případě, že je sekvence prázdná. Funkce rest i next vrací zbylé prvky v sekvenci, ovšem liší se tím, jaká hodnota se vrátí ve chvíli, kdy již v sekvenci nezbyly žádné prvky (kromě prvního). V tomto případě vrátí rest prázdnou sekvenci (například prázdný seznam), zatímco funkce next vrátí již zmíněnou speciální hodnotu nil. U běžných sekvencí, například seznamů, jsou tyto funkce implementovány přímočaře, ovšem v případě lazy sekvencí se prvky vrácené pomocí funkce first vyhodnocují až za běhu, například pomocí nějaké generátorové funkce. Tímto způsobem je možné pracovat i s nekonečnými sekvencemi, u nichž už z principu nelze dopředu znát celkový počet prvků atd.

Velmi dobrým příkladem lazy sekvence je funkce range, která dokonce existuje v několika podobách, jež se od sebe z hlediska programátora-uživatele liší především různým počtem parametrů. Pokud se této funkci nepředá žádný parametr, vrátí funkce range sekvenci celých čísel od nuly do nekonečna. Zde je patrné, proč se musí jednat o lazy sekvenci – nekonečnou řadu celých čísel by samozřejmě v případě normální sekvence nebylo možné uložit do operační paměti. Pokud se funkci range předá pouze jediný parametr (kterým musí být celé číslo – je kontrolováno v runtime), je vrácena sekvence celých čísel od 0 do zadané hodnoty-1. Opět se jedná o nefalšovanou lazy sekvenci, takže se nemusíte bát používat i velké n. Dále již následují v podstatě jen kosmetické úpravy – volání funkce range se dvěma parametry m, n vytvoří sekvenci celých čísel od m do n-1 a pokud je použit ještě třetí parametr, určuje se jím krok, který může být i záporný.

3. Líně vyhodnocované proudy v Go – knihovna Koazee

Po krátké odbočce se vraťme k programovacímu jazyku Go. Tento jazyk je z velké části založen na odlišných paradigmatech, než jazyk Clojure, takže nebude příliš překvapující zjištění, že standardní datové typy (včetně řezů, polí a map) jsou vyhodnocovány ihned po aplikování nějaké operace. Nicméně existují knihovny, které koncept líného vyhodnocování dokážou v runtime aplikovat. Mezi tyto knihovny patří i knihovna nazvaná Koazee, jejíž zdrojové kódy naleznete na GitHubu na adrese https://github.com/wesovilabs/koazee a která pracuje s proudy.

Nicméně i přes některé rozdíly mezi proudy a líně vyhodnocovanými sekvencemi je základní myšlenka stejná – umožnit aplikaci různých transformací na sekvenci dat, ideálně takovým způsobem, aby se transformace aplikovala až tehdy, kdy (pokud vůbec) bude výsledek vyžadován. V mnoha algoritmech totiž například hledáme určitý transformovaný prvek v sekvenci/proudu a po jeho nalezení algoritmus končí. Nemá tedy význam aplikovat transformace na všechny prvky, tedy i ty, které se již dále nebudou nijak využívat (a takových algoritmů je překvapivě velké množství, ostatně se s nimi setkáváme každý den například u služeb poskytujících video a audio streamy).

Poznámka: knihovna Koazee v současné podobě nepodporuje práci s nekonečnými sekvencemi, takže tento velmi užitečný mechanismus nebudeme v Go moci použít.

4. Vytvoření proudu z řezu

Nejprve si pochopitelně ukážeme, jakým způsobem se proud (stream) vytvoří. Existují dokonce dvě varianty konstrukce proudu, které se však interně chovají odlišně. V první variantě je použit konstruktor New z balíčku github.com/wesovilabs/koazee/stream:

values := []int{1, 2, 3, 4, 5} stream1 := stream.New(values)

Druhá varianta je založena na funkci StreamOf, která ovšem pochází z odlišného balíčku se jménem github.com/wesovilabs/koazee:

values := []int{1, 2, 3, 4, 5} stream := koazee.StreamOf(values)

Další důležitou operací je získání dat z proudu, protože prvky v proudu mohou být podrobeny mnoha transformacím popsaných v dalším textu. Pro přečtení se použije metoda Out() vracející instanci datového typu Option:

func (s Stream) Out() *Output

Samotný obsah proudu, tedy jednotlivé prvky, se přečtou metodou Val(), která je definována pro typ Option:

func (o Output) Val() interface{}

Příklad použití:

words := []string{"one", "two", "three", "four", "five"} stream = koazee.StreamOf(words) fmt.Printf("stream: %v

", stream.Out().Val())

Nyní si ukážeme, jakým způsobem se oba typy konstruktorů používají. Nejprve vytvoříme proud z řezu (alternativně z pole, což je ovšem potenciálně problematické) a následně z proudu opět přečteme jednotlivé prvky, takže se vlastně provede zpětná konverze na nějaký základní datový typ programovacího jazyka Go.

V prvním demonstračním příkladu je pro vytvoření proudu použit konstruktor New. V příkladu jsou vytvořeny dva proudy, přičemž jeden z nich obsahuje sekvenci celých čísel a druhý sekvenci řetězců (výhodou je, že oba tyto datové typy jsou neměnitelné – immutable):

package main import ( "fmt" "github.com/wesovilabs/koazee/stream" ) func main() { values := []int{1, 2, 3, 4, 5} fmt.Printf("input: %v

", values) stream1 := stream.New(values) fmt.Printf("stream: %v

", stream1.Out().Val()) fmt.Println() words := []string{"one", "two", "three", "four", "five"} fmt.Printf("words: %v

", words) stream2 := stream.New(words) fmt.Printf("stream: %v

", stream2.Out().Val()) fmt.Println() anything := []interface{}{"one", 1, 1.0, 1 + 1i} fmt.Printf("anything: %v

", anything) stream3 := stream.New(anything) fmt.Printf("stream: %v

", stream3.Out().Val()) }

Po překladu spuštění tohoto demonstračního příkladu získáme následující informace o původním řezu i o datech získaných z proudu:

input: [1 2 3 4 5] stream: [1 2 3 4 5] words: [one two three four five] stream: [one two three four five] anything: [one 1 1 (1+1i)] stream: [one 1 1 (1+1i)]

Druhý demonstrační příklad se do značné míry podobá příkladu prvnímu, ovšem pro vytvoření proudu je využita funkce StreamOf a nikoli konstruktor New:

package main import ( "fmt" "github.com/wesovilabs/koazee" ) func main() { values := []int{1, 2, 3, 4, 5} fmt.Printf("input: %v

", values) stream := koazee.StreamOf(values) fmt.Printf("stream: %v

", stream.Out().Val()) fmt.Println() words := []string{"one", "two", "three", "four", "five"} fmt.Printf("words: %v

", words) stream = koazee.StreamOf(words) fmt.Printf("stream: %v

", stream.Out().Val()) fmt.Println() anything := []interface{}{"one", 1, 1.0, 1 + 1i} fmt.Printf("anything: %v

", anything) stream3 := koazee.StreamOf(anything) fmt.Printf("stream: %v

", stream3.Out().Val()) }

Po spuštění tohoto příkladu se vypíšou stejné zprávy, jako u příkladu prvního:

input: [1 2 3 4 5] stream: [1 2 3 4 5] words: [one two three four five] stream: [one two three four five] anything: [one 1 1 (1+1i)] stream: [one 1 1 (1+1i)]

5. Proud vytvořený ze sekvence uživatelem definovaných struktur

Proud je samozřejmě možné vytvořit z prakticky libovolných hodnot. Může se tedy jednat i o hodnoty uživatelských datových typů. V dalším demonstračním příkladu jsou použity hodnoty uživatelského datového typu User:

type User struct { id uint32 name string surname string }

Proud je vytvořen funkcí StreamOf, s níž jsme se již seznámili v předchozích kapitolách:

stream := koazee.StreamOf(users)

Získání prvků z takového proudu je naprosto stejné, jako u proudů, jejichž prvky byla celá čísla, popř. řetězce:

fmt.Printf("stream: %v

", stream.Out().Val())

Podívejme se nyní na úplný zdrojový kód tohoto příkladu:

package main import ( "fmt" "github.com/wesovilabs/koazee" ) type User struct { id uint32 name string surname string } func main() { var users = []User{ User{ id: 1, name: "Pepek", surname: "Vyskoč"}, User{ id: 2, name: "Pepek", surname: "Vyskoč"}, User{ id: 3, name: "Josef", surname: "Vyskočil"}, } fmt.Println(users) fmt.Printf("input: %v

", users) stream := koazee.StreamOf(users) fmt.Printf("stream: %v

", stream.Out().Val()) }

Po jeho spuštění by se měla zobrazit jak zdrojová data, tak i obsah proudu:

[{1 Pepek Vyskoč} {2 Pepek Vyskoč} {3 Josef Vyskočil}] input: [{1 Pepek Vyskoč} {2 Pepek Vyskoč} {3 Josef Vyskočil}] stream: [{1 Pepek Vyskoč} {2 Pepek Vyskoč} {3 Josef Vyskočil}]

6. Problémy, které mohou nastat při vytváření proudu z pole

Při konstrukci proudů mohou nastat problémy. Týká se to především situace, kdy se snažíme proud vytvořit z pole, například z pole uživatelských struktur (i když na typů prvků pole tolik nezáleží):

var users = [3]User{ User{ id: 1, name: "Pepek", surname: "Vyskoč"}, User{ id: 2, name: "Pepek", surname: "Vyskoč"}, User{ id: 3, name: "Josef", surname: "Vyskočil"}, }

Povšimněte si, že skutečně pracujeme s polem, u kterého je explicitně zadán počet prvků. Pokud bychom počet prvků vynechali, jednalo by se o řez.

Nyní se můžeme pokusit vytvořit proud pomocí funkce StreamOf:

package main import ( "fmt" "github.com/wesovilabs/koazee" ) type User struct { id uint32 name string surname string } func main() { var users = [3]User{ User{ id: 1, name: "Pepek", surname: "Vyskoč"}, User{ id: 2, name: "Pepek", surname: "Vyskoč"}, User{ id: 3, name: "Josef", surname: "Vyskočil"}, } fmt.Println(users) fmt.Printf("input: %v

", users) stream := koazee.StreamOf(users) fmt.Printf("stream: %v

", stream.Out().Val()) }

Výsledek nás ovšem příliš nepotěší, protože proud bude prázdný!

[{1 Pepek Vyskoč} {2 Pepek Vyskoč} {3 Josef Vyskočil}] input: [{1 Pepek Vyskoč} {2 Pepek Vyskoč} {3 Josef Vyskočil}] stream: <nil>

Další příklad je prakticky stejný, jako příklad předchozí, ovšem proud z pole vytvoříme konstruktorem New:

package main import ( "fmt" "github.com/wesovilabs/koazee/stream" ) type User struct { id uint32 name string surname string } func main() { var users = [3]User{ User{ id: 1, name: "Pepek", surname: "Vyskoč"}, User{ id: 2, name: "Pepek", surname: "Vyskoč"}, User{ id: 3, name: "Josef", surname: "Vyskočil"}, } fmt.Println(users) fmt.Printf("input: %v

", users) stream := stream.New(users) fmt.Printf("stream: %v

", stream.Out().Val()) }

Takto vytvořený proud již bude obsahovat všechny očekávané prvky:

[{1 Pepek Vyskoč} {2 Pepek Vyskoč} {3 Josef Vyskočil}] input: [{1 Pepek Vyskoč} {2 Pepek Vyskoč} {3 Josef Vyskočil}] stream: [{1 Pepek Vyskoč} {2 Pepek Vyskoč} {3 Josef Vyskočil}]

7. Základní vlastnosti proudů

Nyní si již můžeme ukázat několik základních metod používaných pro práci s proudy. Mezi základní metody patří metoda pro zjištění počtu prvků v proudu a dále trojice metod umožňujících přístup k jednotlivým prvkům:

# Metoda Stručný popis 1 Count vrací počet prvků v proudu 2 First vrací první prvek z proudu 3 Last vrací poslední prvek z proudu 4 At vrací n-tý prvek z proudu (indexuje se od nuly), popř. nil

At a nikoli operátor indexování []. Poznámka: v Go nelze přetěžovat operátory, takže je skutečně nutné použít metodua nikoli operátor indexování [].

Tyto metody si můžeme velmi snadno otestovat:

package main import ( "fmt" "github.com/wesovilabs/koazee" ) func main() { values := []int{1, 2, 3, 4, 5} fmt.Printf("input:\t%v

", values) stream := koazee.StreamOf(values) cnt, _ := stream.Count() fmt.Printf("count:\t%d

", cnt) first := stream.First().Val() fmt.Printf("first:\t%d

", first) second := stream.At(1).Val() fmt.Printf("second:\t%d

", second) last := stream.Last().Val() fmt.Printf("last:\t%d

", last) unknown := stream.At(10).Val() fmt.Printf("unknown:\t%v

", unknown) }

Výsledky běhu tohoto demonstračního příkladu by neměly být překvapující:

input: [1 2 3 4 5] count: 5 first: 1 second: 2 last: 5 unknown: <nil>

nil. To obecně není příliš dobré řešení, protože pro rozlišení mezi neexistujícím prvkem a skutečnou hodnotou nil bude nutné všude používat i metodu Count. Podobný koncept je mimochodem použit i v programovacím jazyce Lua při přístupu k prvkům tabulky. Poznámka: povšimněte si, jakým způsobem jsme informováni o tom, že prvek s daným indexem neexistuje – vrátí se hodnota. To obecně není příliš dobré řešení, protože pro rozlišení mezi neexistujícím prvkem a skutečnou hodnotoubude nutné všude používat i metodu. Podobný koncept je mimochodem použit i v programovacím jazyce Lua při přístupu k prvkům tabulky.

8. Test, zda proud obsahuje zadaný prvek

Poměrně často je nutné zjistit, jestli proud obsahuje určitý prvek. K tomuto účelu lze použít metodu Contains:

func (s Stream) Contains(element interface{}) (bool, *errors.Error)

Vidíme, že tato metoda vrací dvě hodnoty: informaci o tom, zda byl prvek s danou hodnotou v proudu nalezen a taktéž informaci o chybě, která může při vyhledávání prvku nastat. Proč vlastně může dojít k chybě u tak jednoduché operace, jakou je nalezení prvku v proudu? Celý problém spočívá v typovém systému programovacího jazyka Go, který neumožňuje, aby se překladači oznámil typ prvků uložených v proudu. Proto se předpokládá, že prvky jsou typu interface{} a kontrola, zda typ hledaného prvku odpovídá typům prvků v proudu se provádí programově, tedy až v runtime:

package main import ( "fmt" "github.com/wesovilabs/koazee" ) func main() { values := []int{1, 2, 3, 4, 5} fmt.Printf("input: %v

", values) stream := koazee.StreamOf(values) p1, _ := stream.Contains(2) fmt.Printf("contains 2? %v

", p1) p2, _ := stream.Contains(42) fmt.Printf("contains 42? %v

", p2) fmt.Println() words := []string{"one", "two", "three", "four", "five"} fmt.Printf("words: %v

", words) stream = koazee.StreamOf(words) p3, _ := stream.Contains("one") fmt.Printf("contains 'one'? %v

", p3) p4, e1 := stream.Contains("ten") fmt.Printf("contains 'ten'? %v

", p4) fmt.Printf("error %v

", e1) p4, e2 := stream.Contains(42) fmt.Printf("contains 42? %v

", p4) fmt.Printf("error %v

", e2) }

Povšimněte si především posledních dvou řádků výstupu. Jedná se o výsledek snahy o vyhledání prvku jiného typu, než je počet prvků uložených v proudu:

input: [1 2 3 4 5] contains 2? true contains 42? false words: [one two three four five] contains 'one'? true contains 'ten'? false error <nil> contains 42? false error [contains:err.invalid-argument] The Stream contains elements of type string and the passed argument has type int

V dalším demonstračním příkladu je ukázáno, že je možné vyhledávat i prvky, jejichž hodnoty mají složitější datové typy, zde konkrétně datový typ User, který již známe z předchozích kapitol:

type User struct { id uint32 name string surname string }

Následuje výpis úplného zdrojového kódu tohoto demonstračního příkladu:

package main import ( "fmt" "github.com/wesovilabs/koazee" ) type User struct { id uint32 name string surname string } func main() { var users = []User{ User{ id: 1, name: "Pepek", surname: "Vyskoč"}, User{ id: 2, name: "Pepek", surname: "Vyskoč"}, User{ id: 3, name: "Josef", surname: "Vyskočil"}, } fmt.Println(users) stream := koazee.StreamOf(users) p1, _ := stream.Contains(User{3, "Josef", "Vyskočil"}) fmt.Printf("contains? %v

", p1) p2, _ := stream.Contains(User{4, "Josef", "Vyskočil"}) fmt.Printf("contains? %v

", p2) }

Výsledek činnosti tohoto demonstračního příkladu by měl vypadat následovně:

[{1 Pepek Vyskoč} {2 Pepek Vyskoč} {3 Josef Vyskočil}] contains? true contains? false

9. Získání indexu nalezeného prvku

Mnohdy se pochopitelně nespokojíme pouze s oznámením, že proud obsahuje či naopak neobsahuje hledaný prvek. V případě, že takový prvek budeme chtít získat, je nutné použít metodu IndexOf či LastIndexOf, která vrátí index prvního, resp. posledního prvku v proudu, který odpovídá prvku hledanému. I tyto metody vrací dvě hodnoty, a to jak hledaný index, tak i informaci o případné chybě, která může nastat:

func (s Stream) IndexOf(element interface{}) (int, *errors.Error)

a:

func (s Stream) LastIndexOf(element interface{}) (int, *errors.Error)

Ve chvíli, kdy není prvek nalezen, ale současně nedojde k žádné běhové chybě, je vrácena hodnota –1 neboli InvalidIndex.

Filter, popř. je možné použít metodu IndexesOf vracející řez s indexy: Poznámka: v případě, že budete potřebovat nalézt všechny určité prvky, může být vhodnější použít buď dále popsanou funkci vyššího řádu, popř. je možné použít metoduvracející řez s indexy:

func (s Stream) IndexesOf(element interface{}) ([]int, *errors.Error)

V dalším demonstračním příkladu je ukázáno použití metod IndexOf i LastIndexOf pro proud s celými čísly a řetězci:

package main import ( "fmt" "github.com/wesovilabs/koazee" ) func main() { values := []int{1, 2, 3, 4, 5, 1} fmt.Printf("input: %v

", values) stream := koazee.StreamOf(values) i1, _ := stream.IndexOf(1) fmt.Printf("index of 1: %v

", i1) i2, _ := stream.LastIndexOf(1) fmt.Printf("last index of 1: %v

", i2) i3, _ := stream.IndexOf(42) fmt.Printf("index of 42: %v

", i3) fmt.Println() words := []string{"one", "two", "three", "four", "five"} fmt.Printf("words: %v

", words) stream = koazee.StreamOf(words) i4, _ := stream.IndexOf("one") fmt.Printf("index of 'one': %v

", i4) i5, _ := stream.LastIndexOf("two") fmt.Printf("last index of 'one': %v

", i5) i6, e6 := stream.IndexOf("foobar") fmt.Printf("index of 'foobar': %v

", i6) fmt.Printf("error: %v

", e6) fmt.Println() i7, e7 := stream.IndexOf(42) fmt.Printf("index of 42: %v

", i7) fmt.Printf("error: %v

", e7) }

Opět si ukažme výsledky získané spuštěním tohoto demonstračního příkladu:

input: [1 2 3 4 5 1] index of 1: 0 last index of 1: 5 index of 42: -1 words: [one two three four five] index of 'one': 0 last index of 'one': 1 index of 'foobar': -1 error: <nil> index of 42: -1 error: [indexOf:err.invalid-argument] The Stream indexOf elements of type string and the passed argument has type int

Podobně jako u metody Contains je možné i v případě metod IndexOf a LastIndexOf prvky vyhledávat v proudu obsahujícím hodnoty uživatelsky definovaných datových typů:

package main import ( "fmt" "github.com/wesovilabs/koazee" ) type User struct { id uint32 name string surname string } func main() { var users = []User{ User{ id: 1, name: "Pepek", surname: "Vyskoč"}, User{ id: 2, name: "Pepek", surname: "Vyskoč"}, User{ id: 3, name: "Josef", surname: "Vyskočil"}, } fmt.Println(users) stream := koazee.StreamOf(users) i1, _ := stream.IndexOf(User{3, "Josef", "Vyskočil"}) fmt.Printf("index of #1: %v

", i1) i2, _ := stream.LastIndexOf(User{3, "Josef", "Vyskočil"}) fmt.Printf("last index of #1: %v

", i2) i3, _ := stream.IndexOf(User{}) fmt.Printf("index of #2: %v

", i3) }

S výsledky:

[{1 Pepek Vyskoč} {2 Pepek Vyskoč} {3 Josef Vyskočil}] index of #1: 2 last index of #1: 2 index of #2: -1

10. Získání nového proudu pomocí řezu (metoda Take)

Přímo v programovacím jazyku Go existuje operátor slice sloužící k získání nového řezu z pole, popř. z jiného řezu. Připomeňme si, že se tento operátor zapisuje podobným způsobem, jako indexování, ovšem používají se zde dva indexy oddělené dvojtečkou:

var a1 [100]byte var a2 [100]int32 fmt.Printf("Delka pole 1: %d

", len(a1)) fmt.Printf("Delka pole 2: %d

", len(a2)) var slice1 []byte = a1[10:20] fmt.Printf("Delka rezu 1: %d

", len(slice1)) fmt.Printf("Kapacita rezu 1: %d

", cap(slice1)) var slice2 = a1[20:30] fmt.Printf("Delka rezu 2: %d

", len(slice2)) fmt.Printf("Kapacita rezu 2: %d

", cap(slice2)) slice3 := a1[30:40] fmt.Printf("Delka rezu 3: %d

", len(slice3)) fmt.Printf("Kapacita rezu 3: %d

", cap(slice3))

Podobnou operaci nalezneme i při práci s proudy, ovšem s tím podstatným rozdílem, že se v případě proudů tato operace musí aplikovat zavoláním metody Take. Je tomu tak z toho důvodu, že jazyk Go nepodporuje (a pravděpodobně ani nikdy podporovat nebude) přetěžování operátorů. Samotná hlavička metody Take vypadá následovně:

func (s Stream) Take(firstIndex, lastIndex int) Stream

Poznámka: povšimněte si, že výsledkem volání této metody je nový proud. To je důležité, neboť nám to umožňuje zřetězení „proudových“ operací ve stylu, který byl poprvé použit ve funkcionálních programovacích jazycích a později se rozšířil i do jazyků mainstreamových.

V dalším demonstračním příkladu je ukázáno, jakým způsobem se metoda Take používá. Zajímat nás bude především případ, kdy by měl být výsledkem prázdný proud:

package main import ( "fmt" "github.com/wesovilabs/koazee" ) func main() { values := []int{1, 2, 3, 4, 5, 6, 7, 8, 9, 10} fmt.Printf("input: %v

", values) stream := koazee.StreamOf(values) fmt.Printf("stream: %v

", stream.Out().Val()) stream2 := stream.Take(3, 6) fmt.Printf("stream2: %v

", stream2.Out().Val()) stream3 := stream.Take(3, 4) fmt.Printf("stream3: %v

", stream3.Out().Val()) stream4 := stream.Take(3, 3) fmt.Printf("stream4: %v

", stream4.Out().Val()) stream5 := stream.Take(4, 3) fmt.Printf("stream5: %v

", stream5.Out().Val()) stream6 := stream.Take(4, 100) fmt.Printf("stream6: %v

", stream6.Out().Val()) }

Po spuštění tohoto demonstračního příkladu získáme tyto řádky:

input: [1 2 3 4 5 6 7 8 9 10] stream: [1 2 3 4 5 6 7 8 9 10] stream2: [4 5 6 7] stream3: [4 5] stream4: [4] stream5: <nil> stream6: <nil>

První tři výsledky jsou předvídatelné, ovšem zajímavější je další dvojice řádků. Z ní vyplývá, že prázdný proud vrací hodnotu nil a nikoli například prázdný řez.

Poznámka: problémy mohou nastat ve chvíli, kdy proud obsahuje například ukazatele. Změna hodnoty, na kterou ukazatel směřuje, se pochopitelně projeví v obou proudech.

11. Metody pro přidání a ubrání prvku z proudu

V dalším textu si ve stručnosti popíšeme ty operace, které slouží pro přidání prvků do proudu, popř. pro jejich odebrání. Ovšem na tomto místě si musíme uvědomit, že aplikací těchto operací vznikne nový proud, který ovšem interně může sdílet data s proudem originálním (typicky v případě, že proud obsahuje ukazatele na prvky umístěné v jiné oblasti operační paměti). Dále popsané operace tedy původní proud žádným způsobem nemodifikují.

# Operace Stručný popis 1 Add přidání dalšího prvku na konec proudu 2 Drop odebrání určeného prvku

package main import ( "fmt" "github.com/wesovilabs/koazee" ) func main() { values := []int{1, 2, 3, 4, 5} fmt.Printf("input: %v

", values) stream1 := koazee.StreamOf(values) stream2 := stream1.Add(6) stream3 := stream1.Drop(3) stream4 := stream1.Drop(10) fmt.Printf("stream1: %v

", stream1.Out().Val()) fmt.Printf("stream2: %v

", stream2.Out().Val()) fmt.Printf("stream3: %v

", stream3.Out().Val()) fmt.Printf("stream4: %v

", stream4.Out().Val()) }

Výsledek běhu tohoto demonstračního příkladu ukazuje, že vznikly čtyři proudy – původní proud, proud s prvkem přidaným na konec, proud s odebraným prvkem a proud obsahující stejné prvky, jako proud první (protože jsme se snažili o odebrání neexistujícího prvku):

input: [1 2 3 4 5] stream1: [1 2 3 4 5] stream2: [1 2 3 4 5 6] stream3: [1 2 4 5]

12. Funkce vyššího řádu a jejich použití při zpracování proudů

Další skupina operací je velmi důležitá. Jedná se o takzvané funkce vyššího řádu, tj. o funkce (zde konkrétně metody, to je ovšem v Go jen syntaktický cukr), které jako své parametry akceptují jiné funkce, popř. dokonce vrací (nové) funkce jako svoji návratovou hodnotu. Mezi dvě základní funkce vyššího řádu, které nalezneme prakticky ve všech jazycích, jež tento koncept nějakým způsobem podporují, patří funkce nazvané map a taktéž filter a reduce. Funkce map postupně aplikuje jí předanou funkci na jednotlivé prvky nějaké sekvence a vytváří tak sekvenci novou (modifikovanou). Funkce filter slouží pro výběr hodnot na základě nějakého kritéria a funkce reduce pro postupné zpracování celé sekvence/proudu s akumulací výsledků. A přesně trojici Map, Filter a Reduce (v Go ovšem psané s velkými písmeny) najdeme i v knihovně Koazee:

# Operace Stručný popis 1 Filter výběr prvků z proudu na základě zadaného kritéria 2 Map aplikace nějaké funkce na všechny prvky proudu 3 Reduce zpracování všech prvků proudu s akumulací výsledku 4 ForEach zavolání funkce pro každý prvek proudu

13. Výběr prvků na základě zadaného kritéria: metoda Filter

Funkce vyššího řádu Filter odstraní z proudu ty prvky, které neodpovídají zadanému kritériu (nebo opačně – vybere ty prvky, které kritériu odpovídají). Výsledkem aplikace této funkce na proud bude nový proud s obecně menším množstvím prvků:

func (s Stream) Filter(fn interface{}) Stream

Ukázka použití této funkce bude jednoduchá – budeme postupně vybírat prvky dělitelné dvěma, popř. dělitelné třemi:

package main import ( "fmt" "github.com/wesovilabs/koazee" ) func evenValue(x int) bool { return x%2 == 0 } func divisibleByThree(x int) bool { return x%3 == 0 } func main() { values := []int{1, 2, 3, 4, 5, 6, 7, 8, 9, 10} fmt.Printf("input: %v

", values) stream1 := koazee.StreamOf(values) stream2 := stream1.Filter(evenValue).Do() stream3 := stream1.Filter(divisibleByThree).Do() fmt.Printf("stream1: %v

", stream1.Out().Val()) fmt.Printf("stream2: %v

", stream2.Out().Val()) fmt.Printf("stream3: %v

", stream3.Out().Val()) }

Výsledky:

input: [1 2 3 4 5 6 7 8 9 10] stream1: [1 2 3 4 5 6 7 8 9 10] stream2: [2 4 6 8 10] stream3: [3 6 9]

Do, která zajistí vyhodnocení, prvků, protože jinak by k vyhodnocení kvůli „lenosti“ operací nedošlo. Poznámka: povšimněte si použití metody, která zajistí vyhodnocení, prvků, protože jinak by k vyhodnocení kvůli „lenosti“ operací nedošlo.

Nic nám ovšem nebrání použít anonymní funkce, což je častější řešení:

package main import ( "fmt" "github.com/wesovilabs/koazee" ) func main() { values := []int{1, 2, 3, 4, 5, 6, 7, 8, 9, 10} fmt.Printf("input: %v

", values) stream1 := koazee.StreamOf(values) stream2 := stream1.Filter(func(x int) bool { return x%2 == 0 }).Do() stream3 := stream1.Filter(func(x int) bool { return x%3 == 0 }).Do() fmt.Printf("stream1: %v

", stream1.Out().Val()) fmt.Printf("stream2: %v

", stream2.Out().Val()) fmt.Printf("stream3: %v

", stream3.Out().Val()) }

14. Aplikace funkce na každý prvek proudu: metoda Map

Pravděpodobně nejdůležitější a současně i velmi snadno pochopitelnou metodou určenou pro zpracování proudů „funkcionálním“ způsobem je metoda nazvaná Map. Tato metoda zpracovává všechny prvky vstupního proudu a vytváří výsledný proud. Důležité je, že původní proud zůstane nezměněn. Metoda Map při konstrukci výsledného proudu zavolá pro každý prvek vstupního proudu uživatelem specifikovanou funkci, jejíž návratový kód následně použije. Metoda Map tedy potřebuje dva údaje: vstupní proud (příjemce metody) a funkci, kterou má na jednotlivé prvky této kolekce aplikovat. Tato funkce může být anonymní či neanonymní (pojmenovaná):

package main import ( "fmt" "github.com/wesovilabs/koazee" ) func doubleValue(x int) int { return x * 2 } func negate(x int) int { return -x } func main() { values := []int{1, 2, 3, 4, 5} fmt.Printf("input: %v

", values) stream1 := koazee.StreamOf(values) stream2 := stream1.Map(doubleValue).Do() stream3 := stream1.Map(doubleValue).Map(negate).Do() fmt.Printf("stream1: %v

", stream1.Out().Val()) fmt.Printf("stream2: %v

", stream2.Out().Val()) fmt.Printf("stream3: %v

", stream3.Out().Val()) }

Výsledek běhu tohoto příkladu:

input: [1 2 3 4 5] stream1: [1 2 3 4 5] stream2: [2 4 6 8 10] stream3: [-2 -4 -6 -8 -10]

Pochopitelně i zde můžeme použít anonymní funkce:

package main import ( "fmt" "github.com/wesovilabs/koazee" ) func main() { values := []int{1, 2, 3, 4, 5} fmt.Printf("input: %v

", values) stream1 := koazee.StreamOf(values) stream2 := stream1.Map(func(x int) int { return x * 2 }).Do() stream3 := stream1.Map(func(x int) int { return x * 2 }).Map(func(x int) int { return -x }).Do() fmt.Printf("stream1: %v

", stream1.Out().Val()) fmt.Printf("stream2: %v

", stream2.Out().Val()) fmt.Printf("stream3: %v

", stream3.Out().Val()) }

15. Zavolání specifikované callback funkce pro každý prvek proudu: metoda ForEach

V případě, že budeme potřebovat pro každý prvek proudu zavolat určitou funkci (pro výpis atd.), která ovšem nebude použita pro vytvoření proudu nového, použijeme namísto metody Map spíše metodu nazvanou ForEach:

package main import ( "fmt" "github.com/wesovilabs/koazee" ) func printInt(x int) { fmt.Printf("%d\t", x) } func main() { values1 := []int{1, 2, 3, 4, 5} fmt.Printf("input #1: %v

", values1) stream1 := koazee.StreamOf(values1) stream1.ForEach(printInt) fmt.Println() values2 := []int{1, 2, 3, 4, 5} fmt.Printf("input #2: %v

", values2) stream2 := koazee.StreamOf(values2) stream2.ForEach(printInt).Do() }

S výsledky:

input #1: [1 2 3 4 5] input #2: [1 2 3 4 5] 1 2 3 4 5

Do, takže se „líný“ proud nevyhodnotil. To přesně odpovídá očekávanému chování líných datových struktur, ovšem v případě ForEach nás to může překvapit. Poznámka: povšimněte si, že v prvním případě jsme explicitně nezavolali metodu, takže se „líný“ proud nevyhodnotil. To přesně odpovídá očekávanému chování líných datových struktur, ovšem v případěnás to může překvapit.

16. Seřazení prvků na základě jejich porovnání: metoda Sort

Další užitečnou metodou, kterou v knihovně Koazee nalezneme, je metoda nazvaná Sort. Ta pochopitelně slouží k seřazení prvků proudu, a to na základě výsledků funkce, která se volá pro dvojici prvků. Rozhoduje znaménko výsledku – záporná hodnota značí relaci „je menší“, kladná hodnota „je větší“, nula pak „rovnost“. Ukažme si tedy seřazení proudu s celými čísly vzestupně a posléze sestupně:

package main import ( "fmt" "github.com/wesovilabs/koazee" ) func compare1(x, y int) int { return x - y } func compare2(x, y int) int { return y - x } func main() { values := []int{100, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, -1} fmt.Printf("input: %v

", values) stream1 := koazee.StreamOf(values) fmt.Printf("stream1: %v

", stream1.Out().Val()) stream1.Sort(compare1).Do() fmt.Printf("stream1: %v

", stream1.Out().Val()) stream1.Sort(compare2).Do() fmt.Printf("stream1: %v

", stream1.Out().Val()) }

Výsledky:

input: [100 1 2 3 4 5 6 7 8 9 10 -1] stream1: [100 1 2 3 4 5 6 7 8 9 10 -1] stream1: [-1 1 2 3 4 5 6 7 8 9 10 100] stream1: [100 10 9 8 7 6 5 4 3 2 1 -1]

Poznámka: ze zdrojového kódu je patrné, že tato metoda ve skutečnosti seřazuje prvky v původním proudu, na rozdíl od ostatních zde popisovaných funkcí.

Opět je možné použít anonymní funkce zkracující zápis:

package main import ( "fmt" "github.com/wesovilabs/koazee" ) func main() { values := []int{100, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, -1} fmt.Printf("input: %v

", values) stream1 := koazee.StreamOf(values) fmt.Printf("stream1: %v

", stream1.Out().Val()) stream1.Sort(func(x, y int) int { return x - y }).Do() fmt.Printf("stream1: %v

", stream1.Out().Val()) stream1.Sort(func(x, y int) int { return y - x }).Do() fmt.Printf("stream1: %v

", stream1.Out().Val()) }

17. Kombinace více operací na proud: Filter→Map→ForEach

Vzhledem k tomu, že metody Filter a Map vrací jako svůj výsledek nový proud, je snadné takové operace zřetězit, což se v jiných programovacích jazycích pomalu stává standardem (ovšem s několika komplikacemi, které se týkají ladění). Podívejme se na typický příklad zřetězení:

package main import ( "fmt" "github.com/wesovilabs/koazee" ) func printInt(x int) { fmt.Printf("%d

", x) } func doubleValue(x int) int { return x * 2 } func negate(x int) int { return -x } func evenValue(x int) bool { return x%2 == 0 } func divisibleBy3(x int) bool { return x%3 == 0 } func main() { values1 := []int{1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12} fmt.Printf("input #1: %v

", values1) stream1 := koazee.StreamOf(values1). Filter(evenValue). Filter(divisibleBy3). Map(negate). Map(doubleValue) stream1.ForEach(printInt).Do() }

S výsledky:

input #1: [1 2 3 4 5 6 7 8 9 10 11 12] -12 -24

Musíme si však dát pozor na to, aby v průběhu zřetězení nedošlo ke vzniku prázdného proudu, protože ten je (což IMHO není dobře) reprezentován hodnotou nil:

package main import ( "fmt" "github.com/wesovilabs/koazee" ) func printInt(x int) { fmt.Printf("%d

", x) } func doubleValue(x int) int { return x * 2 } func negate(x int) int { return -x } func evenValue(x int) bool { return x%2 == 0 } func divisibleBy3(x int) bool { return x%3 == 0 } func main() { values1 := []int{1, 2, 3} fmt.Printf("input #1: %v

", values1) stream1 := koazee.StreamOf(values1). Filter(evenValue). Filter(divisibleBy3). Map(negate). Map(doubleValue) stream1.ForEach(printInt).Do() }

Tento příklad po svém spuštění zhavaruje, protože dvojí filtrace vrátí nil:

input #1: [1 2 3] panic: reflect: slice index out of range goroutine 1 [running]: reflect.Value.Index(0x652d60, 0xc00000a100, 0x97, 0x0, 0x655e80, 0x182, 0xc00000a100) /opt/go/src/reflect/value.go:924 +0x20a github.com/wesovilabs/koazee/internal/maps.(*Map).validate(0xc000045528, 0x1, 0x0) /home/tester/go/src/github.com/wesovilabs/koazee/internal/maps/map.go:91 +0x58b github.com/wesovilabs/koazee/internal/maps.(*Map).Run(0xc000045528, 0xc000014118, 0xc000014118, 0x652d60, 0xc00000a100) /home/tester/go/src/github.com/wesovilabs/koazee/internal/maps/map.go:21 +0x66 github.com/wesovilabs/koazee/stream.(*streamMap).run(0xc00000e210, 0x652d60, 0xc00000a100, 0x652d60, 0xc00000a100, 0x97, 0x6ed880, 0x655e80, 0x0, 0x0, ...) /home/tester/go/src/github.com/wesovilabs/koazee/stream/map.go:13 +0xf8 github.com/wesovilabs/koazee/stream.Stream.run(0x652d60, 0xc00000a100, 0x652d60, 0xc00000a100, 0x97, 0x6ed880, 0x655e80, 0x0, 0x0, 0xc00009e020, ...) /home/tester/go/src/github.com/wesovilabs/koazee/stream/stream.go:162 +0x9c github.com/wesovilabs/koazee/stream.Stream.run(0x652d60, 0xc00000a100, 0x652d60, 0xc00000a100, 0x97, 0x6ed880, 0x655e80, 0x0, 0x0, 0xc00009e020, ...) /home/tester/go/src/github.com/wesovilabs/koazee/stream/stream.go:167 +0x140 github.com/wesovilabs/koazee/stream.Stream.run(0x652d60, 0xc00000a0e0, 0x652d60, 0xc00000a0e0, 0x97, 0x6ed880, 0x655e80, 0x1, 0x0, 0xc00009e010, ...) /home/tester/go/src/github.com/wesovilabs/koazee/stream/stream.go:167 +0x140 github.com/wesovilabs/koazee/stream.Stream.Do(0x652d60, 0xc00000a0a0, 0x652d60, 0xc00000a0a0, 0x97, 0x6ed880, 0x655e80, 0x3, 0x0, 0xc00009e000, ...) /home/tester/go/src/github.com/wesovilabs/koazee/stream/do.go:5 +0x77 main.main() /home/tester/go-root/article_28/19_combinations_error.go:37 +0x668 exit status 2

18. Použití metody Reduce pro zpracování všech prvků proudu

Posledními dvěma funkcemi vyššího řádu, které nesmějí chybět v repertoáru žádné funkcionálně zaměřené knihovny, je dvojice funkcí pojmenovaná reduce a reduceRight (někdy se setkáme s názvy foldl a foldr atd.). Názvy těchto funkcí naznačují jejich účel – dochází k postupné redukci prvků uložených v kolekci či v poli, a to (postupnou) aplikací zvolené uživatelské funkce na jednotlivé prvky a po krocích počítaný mezivýsledek. Mezi reduce a reduceRight je rozdíl v tom, ze které strany původní kolekce dochází ke kýžené redukci.

V knihovně Koazee nalezneme jen metodu Reduce:

func (s Stream) Reduce(fn interface{}) Output

Akumulátor je na začátku naplněn na nulovou hodnotu daného datového typu (a toto chování se nedá změnit). V dalším příkladu je vypočten součet všech prvků v proudu pomocí funkce add:

package main import ( "fmt" "github.com/wesovilabs/koazee" ) func add(x, y int) int { return x + y } func main() { values1 := []int{1, 2, 3, 4, 5, 6, 7, 8, 9, 10} fmt.Printf("input #1: %v

", values1) sum := koazee.StreamOf(values1).Reduce(add) fmt.Printf("sum: %d

", sum.Val()) }

Výsledky:

input #1: [1 2 3 4 5 6 7 8 9 10] sum: 55

Alternativa s anonymní funkcí:

package main import ( "fmt" "github.com/wesovilabs/koazee" ) func main() { values1 := []int{1, 2, 3, 4, 5, 6, 7, 8, 9, 10} fmt.Printf("input #1: %v

", values1) sum := koazee.StreamOf(values1).Reduce(func(x, y int) int { return x + y }) fmt.Printf("sum: %d

", sum.Val()) }

V dnešním posledním příkladu se postupně vypočítá maximální hodnota v proudu celých kladných čísel. Pro zajímavost funkce max vypisuje i své parametry:

package main import ( "fmt" "github.com/wesovilabs/koazee" ) func max(x, y int) int { fmt.Printf("%d %d

", x, y) if x > y { return x } else { return y } } func main() { values1 := []int{1, 2, 3, 4, 5, 6, 7, 8, 9, 10} fmt.Printf("input #1: %v

", values1) maxVal := koazee.StreamOf(values1).Reduce(max) fmt.Printf("max value: %d

", maxVal.Int()) }

Výsledky:

input #1: [1 2 3 4 5 6 7 8 9 10] 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 max value: 10

19. Repositář s demonstračními příklady

Zdrojové kódy všech dnes použitých demonstračních příkladů byly uloženy do Git repositáře, který je dostupný na adrese https://github.com/tisnik/go-root (stále na GitHubu :-). V případě, že nebudete chtít klonovat celý repositář (ten je ovšem – alespoň prozatím – velmi malý, dnes má přibližně dva megabajty), můžete namísto toho použít odkazy na jednotlivé příklady, které naleznete v následující tabulce:

20. Odkazy na Internetu