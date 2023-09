Obsah

1. Práce se seznamy v jazyce F#

Ve čtvrté části seriálu o programovacím jazyce F# se budeme zabývat zdánlivě triviálním tématem. Popíšeme si totiž způsoby práce s datovým typem seznam (list). Ve skutečnosti se však v programovacích jazycích odvozených od původního jazyka ML jedná o velmi flexibilní datový typ, pro jehož zpracování (a to včetně pattern matchingu) navíc existují speciální syntaktické prvky.

Seznamy (lists) jsou vedle záznamů (record) nejdůležitějším složeným datovým typem programovacího jazyka F#. Jedná se o homogenní datový typ, což znamená, že všechny prvky seznamů musí být stejného typu, což je kontrolováno překladačem (příkladem heterogenních složených typů je právě záznam nebo n-tice).

2. Konstruktor seznamů

Pokud je zřejmé, jaké prvky mají být v seznamu uloženy, lze pro konstrukci seznamů použít následující zápis, v němž jsou prvky umístěny do hranatých závorek a pro jejich vzájemné oddělení se používá středník (nikoli čárka!). Zápis tříprvkového seznamu s prvky typu celé číslo tedy může vypadat následovně:

let x = [1; 2; 3] printf "%A" x

Seznam, který tímto zápisem vznikne, má typ int list:

val x : int list = [1; 2; 3]

Pochopitelně můžeme vytvořit i seznam s prvky jiného typu:

let x = ["foo"; "bar"; "baz"] printf "%A" x

Výsledek:

val x : string list = ["foo"; "bar"; "baz"]

Prvky seznamů mohou být i záznamy, n-tice či další seznamy. Podívejme se na příklad s n-ticemi:

let x = [(1, 2); (2, 3); (3, 4)] printf "%A" x

Překladač v tomto případě opět kontroluje typ, a to rekurzivně (tedy všechny n-tice musí mít pouze dva prvky typu celé číslo):

val x : (int * int) list = [(1, 2); (2, 3); (3, 4)]

Pokus o vytvoření heterogenního seznamu skončí s chybou detekovanou již překladačem:

let x = [1; "foo"; 3] printf "%A" x

Chybová zpráva:

All elements of a list must be of the same type as the first element, which here is 'int'. This element has type 'string'.

přičemž druhý prvek tohoto seznamu je podtržen, takže je zřejmé, na kterém místě chyba vznikla.

3. Prázdný seznam

Víme již, že speciálním případem n-tice je n-tice bez prvků (unit), která se zapisuje takto:

()

I u seznamů se jedná o speciální případ, o čemž se můžeme velmi snadno přesvědčit po konstrukci prázdného seznamu (tedy uvnitř složených závorek nejsou zapsány žádné prvky):

let x = []

Poznámka: v OCamlu se prázdný seznam nazývá „nil“.

Povšimněte si, jakého typu je tento seznam:

val x : 'a list = []

Poznámka: o speciální případ se zde jedná z toho důvodu, že programovací jazyk F# nedokáže z prázdného seznamu odvodit typ prvků. V mnoha programových konstrukcích tak musí předpokládat, že se může jednat o libovolný seznam, čehož lze někdy využít. Na druhou stranu ovšem můžeme z „typovaného“ seznamu získat prázdný „typovaný“ seznam – postačuje například získat ocas z jednoprvkového seznamu s prvky typu celé číslo. Výsledkem bude prázdný seznam celých čísel.

Poznámka: prázdný seznam se v mnoha ohledech liší od typu unit!

4. Využití operátoru range při konstrukci seznamu

Pro konstrukci seznamů lze využít i operátor range zapisovaný pomocí dvou teček. Seznam s deseti (ne devíti!) prvky 1 až 10 vytvoříme takto:

let x = [1..10] printf "%A" x

Výsledek:

[1; 2; 3; 4; 5; 6; 7; 8; 9; 10]

Určit lze i krok, který se zapisuje na druhou pozici (což může být matoucí; v jiných jazycích se krok a mez přehazují):

let y = [1..2..10] printf "%A" y

Výsledkem budou v tomto případě pouze liché prvky mezi 1 a 10 (včetně):

[1; 3; 5; 7; 9]

Krok může být i záporný. Opět si to otestujme:

let x = [10..-1..0] printf "%A" x

Výsledkem nyní bude jedenáct prvků (včetně nuly):

[10; 9; 8; 7; 6; 5; 4; 3; 2; 1; 0]

A konečně kombinace záporného kroku, který se navíc liší od jedničky:

let y = [10..-2..0] printf "%A" y

Výsledek:

[10; 8; 6; 4; 2; 0]

5. Rekurzivní definice seznamu a operátor ::

Sémantika seznamů je do značné míry převzata z LISPu, ovšem syntaxe práce s nimi je do značné míry odlišná. Seznam může být v tomto kontextu definován rekurzivně:

buď je seznam prázdný (což se zapisuje, jak již víme, prázdnými hranatými závorkami [])

nebo má formu hlava::ocas, kde hlava je prvním prvkem seznamu a ocas tvoří zbytek prvků seznamu (opět jde o seznam). Operátor :: se nazývá cons.

To ovšem například znamená, že seznam [42] je shodný se seznamem 42::[]. To si ostatně můžeme snadno otestovat:

let x = [42] printf "%A" x let y = 42::[] printf "%A" y

Výsledky:

[42] [42]

Pokusme se podobným způsobem realizovat seznam se třemi prvky:

let x = ["foo"; "bar"; "baz"] printf "%A" x let y = "foo"::"bar"::"baz"::[] printf "%A" y

Výsledky:

[foo; bar; baz] [foo; bar; baz]

Z tohoto demonstračního příkladu si můžeme odvodit dvě vlastnosti programovacího jazyka F#:

Operátor :: je vyhodnocován zprava doleva Zápis seznamu stylem [prvek1;prvek2;prvek3;…] je ve skutečnosti jen syntaktických cukrem k zápisu prvek1::prvek2::prvek3…::[]

Poznámka: prázdný seznam (nebo jakýkoli jiný seznam) je na konci výrazu s operátorem :: nutností. Nelze tedy zapsat jen 1::2, to není z pohledu jazyka F# úplný výraz.

6. Spojení seznamů operátorem @

Kromě operátoru :: využijeme při práci se seznamy další speciální operátor zapisovaný znakem @. Tento operátor slouží pro spojení dvou seznamů (stejného typu!). Podívejme se na příklad použití:

let x = [1; 2; 3] let y = [1..10] let z = x @ y printf "%A" z

Výsledkem bude tento seznam:

[1; 2; 3; 1; 2; 3; 4; 5; 6; 7; 8; 9; 10]

Poznámka: operátor lze opět řetězit, což ale není nic překvapivého.

Typ spojovaných seznamů si hlídá překladač:

let x = [1; 2; 3] let y = ["foo"; "bar"; "baz"] let z = x @ y printf "%A" z

Zde pochopitelně bude nalezena chyba:

Type mismatch. Expecting a 'int list' but given a 'string list' The type 'int' does not match the type 'string'

7. Původní základní funkce pro práci se seznamy

V programovacím jazyku ML, z něhož jazyk F# vychází, bylo definováno několik základních funkcí určených pro práci se seznamy. Pro zajímavost si tyto funkce vypišme:

Funkce Stručný popis null(x) test na prázdný seznam length(x) délka seznamu hd(x) první prvek seznamu tl(x) ocas seznamu (bez prvního prvku) nth(x) n-tý prvek seznamu

Následuje příklad použití funkce null a tl pro rekurzivní výpočet délky seznamu v jazyce ML (SML):

(* Naivní implementace funkce length *) fun len(x) = if null(x) then 0 else 1 + len(tl(x)); len([1,2,3,4]);

8. Nová alternativa k původním funkcím: vlastnosti (properties) seznamů

V jazyce F# výše uvedené funkce nenalezneme. Namísto toho se totiž používají takzvané vlastnosti (properties), které se zapisují s využitím tečkové notace. Všech pět výše uvedených funkcí má svoji obdobu, i když s poněkud odlišnými jmény (používají se celá slova, mj. i proto, že o jejich doplnění se pokouší integrované vývojové prostředí):

Vlastnost Stručný popis list.IsEmpty test na prázdný seznam list.Length délka seznamu list.Head první prvek seznamu list.Tail ocas seznamu (bez prvního prvku) list.Item n n-tý prvek seznamu

Podívejme se nyní na základní způsob použití těchto vlastností – budeme zjišťovat informace o seznamu z:

let x = [1; 2; 3] let y = [1..10] let z = x @ y printf "list: %A" z printf "empty?: %b" z.IsEmpty printf "length: %d" z.Length printf "head: %A" z.Head printf "tail: %A" z.Tail printf "item 3: %A" (z.Item 3)

Výsledky budou vypadat následovně:

list: [1; 2; 3; 1; 2; 3; 4; 5; 6; 7; 8; 9; 10] empty?: false length: 13 head: 1 tail: [2; 3; 1; 2; 3; 4; 5; 6; 7; 8; 9; 10] item 3: 1

Reimplementace funkce len z předchozí kapitoly může vypadat následovně:

(* Naivní implementace funkce length *) let rec len (x:'a list) = if x.IsEmpty then 0 else 1 + (len x.Tail) printf "%d" (len [1;2;3;4])

Poznámka: povšimněte si, že se v žádném případě nejedná o příliš elegantní zápis (navíc je vyžadováno explicitní určení typu parametru, na což nejsme v jazyce F# zvyklí). Ovšem dále si uvedeme mnohem idiomatičtější způsob zápisu podobné funkce.

9. Seznamy a pattern matching

Operátor ::, o němž jsme se zmínili v předchozích kapitolách, lze využít i při zápisu vzoru (pattern) v bloku match. To tedy znamená, že můžeme zapsat test, zda seznam obsahuje na začátku nějaký prvek, jakou hodnotu má tento prvek atd. Jedná se o velmi silný koncept, která nám umožňuje elegantní realizaci mnoha funkcí, které musí zpracovat prvky seznamu. Většina těchto funkcí zpracovává seznam sekvenčně, tedy nejdříve zpracuje jeho první prvek (hlavu) a poté rekurzivně zbytek seznamu (ocas). Některé ukázky budou uvedeny v navazujících kapitolách.

10. Idiomatický způsob zápisu rekurzivního výpočtu délky seznamu

V osmé kapitole jsme si ukázali rekurzivní zápis funkce pro výpočet délky seznamu. Tuto funkci můžeme velmi snadno přepsat do podoby, v níž se použije pattern matching. Upravený tvar může vypadat následovně a velmi přesně odpovídá teoretickému zápisu algoritmu:

(* Méně naivní implementace funkce length *) let rec len x = match x with | [] -> 0 | head :: tail -> 1 + len tail printf "%d" (len [1;2;3;4])

Povšimněte si, že ve větvi začínající vzorkem head :: tail se ve skutečnosti nikde nepracuje s hodnotou prvního prvku seznamu (head). Proto můžeme tento identifikátor nahradit za podtržítko. Výsledkem bude naprosto stejná realizace algoritmu, ovšem bez přebytečných identifikátorů:

(* Méně naivní implementace funkce length *) let rec len x = match x with | [] -> 0 | _ :: tail -> 1 + len tail printf "%d" (len [1;2;3;4])

11. Záleží na pořadí větví v bloku match?

V mnoha programovacích jazycích se používá nějaká obdoba konstrukce switch-case, v níž se nějaká hodnota postupně porovnává se vzorky v jednotlivých větvích (a většinou jsou možnosti zápisu vzorků dosti omezené). Mohlo by se tedy zdát, že i v jazyku F# musíme nejdříve otestovat, zda není zpracovávaný seznam prázdný a teprve poté řešit možnost, že seznam obsahuje hlavu (tedy skutečný prvek) a ocas (ten už může být prázdný). Ovšem ve skutečnosti tomu tak přesně není, o čemž se lze velmi snadno přesvědčit, protože i následující příklad je plně funkční, i když mu předáme (přímo či nepřímo) prázdný seznam. Nedojde tedy k pádu ani k vyhození výjimky:

(* Méně naivní implementace funkce length *) let rec len x = match x with | head :: tail -> 1 + len tail | [] -> 0 printf "%d" (len [1;2;3;4])

Naproti tomu na pořadí větví záleží – zkuste si prohodit předposlední a poslední větev a zjistit, jaké řetězce se vypíšou:

let rec foo x = match x with | [] -> "nil" | [x] -> "one item" | head :: tail -> "more items" printf "%s" (foo []) printf "%s" (foo [1]) printf "%s" (foo [1; 2])

Poznámka: navíc dokáže překladač zjistit, zda se v bloku match skutečně testují všechny možnosti, které mohou nastat. Pokud se netestují, překladač vypíše varování.

12. Rekurzivní zápis funkce append pro spojení dvou seznamů

Podobně si můžeme nadefinovat funkci append, která vrací nový seznam vzniklý spojením dvou seznamů x a y. Tedy například:

append([1, 2], [3, 4, 5]) [1, 2, 3, 4, 5]

Na problém implementace této funkce můžeme použít princip postupného zjednodušování problému. Známe totiž dva invarianty:

append([],z) == z append(a :: y, z) == a :: append(y,z)

Postupně tedy budeme zkracovat první seznam až dojdeme do situace, kdy je tento seznam prázdný. Přímo z těchto podmínek je možné odvodit implementaci funkce append:

(* Naivní implementace funkce append *) let rec append (x: 'a list) y = if x.IsEmpty then y else x.Head :: (append x.Tail y) printf "%A" (append [] [1; 2; 3]) printf "%A" (append [1; 2; 3] []) printf "%A" (append [1; 2; 3] [4; 5]) printf "%A" (append [] [])

Poznámka: navíc se nám automaticky splnily všechny okrajové podmínky, tedy konkrétně situace, kdy je jeden ze seznamů prázdný.

Při zavolání:

append([1,2], [3,4,5])

dojde k postupnému vykonání fáze navíjení a odvíjení, což si můžeme naznačit graficky:

1 :: append([2], [3,4,5]) 1 :: 2 :: append([], [3,4,5]) 1 :: 2 :: [3,4,5] 1 :: [2,3,4,5] [1,2,3,4,5]

Důležitý je i typ nové funkce:

val append = fn: ∀ 'a . 'a list * 'a list → 'a list;

Tento zápis nám říká, že funkce bude akceptovat dva seznamy typu „any“ a výsledkem bude další seznam typu „any“. Typ prvků seznamů sice není explicitně určen, ovšem je zaručeno, že oba dva vstupní seznamy budou mít stejný typ prvků, jako seznam výsledný.

13. Implementace funkce append založená na pattern matchingu

V praxi se vždy při zápisu algoritmů, v nichž se vyskytuje plná podoba rozeskoku if-then-else, vyplatí popřemýšlet, zda nebude výhodnější použít pattern matching. U funkce append tomu tak skutečně je, protože její varianta s pattern matchingem je mnohem čitelnější. Je v ní patrné, jak postupně přesunujeme prvky z prvního seznamu do vznikajícího seznamu výsledného (a nakonec připojíme celý druhý seznam):

(* Implementace funkce append založená na pattern matchingu *) let rec append x y = match x with | [] -> y | head :: tail -> head :: append tail y printf "%A" (append [] [1; 2; 3]) printf "%A" (append [1; 2; 3] []) printf "%A" (append [1; 2; 3] [4; 5]) printf "%A" (append [] [])

14. Součet hodnot všech prvků uložených v seznamu

Mnoho operací nad seznamy je založeno na postupném zpracování prvků seznamu, konkrétně od prvku prvního (hlavy). To většinou vede k velmi podobnému zápisu algoritmů, zejména při použití pattern matchingu. Ostatně si můžeme ukázat realizaci dalšího algoritmu, tentokrát algoritmu pro součet všech prvků v seznamu. Řešení bude opět rekurzivní a vzorky použité v bloku match jsou totožné se vzorky z předchozích demonstračních příkladů, což je ovšem logické, protože opět potřebujeme vyřešit dva případy – prázdný seznam a seznam s minimálně jedním prvkem:

let rec sum x = match x with | [] -> 0 | head :: tail -> head + sum tail printf "%d" (sum []) printf "%d" (sum [1; 2; 3])

15. Využití tail rekurze při součtu všech prvků v seznamu

Přímá rekurze, která není v tail pozici a kterou jsme použili při realizaci algoritmu pro součet prvků v seznamu, není v praxi příliš efektivní. Proto se můžeme pokusit o její nahrazení variantou s tail pozicí, což opět (prakticky nutně) vede k použití akumulátoru a vnitřní pomocné funkce, která je založena na tail rekurzi a kterou voláme s předáním akumulované hodnoty. Povšimněte si, že tato funkce (sumr) má dva parametry – seznam a hodnotu akumulátoru a skutečně volá sebe samu v tail pozici (tedy výsledek volané funkce je současně i výsledkem funkce aktuálně prováděné):

let sum x = let rec sumr x a = match x with | [] -> a | head :: tail -> sumr tail (a + head) sumr x 0 printf "%d" (sum []) printf "%d" (sum [1; 2; 3])

Poznámka: počáteční hodnota akumulátoru je pochopitelně v tomto konkrétním případě nulová.

16. Test, zda jsou všechny prvky seznamu kladnými čísly

V posledním demonstračním příkladu, který si dnes ukážeme, je implementován algoritmus, který zjistí, jestli seznam obsahuje pouze kladná čísla. Pro prázdný seznam byla zvolena výsledná hodnota false, ale to je diskutabilní – můžete si zde dosadit true podle způsobu použití. Povšimněte si, že zde (nově) řešíme případ seznamu s jediným prvkem. Poslední větev v bloku match je již klasická – pokud je první prvek kladný, zjistíme výsledek pro zbytek seznamu a použijeme logický součin:

let rec all_pos x = match x with | [] -> false | [x] -> x > 0 | head :: tail -> head > 0 && all_pos tail printf "%b" (all_pos []) printf "%b" (all_pos [1; 2; 3]) printf "%b" (all_pos [-1; 2; 3]) printf "%b" (all_pos [1; 2; -3])

Alternativně můžeme použít vzorek s podmínkou zapsanou ve when. Zjistíme tak kladnost prvku v jednoprvkovém seznamu. Druhá větev (bez when) se v takovém případě nepoužije – záleží zde na pořadí jednotlivých větví:

let rec all_pos x = match x with | [] -> false | [x] when x > 0 -> true | [x] -> false | head :: tail -> head > 0 && all_pos tail printf "%b" (all_pos []) printf "%b" (all_pos [1; 2; 3]) printf "%b" (all_pos [-1; 2; 3]) printf "%b" (all_pos [1; 2; -3])

To, že záleží na pořadí větví, si můžete otestovat na příkladu, v němž se můžete pokusit prohodit druhou a třetí větev:

let rec last_pos x = match x with | [] -> "nil" | [x] -> "x<=0" | [x] when x > 0 -> "x>0" | head :: tail -> last_pos tail printf "%s" (all_pos []) printf "%s" (all_pos [1; 2; 3]) printf "%s" (all_pos [-1; 2; 3]) printf "%s" (all_pos [1; 2; -3])

17. Obsah navazujícího článku

V navazující části článku o programovacím jazyku F# si popíšeme způsoby práce s dalšími velmi užitečnými datovými typy. V první řadě se jedná o typ Option a typ Result, což jsou v podstatě monády (nelekněte se) použité resp. přesněji řečeno převzaté do programovacího jazyka Rust. A taktéž si popíšeme způsob práce s poli (Array).

18. Repositář s demonstračními příklady

Všechny výše popsané demonstrační příklady byly uloženy do repositáře dostupného na adrese https://github.com/tisnik/f-sharp-examples/. V tabulce umístěné pod tímto odstavcem jsou uvedeny odkazy na tyto příklady:

