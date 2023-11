Obsah

1. Definice uživatelských datových typů v jazyku OCaml

2. Datový typ záznam (record)

3. Funkce akceptující parametr typu záznam





4. Chování algoritmu typové inference v případě dvou struktur se shodnými prvky

5. Datový typ výčet (enum)





6. Datový typ n-tice (tuple)

7. N-tice a pattern matching

8. Disjunktní sjednocení s prvky typu n-tice

9. Rekurzivní datová struktura: výraz

10. Rekurzivní generická datová struktura: strom

11. Třídy a objekty v ML jazycích

12. Deklarace třídy

13. Metoda deklarovaná ve třídě

14. Konstrukce nové instance třídy realizovaná v metodě

15. Přetížení operátoru pro instance třídy

16. Deklarace přetíženého operátoru a automatické odvození typů operandů

17. Kam dál? GADT

18. Repositář s demonstračními příklady

19. Odkazy na Internetu

1. Definice uživatelských datových typů v jazyku OCaml

Na tento týden vydaný článek o definicích uživatelských datových typů v jazyku F# dnes navážeme, protože si řekneme, jakým způsobem lze uživatelské datové typy definovat v programovacím jazyku OCaml. Uvidíme, že mezi oběma jazyky existují v této oblasti rozdíly, většinou však jen syntaktické (ovšem prozatím jsme se nevěnovali GADT, kde jsou již rozdíly dosti velké). Pro možnost rychlého vizuálního srovnání společných vlastností a rozdílů v syntaxi dnes zkusíme novinku – všechny příklady budou zapsány jak v jazyce OCaml, tak i v jazyce F# a budou zobrazeny vedle sebe, přičemž odpovídající si řádky budou skutečně zobrazeny na společném řádku (samozřejmě jen tam, kde je to možné – tedy až na poslední dva příklady).

Původní zdrojové kódy všech demonstračních příkladů tak nebude možné vykopírovat přímo z textu článku, ovšem samozřejmě jsou k dispozici zdrojové kódy všech příkladů uvedené v osmnácté kapitole.

2. Datový typ záznam (record)

Datový typ záznam (record), jenž byl z pohledu programovacího jazyka F# popsán zde, lze samozřejmě použít i v OCamlu. Mezi oběma jazyky však v této oblasti existují určité syntaktické rozdíly. Například v OCamlu jsou prvky popsány malými písmeny a jako oddělovače mezi prvky se jak v definici typu záznam, tak i při deklaraci hodnoty používají středníky. Rozdíly jsou dobře patrné při porovnání zdrojového kódu v OCamlu a F# (zobrazeno vedle sebe):

(* OCaml *) (* F# *) type user = { type User = id: int; { ID: int name: string; Name: string surname: string; Surname: string} } ;; let pepa = { let pepa = id = 42; { ID = 42 name = "Josef"; Name = "Josef" surname = "Vyskočil"} Surname = "Vyskočil"} ;; pepa;; printf "%A

" pepa

3. Funkce akceptující parametr typu záznam

Samozřejmě nám nic nebrání ve vytvoření funkce, která jako svůj parametr (či parametry) akceptuje hodnotu typu záznam, což je téma, kterému jsme se věnovali v této kapitole. Opět se podívejme na (nepatrné – syntaktické) rozdíly mezi jazyky OCaml a F# při definici a volání takové funkce:

(* OCaml *) (* F# *) type user = { type User = id: int; { ID: int name: string; Name: string surname: string; Surname: string } ;; } let print_user (u:user) = let print_user (x:User) = Printf.printf "%s %s

" u.name u.surname printf "%s %s" x.Name x.Surname ;; let pepa = { id = 42; let pepa = name = "Josef"; { ID = 42 surname = "Vyskočil"} Name = "Josef" ;; Surname = "Vyskočil"} print_user pepa;; print_user pepa

Oba programovací jazyky OCaml i F# používají velmi (podobně koncipovaný) sofistikovaný algoritmus pro typovou inferenci (type inference), který například dokáže doplnit typ parametrů do definované funkce, a to na základě jejího těla (nikoli na základě parametrů použitých při jejím volání). Opět se pouze podívejme na syntaktické rozdíly mezi oběma jazyky, protože z pohledu sémantiky jsme se tomuto tématu již věnovali:

(* OCaml *) (* F# *) type user = { type User = id: int; { ID: int name: string; Name: string surname: string; Surname: string } ;; } let print_user u = let print_user x = Printf.printf "%s %s

" u.name u.surname printf "%s %s" x.Name x.Surname ;; let pepa = { let pepa = id = 42; { ID = 42 name = "Josef"; Name = "Josef" surname = "Vyskočil"} Surname = "Vyskočil"} ;; print_user pepa;; print_user pepa

4. Chování algoritmu typové inference v případě dvou struktur se shodnými prvky

Ve čtvrté kapitole předchozího článku jsme si ukázali některá úskalí algoritmu typové inference. Ten jsme totiž „zmátli“ tím, že se ve funkci print_user pracuje jen s položkami Name a Surname, takže typová inference odvodí, že by se mohlo jednat o parametr typu UserWithoutID. Ovšem ve skutečnosti bude funkce volána s parametrem typu User, což vede k chybě při překladu. V programovacím jazyku OCaml dojde k naprosto stejné situaci (až – opět – na poněkud odlišnou syntaxi):

(* OCaml *) (* F# *) type user = { type User = id: int; { ID: int name: string; Name: string surname: string; Surname: string } ;; } type user_without_id = { type UserWithoutID = name: string; { Name: string surname: string; Surname: string } ;; let print_user u = let print_user x = Printf.printf "%s %s

" u.name u.surname printf "%s %s" x.Name x.Surname ;; let pepa = { let pepa = id = 42; { ID = 42 name = "Josef"; Name = "Josef" surname = "Vyskočil"} Surname = "Vyskočil"} ;; (* nefunkcni varianta *) (* nefunkcni varianta *) print_user pepa;; print_user pepa

Řešením je explicitní specifikace typu parametru funkce print_user. Po této úpravě je již možné oba zdrojové kódy přeložit a spustit:

(* OCaml *) (* F# *) type user = { type User = id: int; { ID: int name: string; Name: string surname: string; Surname: string } ;; } type user_without_id = { type UserWithoutID = name: string; { Name: string surname: string; Surname: string } ;; } let print_user (u:user) = let print_user (x:User) = Printf.printf "%s %s

" u.name u.surname printf "%s %s" x.Name x.Surname ;; let pepa = { let pepa = id = 42; { ID = 42 name = "Josef"; Name = "Josef" surname = "Vyskočil"} Surname = "Vyskočil"} ;; (* funkcni varianta *) (* funkcni varianta *) print_user pepa;; print_user pepa

5. Datový typ výčet (enum)

Připomeňme si, že v programovacím jazyku F# existuje datový typ výčet, v němž můžeme definovat jak prvky ve výčtu, tak i jejich hodnoty. V praxi je použití tohoto typu snadné, protože pouze postačuje specifikovat názvy a hodnoty jednotlivých prvků uložených ve výčtu. Hodnoty se získají snadno – opět se použije tečková notace, tedy podobně, jako je tomu u výše uvedených záznamů:

type Day = Po=1 | Ut=2 | St=3 | Ct=4 | Pa=5 | So=6 | Ne=7 let x = Day.St printf "%A

" x

Zápis je možné provést i odlišným způsobem (který je sice delší, zato přehlednější):

type Day = | Po=1 | Ut=2 | St=3 | Ct=4 | Pa=5 | So=6 | Ne=7 let x = Day.St printf "%A

" x

Tento datový typ v přesné podobě v OCamlu sice nenajdeme, ovšem kromě toho existuje i typ disjunktní sjednocení (discriminated union). V té nejjednodušší podobě může být tento typ definován pouhým výčtem možností a zde již v OCamlu najdeme stejný typ:

(* OCaml *) (* F# *) type day = Po | Ut | St | Ct | Pa | So | Ne;; type Day = Po | Ut | St | Ct | Pa | So | Ne let x = St;; let x = St x;; printf "%A

" x

Popř.:

(* OCaml *) (* F# *) type day = type Day = | Po | Po | Ut | Ut | St | St | Ct | Ct | Pa | Pa | So | So | Ne;; | Ne let x = St;; let x = St x;; printf "%A

" x

Opět se tedy jedná o nepatrnou změnu syntaxe, nikoli sémantiky.

6. Datový typ n-tice (tuple)

Datový typ n-tice byl z pohledu programovacího jazyka F# popsán minule v sedmé kapitole. V jazyku OCaml se používá naprosto stejná deklarace a i samotné hodnoty typu n-tice lze zpracovávat zcela stejným způsobem, včetně destructuringu (není divu, jedná se o dědictví ze společného prapředka – jazyka ML):

(* OCaml *) (* F# *) type rectangle = int * int;; type Rectangle = int * int let print_rectange r = let print_rectange r = let (width, height) = r in let (width, height) = r in Printf.printf "rect: %dx%d

" width height printf "rect: %dx%d

" width height ;; let r1 = (10, 20);; let r1 = (10, 20) print_rectange r1;; print_rectange r1

Poznámka: pro oba popisované jazyky je typické, že konstruktor je zapisován stejně jako výraz s „rozpadem“ n-tice na jednotlivé prvky.

7. N-tice a pattern matching

Při čtení prvků z n-tice se často setkáme s využitím pattern matchingu, který v tomto případě může mít jen jedinou větev. Podívejme se na následující příklad, v němž z n-tice obsahující šířku a výšku obdélníku získáme obě délky v samostatných lokálních proměnných width a height. Samozřejmě opět porovnáme variantu napsanou v OCamlu s variantou naprogramovanou v jazyku F#:

(* OCaml *) (* F# *) type rectangle = int * int;; type Rectangle = int * int let print_rectange (r:rectangle) = let print_rectange (r : Rectangle) = match r with match r with | (width, height) -> Printf.printf "rect: %dx%d

" width height | (width, height) -> printf "rect: %dx%d

" width height ;; let r1 = (10, 20);; let r1 = (10, 20) print_rectange r1;; print_rectange r1

Mnohdy se taktéž setkáme s následujícím zápisem, který nás již připravuje na seznámení se s dalšími možnostmi zápisu disjunktního sjednocení (discriminated union):

(* OCaml *) (* F# *) type rectangle = R of int * int;; type Rectangle = R of int * int let print_rectange (r : rectangle) = let print_rectange (r : Rectangle) = match r with match r with | R(width, height) -> Printf.printf "rect: %dx%d

" width height | R(width, height) -> printf "rect: %dx%d

" width height ;; let r1 = R(10, 20);; let r1 = R(10, 20) print_rectange r1;; print_rectange r1

Shodné pojmenování typu a prvku sjednocení v jazyce F# většinou v OCaml nevyužijeme:

(* OCaml *) (* F# *) type rectangle = Rectangle of int * int;; type Rectangle = Rectangle of int * int let print_rectange (r:rectangle) = let print_rectange (r : Rectangle) = match r with match r with | Rectangle(width, height) -> Printf.printf "rect: %dx%d

" width height | Rectangle(width, height) -> printf "rect: %dx%d

" width height ;; let r1 = Rectangle(10, 20);; let r1 = Rectangle(10, 20) print_rectange r1;; print_rectange r1

8. Disjunktní sjednocení s prvky typu n-tice

Minule jsme si taktéž ukázali velmi důležitý rys ML jazyků – možnost definovat typ reprezentující několik různých hodnot, které samy o sobě nejsou stejného typu. Příkladem je typ nazvaný Shape, který ve skutečnosti znamená, že buď pracujeme s hodnotou typu Rectangle nebo hodnotou typu Circle. Použijeme zde disjunktní sjednocení, které se v obou jazycích, tj. jak v OCamlu, tak i v jazyku F#, zapisuje prakticky totožným způsobem:

(* OCaml *) (* F# *) type shape = Rectangle of int * int | Circle of int;; type Shape = Rectangle of int * int | Circle of int let print_shape (s : shape) = let print_shape (s : Shape) = match s with match s with | Circle r -> Printf.printf "circle: %d

" r | Circle r -> printf "circle: %d

" r | Rectangle (width, height) -> Printf.printf "rect: %dx%d

" width height | Rectangle (width, height) -> printf "rect: %dx%d

" width height ;; let r1 = Rectangle (10, 20);; let r1 = Rectangle (10, 20) let c = Circle 100;; let c = Circle 100 print_shape r1;; print_shape r1 print_shape c;; print_shape c

V praxi se velmi často setkáme s tím, že deklarace typu Shape/shape se zapisuje na více řádcích, aby tak po vizuální stránce odpovídala blokům match, v nichž s hodnotami tohoto typu pracujeme (každý konkrétní typ pak začíná řádkem začínajícím znakem |):

(* OCaml *) (* F# *) type shape = type Shape = | Rectangle of int * int | Circle of int | Circle of int;; | Rectangle of int * int let print_shape (s : shape) = let print_shape (s : Shape) = match s with match s with | Circle r -> Printf.printf "circle: %d

" r | Circle r -> printf "circle: %d

" r | Rectangle (width, height) -> Printf.printf "rect: %dx%d

" width height | Rectangle (width, height) -> printf "rect: %dx%d

" width height ;; let r1 = Rectangle (10, 20);; let r1 = Rectangle (10, 20) let c = Circle 100;; let c = Circle 100 print_shape r1;; print_shape r1 print_shape c;; print_shape c

9. Rekurzivní datová struktura: výraz

Disjunktní sjednocení zkombinované s n-ticemi ve skutečnosti představuje velmi silný rys programovacích jazyků F# i OCaml. Tento rys je navíc umocněn tím, že je možné definovat i rekurzivní datový typ, kdy jedna z položek sjednocení je typem obsahujícím samotné sjednocení. Příkladem je reprezentace výrazu (expression); ostatně právě OCaml se často používá při implementaci překladačů, kde se s podobnými objekty můžeme velmi často setkat. Zápis takového rekurzivního typu je v obou jazycích prakticky totožný:

(* OCaml *) (* F# *) type expr = type expr = | Plus of expr * expr (* a + b *) | Plus of expr * expr (* a + b *) | Minus of expr * expr (* a - b *) | Minus of expr * expr (* a - b *) | Times of expr * expr (* a * b *) | Times of expr * expr (* a * b *) | Divide of expr * expr (* a / b *) | Divide of expr * expr (* a / b *) | Var of string | Var of string ;; let x = Times (Var "n", Plus (Var "x", Var "y"));; let x = Times (Var "n", Plus (Var "x", Var "y")) x;; printf "%A

" x

10. Rekurzivní generická datová struktura: strom

Možnosti typového systému jazyků OCaml a F# jdou ve skutečnosti ještě dále, protože můžeme vytvořit generický rekurzivní datový typ. Tentokrát se bude jednat o datový typ představující strom (přesněji řečeno binární strom), což je pochopitelně rekurzivní datová struktura. Povšimněte si, že existují dva typy prvků (uzlů). Prázdný (koncový uzel) nebo uzel představovaný n-ticí obsahující levý podstrom, hodnotu uloženou v uzlu a pravý podstrom (samozřejmě, že podstromy mohou být prázdné, takže se může jednat o list stromu). V jazyku OCaml se v tomto případě používá poněkud odlišný zápis – podle mého skromného názoru čitelnější, než v případě F#, ovšem F# je v tomto ohledu poplatný jazykům odvozeným od C++ či Javy:

(* OCaml *) (* F# *) type 'a tree = type Tree<'a> = | E | E | T of 'a tree * 'a * 'a tree | T of Tree<'a> * 'a * Tree<'a> ;; let t1 = T(E, "foo", E);; let t1 = T(E, "foo", E) let t2 = T(T(E, "foo", E), "bar", T(E, "baz", E));; let t2 = T(T(E, "foo", E), "bar", T(E, "baz", E)) t1;; printf "%A

" t1 t2;; printf "%A

" t2

11. Třídy a objekty v ML jazycích

Písmeno „O“ v názvu jazyka OCaml znamená „objective“, což nám prozrazuje, že tento programovací jazyk nabízí programátorům možnost práce s objekty (jejichž typem je třída). Zatímco v OCamlu se jednalo o více či méně užitečnou „úlitbu“ dobovým požadavkům, je podpora objektově orientovaného programování v jazyku F# prakticky nutností, protože programy psané v tomto jazyku musí spolupracovat s dalšími jazyky v ekosystému .NET. Z tohoto důvodu si v dalších kapitolách připomeneme základy OOP v jazyku F# i to, jak se podobné koncepty realizují v jazyku OCaml (jenž je starší a nebyl navržen tak, aby se podobal například C++).

12. Deklarace třídy

Podívejme se nyní na deklaraci jednoduché třídy Rectangle, jejíž instance budou mít dva atributy nazvané X a Y (rozměry v jednotlivých osách) a s konstruktorem, který akceptuje dva parametry typu int (výchozí hodnoty rozměrů). Zde se již syntaxe obou jazyků poměrně významně odlišuje:

(* OCaml *) (* F# *) class rectangle (x:int) (y:int) = type Rectangle(x: int, y: int) = object (self) member this.X = x val x = x member this.Y = y val y = y end;; let r1 = new rectangle 10 20;; let r1 = Rectangle(10, 20) r1;; printf "%A

" r1

Poznámka: v tomto případě je zápis v programovacím jazyku F# řešen poměrně elegantnějším způsobem – typ „třída“ je na stejné úrovni, jako jakýkoli jiný typ.

13. Metoda deklarovaná ve třídě

Do deklarace třídy můžeme přidat i metody. Například se může jednat o metodu nazvanou Print (v OCamlu print), která vytiskne jak název objektu, tak i jeho atributy. Zde již narazíme na dnes možná poněkud zvláštní způsob zápisu volání metody v OCamlu, kdy se namísto tečkové notace používá křížek (ale samozřejmě je snadné si na to zvyknout):

(* OCaml *) (* F# *) class rectangle (x:int) (y:int) = type Rectangle(x: int, y: int) = object (self) member this.X = x val x = x member this.Y = y val y = y member this.Print() = method print = Printf.printf "Rectangle: %dx%d

" x y printf "Rectangle: %dx%d

" x y end;; let r1 = new rectangle 10 20;; let r1 = Rectangle(10, 20) r1#print;; r1.Print()

14. Konstrukce nové instance třídy realizovaná v metodě

Ve shodně očíslované čtrnácté kapitole jsme si minule řekli, že se relativně často setkáme s tím, že nějaká metoda má změnit stav objektu, tj. vlastně hodnoty jeho atributů. To lze samozřejmě zařídit tak, že se příslušné atributy deklarují takovým způsobem, aby byly měnitelné. Ovšem mnohdy je výhodnější použít odlišný přístup – taková metoda bude vracet nový objekt, ovšem již se změněným stavem. Příkladem může být požadavek na změnu velikosti obdélníka, tedy získání obdélníka, jehož rozměry na x-ové a y-ové ose budou zvětšeny nebo zmenšeny o nějaké hodnoty dx a dy. Pro tento účel lze deklarovat metodu Enlarge, která vrací novou instanci Rectangle (ale stávající instanci nijak nemění).

Realizace v obou porovnávaných jazycích by mohla vypadat následovně:

(* OCaml *) (* F# *) class rectangle (x:int) (y:int) = type Rectangle(x: int, y: int) = object (self) member this.X = x val x = x member this.Y = y val y = y member this.Print() = method print = Printf.printf "Rectangle: %dx%d

" x y printf "Rectangle: %dx%d

" this.X this.Y method enlarge (xd:int) (yd:int) = new rectangle (x+xd) (y+yd) member this.Enlarge(dx, dy) = end;; Rectangle(this.X + dx, this.Y + dy) let r1 = new rectangle 10 20;; let r1 = Rectangle(10, 20) let r2 = r1#enlarge 1 2;; let r2 = r1.Enlarge(1, 2) r1#print;; r1.Print() r2#print;; r2.Print()

15. Přetížení operátoru pro instance třídy

V dnešním posledním demonstračním příkladu, v němž budeme porovnávat sémantické a syntaktické shody a rozdíly mezi programovacími jazyky OCaml a F#, si ukážeme definici přetíženého operátoru pro instance třídy Vector, resp. vector. V případě jazyka OCaml je tento operátor přetížen na úrovni modulu, zatímco v jazyku F# můžeme operátor definovat jako statickou metodu třídy Vector. Výsledek ovšem bude stejný – možnost sčítat vektory tak, jak je to běžné v matematice, tedy s využitím k tomu určeného (přetíženého) operátoru +:

(* OCaml *) (* F# *) class vector (x:int) (y:int) = type Vector(x: int, y: int) = object (self) member this.X = x val x = x member this.Y = y val y = y member this.Print() = method print = Printf.printf "Vector: %dx%d

" x y printf "Vector: %dx%d

" this.X this.Y method get_x = x method get_y = y end;; let(+) (a: vector) (b: vector) = static member (+) (a : Vector, b : Vector) = new vector (a#get_x+b#get_x) (a#get_y+b#get_y);; Vector(a.X + b.X, a.Y + b.Y) let v1 = new vector 10 20;; let v1 = Vector(10, 20) v1#print;; v1.Print() let v2 = new vector 1 2;; let v2 = Vector(1, 2) v2#print;; v2.Print() let v3 = v1 + v2;; let v3 = v1 + v2 v3#print;; v3.Print()

Poznámka: původní funkcionalita operátoru + však nebude v případě jazyka OCaml zachována! Použijte raději jiný operátor:

let(+@) (a: vector) (b: vector) = new vector (a#get_x+b#get_x) (a#get_y+b#get_y);;

Poznámka: zde můžeme vidět nejenom syntaktický rozdíl, ale i rozdíl v sémantice.

16. Deklarace přetíženého operátoru a automatické odvození typů operandů

Díky algoritmu typové inference je možné vynechat explicitní určení typů parametrů pro nově definovaný (či přetížený) operátor. Výsledkem bude kratší programový kód, který však od programátora již vyžaduje znalost kontextu:

class vector x y = object (self) val x = x val y = y method print = Printf.printf "Vector: %dx%d

" x y method get_x = x method get_y = y end;; let(+?) a b = new vector (a#get_x+b#get_x) (a#get_y+b#get_y);; let v1 = new vector 10 20;; v1#print;; let v2 = new vector 1 2;; v2#print;; let v3 = v1 +? v2;; v3#print;;

17. Kam dál? GADT

Až doposud bylo patrné, že jazyky F# a OCaml mají prakticky totožnou sémantiku a většinou i velmi podobnou syntaxi. Ovšem právě v oblasti typových systémů se začínají oba jazyky postupně rozcházet. Je tomu tak především proto, že v OCamlu lze od verze 4.00 používat takzvaný GADT neboli Generalized algebraic data type. Jedná se o velmi zajímavý a užitečný koncept, kterému se budeme věnovat v samostatném článku (resp. s velkou pravděpodobností ve dvou článcích). Ovšem stále nám zbývá popis společných vlastností obou jazyků. Například jsme se doposud nezabývali všemi řídicími konstrukcemi jazyků F# a OCaml atd.

18. Repositář s demonstračními příklady

Všechny výše popsané demonstrační příklady byly uloženy do repositáře dostupného na adrese https://github.com/tisnik/ocaml-examples/. V tabulce umístěné pod tímto odstavcem jsou uvedeny odkazy na tyto příklady:

19. Odkazy na Internetu