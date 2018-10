11. Matice jako sekvence řádků

1. Incanter: prostředí pro statistické výpočty s grafickým výstupem založené na Clojure

Na stránce www.clojure-toolbox.com, na níž se nachází nejužitečnější a samozřejmě taktéž nejpopulárnější knihovny a nástroje určené pro programovací jazyk Clojure popř. pro ClojureScript, nalezneme mj. i nástroj nazvaný Incanter. Jedná se o skupinu knihoven pro Clojure, jejichž cílem je vytvořit rychlejší a rozšiřitelnější alternativu k nástroji a programovacímu jazyku R, který se používá v oblasti statistických výpočtů, vizualizace dat apod. Základní informace o nepochybně zajímavém projektu Incanter získáte ze slajdů prezentace Data Sorcery with Clojure & Incanter. V krátkém seriálu, který dnes (tímto článkem) začíná na Rootu vycházet, se postupně seznámíme jak se základními postupy, tak i se složitějšími příklady použití Incanteru (datové zdroje, kombinované grafy apod.)

Obrázek 1: Logo projektu Incanter.

Nástroj Incanter svým uživatelům nabízí zejména tyto funkce:

Statistické funkce (nejenom ty základní, ale i poměrně pokročilé). Matematické funkce pro práci s vektory a maticemi. Podporu pro tvorbu různých typů grafů a pro vizualizaci dat. Export grafů do rastrových formátů popř. do vektorového formátu SVG. Funkce pro manipulaci s daty a s datovými zdroji (mj. i z Excelu atd.). Základní symbolické výpočty (prozatím je podporována symbolická derivace).

Poznámka: video Evolution of incanter (Gource Visualization) ukazuje postupný vývoj Incanteru, i když neobsahuje poslední změny verze, kterou si dnes popíšeme.

Obrázek 2: Snímek z videa.

2. Proč Incanter vznikl a z jakého důvodu by nás mohl zajímat?

Zajímavé a možná i poučné bude zjistit, z jakého důvodu vlastně projekt Incanter vznikl a proč by pro nás mohl být zajímavý, resp. proč použít Incanter a nikoli R, jazyk Julia či řešení založené na Pythonu). Hlavní motivací autorů tohoto projektu bylo vytvoření rozšiřitelné platformy určené pro statistické výpočty s umožněním vizualizace výsledků pomocí různých typů grafů. Tato platforma by měla uživatelům nabízet stejné či lepší vyjadřovací schopnosti než projekt R, ovšem s tím, že Incanter využije všech výhod aplikace běžící na virtuálním stroji Javy (JVM). Důvodem, proč je – minimálně slovy autorů – JVM vhodnou platformou, je mj. i to, že pro ni existuje prakticky nepřeberné množství knihoven určených pro načítání dat (použita je například knihovna xls), zpracování dat, jejich konverzi, prezentaci, přístupu k různým databázím (relační, dokumentové, objektové) atd. (ostatně přímo Incanter používá rozhraní k MongoDB pro serializaci svých datových struktur).

Obrázek 3: Incanter je alternativou ke známému nástroji R.

Nevýhodou běhu nad JVM oproti nativnímu kódu (ne oproti interpretu R!) jsou samozřejmě pomalejší výpočty, což se může negativně projevit při zpracování rozsáhlejších dat (nicméně zrovna v oblasti práce s homogenními maticemi je zpomalení přibližně „jen“ 10–20% oproti optimalizovanému Fortranu – výsledky benchmarků si uvedeme příště). Na druhou stranu je možné pro JVM použít například knihovnu Parallel Colt, která umožňuje některé výpočty provádět nativním kódem (BLAS, LAPACK, ARPACK, ATLAS atd.). Právě tato knihovna je v případě potřeby používána i systémem Incanter.

Poznámka: nutno doplnit, že dnes může být vhodnou platformou i ekosystém Pythonu, zejména při spojení možností knihoven Numpy, SciPy, Matplotlib, které lze popř. doplnit například knihovnou Pandas. Nicméně to je dosti rozsáhlé téma, které se zaslouží samostatný seriál :-), podobně jako samotný jazyk R.

Obrázek 4: V případě, že budete potřebovat použít jazyk R nad JVM, může vám pomoci projekt renjin (prozatím jsem nezkoušel, takže jen informuji o jeho existenci).

3. Nový programovací jazyk či „pouhá“ knihovna?

Po volbě platformy se autoři Incanteru zaměřili na další problém – jak vlastně uživatelům umožnit používat statistické funkce popř. funkce pro vykreslování grafů? V případě projektu R byl zvolen vlastní programovací jazyk s poměrně velkými vyjadřovacími schopnostmi, který navíc uživatele odstiňuje od nízkoúrovňových operací. V případ Incanteru je tomu jinak, protože se vlastně jedná o „pouhou“ knihovnu naprogramovanou v jazyku Clojure. Ovšem Clojure, jakožto homoikonický jazyk s podporou maker, může posloužit pro tvorbu DSL (doménově specifických jazyků), což znamená, že nad čistým Clojure si uživatelé mohou postavit další vrstvu a tu používat. Současně jim ovšem Clojure nabízí již výše zmíněnou možnost použití libovolné knihovny, která pro JVM vznikla (díky Java interop). Velká flexibilita Clojure je ostatně jedním z důvodů, proč není Incanter určen přímo pro Javu jakožto primárního jazyka pro JVM.

Obrázek 5: Incanter používá mj. i známou a užitečnou knihovnu JFreeChart.

Navíc volba lispovského jazyka, kterým Clojure i přes některé rozdíly nepochybně je, není pro oblast statistických výpočtů zcela nesmyslná, protože stále ještě existuje početná komunita používající dnes již vlastně prastarý systém Lisp-Stat (známý též jako XLispStat) popř. nástroje nad ním postavené, například program ViSTa nebo ARC. XLispStat, který měl velký vliv na celý obor vizualizací statistických dat, se používal a – což je zajímavé – stále ještě používá například v oblasti GIS, epidemiologie, astronomie atd. (to je ostatně velmi poučné – některé obory mohou být v oblasti IT resp. používaných nástrojů hodně konzervativní). A právě pro tuto komunitu může být projekt Incanter užitečný. Ostatně i samotný jazyk R byl Lispem ovlivněn, zejména ve svých počátcích.

Poznámka: pokud vás zajímají některé důvody pro použití lispovského jazyka v oblasti statistických výpočtů, přečtete si článek Back to the Future: Lisp as a Base for a Statistical Computing System (opět – jedná se o deset let starý článek, nicméně je stále validní, i když vlastně nediskutuje to hlavní – vlastní implementaci systému založeného na Lispu).

Mezi moderní přístupy k „array programming“ patří již zmíněný jazyk R, dále programovací jazyk Julia a samozřejmě též knihovna Numpy určená pro Python.

4. Instalace projektu Incanter

Na stránkách projektu Incanter nalezneme Java Archiv (jar), který obsahuje všechny potřebné knihovny a pro svou činnost vyžaduje pouze přítomnost JRE (Java Runtime Environment). Problém je, že tento archiv je založen na dnes již notně zastaralé verzi Incanteru, takže bude lepší si provést překlad a instalaci verze vlastní. Budete potřebovat Clojure (aspoň verze 1.7) a taktéž nástroj Leiningen; všechny další knihovny a nástroje se stáhnou automaticky při překladu.

Nejdříve naklonujeme celý repositář:

$ git clone https://github.com/incanter/incanter Cloning into 'incanter'... remote: Enumerating objects: 13863, done. remote: Total 13863 (delta 0), reused 0 (delta 0), pack-reused 13863 Receiving objects: 100% (13863/13863), 41.45 MiB | 4.19 MiB/s, done. Resolving deltas: 100% (8228/8228), done. Checking connectivity... done.

Přejdeme do vytvořeného podadresáře:

cd incanter/

V případě některých verzí JVM je nutné nastavit proměnnou prostředí LEIN_JVM_OPTS tak, jak je to popsáno zde. Toto nastavení zajistí, že nástroj Leiningen bude schopen stáhnout všechny potřebné balíčky:

$ export LEIN_JVM_OPTS=-Dhttps.protocols=TLSv1.2

Následuje vlastní překlad, v jehož rámci se stáhnou potřebné knihovny a uloží se do podadresáře ~/.m2:

$ lein sub install Reading project from modules/incanter-core Retrieving org/clojure/spec.alpha/0.1.143/spec.alpha-0.1.143.pom from central ... ... ... Retrieving swingrepl/swingrepl/1.3.0/swingrepl-1.3.0.jar from clojars Created /home/tester/temp/out/xxx/incanter/./target/incanter-1.9.4-SNAPSHOT.jar Wrote /home/tester/temp/out/xxx/incanter/./pom.xml Installed jar and pom into local repo.

5. První spuštění interaktivního prostředí projektu Incanter

Incanter používá, podobně jako další projekty se stejným zaměřením, vlastní interaktivní smyčku REPL. Tu spustíme přímo z adresáře, kam byl naklonován repositář projektu:

$ cd incanter/

Nyní již můžeme interaktivní smyčku REPL spustit:

$ lein repl

Měla by se vypsat klasická uvítací obrazovka REPLu jazyka Clojure:

nREPL server started on port 52443 on host 127.0.0.1 - nrepl://127.0.0.1:52443 REPL-y 0.3.5, nREPL 0.2.6 Clojure 1.8.0 OpenJDK 64-Bit Server VM 1.7.0_79-b14 Docs: (doc function-name-here) (find-doc "part-of-name-here") Source: (source function-name-here) Javadoc: (javadoc java-object-or-class-here) Exit: Control+D or (exit) or (quit) Results: Stored in vars *1, *2, *3, an exception in *e

Dále můžeme otestovat, jestli jsou na CLASSPATH umístěny všechny důležité knihovny Incanteru:

(use '(incanter core stats charts)) nil

Pokud se skutečně vypíše pouze nil, znamená to, že knihovny je možné použít. Zkusme si tedy vykreslit například histogram náhodných hodnot s normálním rozložením:

(view (histogram (sample-normal 1000)))

Obrázek 6: Histogram náhodných hodnot s normálním rozložením.

Parametry histogramu jsou samozřejmě plně konfigurovatelné. Podrobnosti si řekneme příště:

(view (histogram (sample-normal 100000) :nbins 50 :title "Normální rozložení" :legend true :y-label "Četnost"))

Obrázek 7: Upravený histogram.

6. Infixová notace v lispovském jazyku aneb síla makrosystému jazyka Clojure

Incanter je sice knihovna (resp. skupina knihoven) určená pro programovací jazyk Clojure, který je založen na lispovské syntaxi volání funkcí, ovšem díky existenci makra $= je možné výrazy zapisovat i v infixové podobě, a to včetně správného vyhodnocení priorit operátorů. Podívejme se na několik příkladů.

Základní aritmetické operátory s vyhodnocením priorit:

incanter.irepl=> ($= 1 + 2) 3 incanter.irepl=> ($= 1 + 2 * 3) 7

Poznámka: operandy musíte oddělit mezerou, jinak dojde při expanzi makra k chybě.

Operátor pro umocnění se zapisuje pomocí dvojice hvězdiček:

incanter.irepl=> ($= 2 ** 10) 1024.0 incanter.irepl=> ($= 2 ** -4)) 0.0625

Clojure se snaží při dělení celých čísel vyjádřit výsledek formou zlomku:

incanter.irepl=> ($= 10 + 20 * (4 - 5) / 6) 20/3

Zpracovat lze dokonce i vektory a matice (operátory jsou přetížené):

incanter.irepl=> ($= [1 2 3] + [4 5 6]) [5 7 9] incanter.irepl=> ($= [1 2 3] * [4 5 6]) [4 10 18] incanter.irepl=> ($= [[1 2][3 4]] + [[5 6][7 8]]) [[6 8] [10 12]]

Využití broadcastingu popsaného dále:

incanter.irepl=> ($= [1 2 3] + 10) [11 12 13] incanter.irepl=> ($= [1 2 3] * -1) [-1 -2 -3]

Výsledky jsou typu:

incanter.irepl=> (type ($= [[1 2][3 4]] + [[5 6][7 8]])) clojure.lang.PersistentVector incanter.irepl=> (type ($= [1 2 3] * -1)) clojure.lang.PersistentVector

7. Matice jakožto základní datová struktura, s níž Incanter pracuje

Projekt Incanter je založen na zpracování (rozsáhlých) matic a tzv. datasetů. Ve skutečnosti však klasicky chápané matice v Clojure příliš podporovány nejsou. Při studiu základních knihoven Clojure lze dojít k závěru, že vlastně jen velmi málo funkcí a maker je určeno pro práci s těmito datovými typy, i když je samozřejmě možné jak vektory, tak i matice velmi snadno reprezentovat s využitím základních sekvenčních datových struktur Clojure – seznamů a vektorů. Ve skutečnosti to však není zcela ideální řešení, a to hned z několika důvodů, jejichž společným rysem je rychlost prováděných operací. Z tohoto důvodu je v případě implementace algoritmů, v nichž se intenzivně používají operace s maticemi, mnohem výhodnější využít možností specializovaných knihoven. My se dnes seznámíme především s elegantně navrženou knihovnou core.matrix, protože ta je používána i projektem Incanter.

Poznámka: nesmíme taktéž zapomenout na způsob reprezentace datových struktur v operační paměti. Matice jsou většinou homogenní datovou strukturou, kterou lze v případě, že prvky jsou primitivního datového typu, uložit v kompaktní podobě. U obecných vektorů a sekvencí jazyka Clojure tomu tak však není. Problematikou uložené polí primitivních typů na haldě v JVM jsme se zabývali v článku Pohled pod kapotu JVM – jak efektivně jsou uložena pole a řetězce na haldě? (viz například šestou kapitolu).

V přednášce nazvané velmi příhodně „Enter the Matrix“, která je dostupná na adrese http://www.slideshare.net/mi­keranderson/2013–1114-enter-thematrix, je mj. ukázáno, jakým způsobem jsou v Clojure implementována různá paradigmata programování. Díky podpoře maker a způsobu zápisu programového kódu v Clojure lze velmi snadno implementovat různé doménově specifické jazyky (DSL), mj. i právě jazyk pro array programming:

Paradigma Jazyk Implementace v Clojure funkcionální Haskell clojure.core OOP Smalltalk clojure.core metaprogramování Lisp clojure.core logické Prolog core.logic array programming APL, J core.matrix

Poznámka: původní tabulka byla upravena a doplněna.

8. Základní informace o knihovně core.matrix

Knihovna nazvaná core.matrix je určená těm vývojářům, kteří ve svých projektech potřebují provádět velké množství operací s maticemi různých dimenzí, a to na poměrně vysoké úrovni, tj. bez nutnosti přesně specifikovat, jak mají být matice uloženy v paměti, jakým způsobem provádět operaci násobení matic atd. Díky tomuto přístupu a taktéž díky vlastnostem programovacího jazyka Clojure (existence tzv. threading makra a funkcí vyššího řádu) se práce s maticemi do značné míry začíná podobat práci v APL, až na ten rozdíl, že algoritmy zapisované v Clojure jsou pro většinu vývojářů přece jen čitelnější :-). Taktéž je důležité, že rozhraní definované v knihovně core.matrix může mít několik implementací. V současnosti se jedná o vectorz-clj, Clatrix a NDArray. V core.matrix navíc došlo k rozšíření operátorů +, – atd. takovým způsobem, že je lze použít i pro zpracování vektorů a matic (ve skutečnosti se samozřejmě nejedná o skutečné operátory, protože tento koncept Clojure nepotřebuje).

9. Konstruktory matic

Skutečný vektor či matice se vytvoří konstruktorem matrix. Povšimněte si, že tomuto konstruktoru můžete předat klasický vektor programovacího jazyka Clojure; samozřejmě lze předat i vektor vektorů:

incanter.irepl=> (matrix [[1 2] [4 5]]) #vectorz/matrix [[1.0,2.0], [4.0,5.0]] incanter.irepl=> (matrix [1 2 3]) #vectorz/vector [1.0,2.0,3.0]

Dalším způsobem konstrukce matice je určení hodnoty všech prvků; za touto hodnotou následuje určení rozměrů matice:

incanter.irepl=> (matrix 0 10 10) #vectorz/matrix [[0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0], [0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0], [0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0], [0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0], [0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0], [0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0], [0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0], [0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0], [0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0], [0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0]]

Povšimněte si, že i zlomky se automaticky převádí na typ float:

incanter.irepl=> (matrix 1/2 5 5) #vectorz/matrix [[0.5,0.5,0.5,0.5,0.5], [0.5,0.5,0.5,0.5,0.5], [0.5,0.5,0.5,0.5,0.5], [0.5,0.5,0.5,0.5,0.5], [0.5,0.5,0.5,0.5,0.5]]

Nejdříve se zadává počet řádků, poté počet sloupců:

incanter.irepl=> (matrix 1 3 5) #vectorz/matrix [[1.0,1.0,1.0,1.0,1.0], [1.0,1.0,1.0,1.0,1.0], [1.0,1.0,1.0,1.0,1.0]]

incanter.irepl=> (matrix 1 8 3) #vectorz/matrix [[1.0,1.0,1.0], [1.0,1.0,1.0], [1.0,1.0,1.0], [1.0,1.0,1.0], [1.0,1.0,1.0], [1.0,1.0,1.0], [1.0,1.0,1.0], [1.0,1.0,1.0]]

10. Vytvoření matice ze sekvence

Vytvoření dvourozměrné matice výčtem prvků již známe:

incanter.irepl=> (matrix [[1 2 3] [4 5 6] [7 8 9]]) #vectorz/matrix [[1.0,2.0,3.0], [4.0,5.0,6.0], [7.0,8.0,9.0]]

Alternativně je možné prvky specifikovat v jednorozměrném vektoru a pouze přidat informaci o tom, jaké má matice rozměry:

incanter.irepl=> (matrix [1 2 3 4 5 6 7 8 9] 3) #vectorz/matrix [[1.0,2.0,3.0], [4.0,5.0,6.0], [7.0,8.0,9.0]]

Přebytečné prvky, které netvoří obdélníkovou matici, se nepoužijí:

incanter.irepl=> (matrix [1 2 3 4 5 6 7 8 9] 2) #vectorz/matrix [[1.0,2.0], [3.0,4.0], [5.0,6.0], [7.0,8.0]]

Kromě vektoru je samozřejmě použít libovolnou sekvenci podporovanou programovacím jazykem Clojure, takže matici 3×3 prvky můžeme vytvořit i takto:

incanter.irepl=> (matrix (range 1 10) 3) #vectorz/matrix [[1.0,2.0,3.0], [4.0,5.0,6.0], [7.0,8.0,9.0]]

Sloupcový vektor se vytvoří stejně snadno:

incanter.irepl=> (matrix (range 1 10) 1) #vectorz/matrix [[1.0], [2.0], [3.0], [4.0], [5.0], [6.0], [7.0], [8.0], [9.0]]

Samozřejmě je možné použít i složitější zápisy – zde se žádná omezení nekladou:

incanter.irepl=> (matrix (map #(* 2 %) (take 25 (range))) 5) #vectorz/matrix [[0.0,2.0,4.0,6.0,8.0], [10.0,12.0,14.0,16.0,18.0], [20.0,22.0,24.0,26.0,28.0], [30.0,32.0,34.0,36.0,38.0], [40.0,42.0,44.0,46.0,48.0]]

Poznámka: v předchozím příkladu je použita nekonečná lazy sekvence, kterou zpracováváme a získáme prvních 25 prvků.

11. Matice jako sekvence řádků

Z pohledu jazyka Clojure lze matici zpracovávat jako sekvenci jednotlivých řádků, což je poměrně užitečná vlastnost. Nejprve si vytvořme matici o rozměrech 3×3 prvky:

incanter.irepl=> (def M (matrix (range 1 10) 3)) #'incanter.irepl/M

Kontrola obsahu matice:

incanter.irepl=> M #vectorz/matrix [[1.0,2.0,3.0], [4.0,5.0,6.0], [7.0,8.0,9.0]]

Dále můžeme získat první řádek matice, a to běžnou funkcí first:

incanter.irepl=> (first M) #vectorz/vector [1.0,2.0,3.0]

Poznámka: v tomto případě se vrátil vektor.

Získání všech řádků kromě řádku prvního:

incanter.irepl=> (rest M) (#vectorz/vector [4.0,5.0,6.0] #vectorz/vector [7.0,8.0,9.0])

rest. Poznámka: nyní se vrátila sekvence vektorů, přesně podle popisu funkce

Díky tomu, že v základní knihovně jazyka Clojure nalezneme velké množství funkcí a maker pro zpracování sekvencí, lze například snadno sečíst všechny hodnoty v jednotlivých sloupcích matice:

incanter.irepl=> (reduce plus M) #vectorz/vector [12.0,15.0,18.0]

Popř. si naopak můžeme vyčíslit součty prvků na jednotlivých řádcích:

incanter.irepl=> (map sum M) (6.0 15.0 24.0)

Poznámka: povšimněte si, že se pokaždé vrátil jiný datový typ. Z tohoto důvodu je lepší při práci s maticemi používat operace popsané níže.

Další operace (pravděpodobně ne příliš užitečné):

incanter.irepl=> (map first M) (1.0 4.0 7.0) incanter.irepl=> (map second M) (2.0 5.0 8.0)

12. Základní operace s maticemi

Podívejme se nyní na některé základní operace s maticemi. Tomuto tématu bude věnován samostatný článek, ale krátkou ukázku si můžeme předvést již dnes. Nejdříve si opět vytvoříme matici:

incanter.irepl=> (def A (matrix [[1 2 3] #_=> [4 5 6] #_=> [7 8 9]])) #'incanter.irepl/A

Broadcasting umožňuje převést číslo na matici stejného řádu, jakou má druhý operand:

incanter.irepl=> ($= A + 2) #vectorz/matrix [[3.0,4.0,5.0], [6.0,7.0,8.0], [9.0,10.0,11.0]]

Vynásobení matice konstantou (skalárem):

incanter.irepl=> ($= A * -1) #vectorz/matrix [[-1.0,-2.0,-3.0], [-4.0,-5.0,-6.0], [-7.0,-8.0,-9.0]]

Vynásobení matice a vektoru, který byl opět rozšířen na matici:

incanter.irepl=> ($= A * [5 0 5]) #vectorz/matrix [[5.0,0.0,15.0], [20.0,0.0,30.0], [35.0,0.0,45.0]]

Skutečný „maticový“ součin matice a vektoru:

incanter.irepl=> (mmult A [5 0 0]) #vectorz/vector [5.0,20.0,35.0]

Matici můžeme transponovat:

incanter.irepl=> (trans A) #vectorz/matrix [[1.0,4.0,7.0], [2.0,5.0,8.0], [3.0,6.0,9.0]]

Můžeme provést vynásobení původní matice s maticí transponovanou:

incanter.irepl=> (mmult A (trans A)) #vectorz/matrix [[14.0,32.0,50.0], [32.0,77.0,122.0], [50.0,122.0,194.0]]

Další složitější varianta:

incanter.irepl=> (mmult A (trans A) A) #vectorz/matrix [[492.0,588.0,684.0], [1194.0,1425.0,1656.0], [1896.0,2262.0,2628.0]]

13. Výpočet inverzní matice

Výpočet inverzní matice zajišťuje funkce solve:

incanter.irepl=> (solve (matrix [[2 0 0] [0 2 0] [0 0 2]])) #vectorz/matrix [[0.5,0.0,0.0], [0.0,0.5,0.0], [0.0,0.0,0.5]]

Kontrola předchozího výpočtu:

incanter.irepl=> (mmult (solve (matrix [[2 0 0] [0 2 0] [0 0 2]])) (matrix [[2 0 0] [0 2 0] [0 0 2]])) #vectorz/matrix [[1.0,0.0,0.0], [0.0,1.0,0.0], [0.0,0.0,1.0]]

nil. Poznámka: pokud inverzní matici nelze vypočítat, vrátí se

14. Symbolické výpočty

Knihovna Incanter sice v žádném případě nedokáže nahradit Mathematicu nebo Maple, ovšem obsahuje i modul pro symbolické výpočty, tj. (velmi zjednodušeně řečeno) pro úpravy výrazů a rovnic na základě manipulace se symboli a nikoli na základě numerických výpočtů. Prozatím je podporován především výpočet derivace podle zvolené proměnné. Ukažme si jednoduché příklady.

Načtení knihovny:

incanter.irepl=> (use '(incanter symbolic)) nil

Derivace funkce sinus podle proměnné x:

incanter.irepl=> (deriv (sin x) x) (cos x)

Složitější výraz s jedinou proměnnou:

incanter.irepl=> (deriv (cos (* x x)) x) (* (+ x x) (* -1 (sin (* x x))))

Další nepatrně složitější výraz:

incanter.irepl=> (deriv (+ (cos x) (tan x)) x) (+ (pow (cos x) -2) (* -1 (sin x)))

Derivace stejné funkce, ovšem pro rozdílné proměnné:

incanter.irepl=> (deriv (/ (+ (cos x) (tan y)) (ln z)) x) (+ (* (* (pow (* 1 (+ (cos x) (tan y)) (ln z))) -1) (* -1 (sin x))) (* (* -1 (deriv* (pow (* 1 (+ (cos x) (tan y)) (ln z))) x)) (+ (cos x) (tan y)))) incanter.irepl=> (deriv (/ (+ (cos x) (tan y)) (ln z)) y) (+ (* (* (pow (* 1 (+ (cos x) (tan y)) (ln z))) -1) (pow (cos y) -2)) (* (* -1 (deriv* (pow (* 1 (+ (cos x) (tan y)) (ln z))) y)) (+ (cos x) (tan y)))) incanter.irepl=> (deriv (/ (+ (cos x) (tan y)) (ln z)) z) (* (* -1 (deriv* (pow (* 1 (+ (cos x) (tan y)) (ln z))) z)) (+ (cos x) (tan y)))

15. Jednoduché grafy s průběhy funkcí

Nejjednodušším typem grafu je graf s průběhem zvolené funkce. Samotný graf se vytvoří pomocí function-plot, což je funkce vyššího řádu, které lze předat libovolnou jinou aritmetickou funkci a taktéž rozsah hodnot nezávislé proměnné. Výsledek lze zobrazit funkcí view. Nesmíte samozřejmě zapomenout na import knihovny charts:

(use '(incanter core charts)) (view (function-plot (fn [x] (sin x)) -10 10))

Obrázek 8: Graf s průběhem funkce sinus.

Osobně ovšem doporučuji jiný styl zápisu využívající threading makro:

(-> (fn [x] (sin x)) (function-plot -10 10) view)

Výsledkem bude naprosto stejný graf, jako v příkladu předchozím.

16. Zápis vzorců způsobem převzatým z LaTeXu

Jen v rychlosti (alespoň prozatím) si ukažme, jakým způsobem se do grafů přidávají vzorce zapsané a vysázené podobně, jako v LaTeXu. Používá se k tomu funkce add-latex, například:

(add-latex 0 250 "x^3 - 5x^2 + 3x +5")

Tato funkce přidá návěští přímo do grafu. Nesmíme samozřejmě zapomenout na importy:

(use '(incanter core charts latex))

Můžeme zde s výhodou použít standardní makro doto:

(doto (function-plot (fn [x] ($= x ** 3 - 5 * x ** 2 + 3 * x + 5)) -10 10) (add-latex 0 250 "x^3 - 5x^2 + 3x +5") view)

Obrázek 9: Výsledek předchozího příkazu.

17. Uložení grafů do rastrových obrázků i do vektorového výkresu

Kromě funkce view, která graf vykreslí do samostatného okna, ho můžeme uložit do rastrového souboru funkcí save. Například:

(ns png-output (:use (incanter core stats charts svg))) (save (histogram (sample-normal 1000)) "histogram1.png") (save (histogram (sample-normal 100000) :nbins 50 :title "Normální rozložení" :legend true :y-label "Četnost") "histogram2.png") (save (function-plot (fn [x] ($= x ** 3 - 5 * x ** 2 + 3 * x + 5)) -10 10) "funkce.png")

Někdy může být výhodnější použít export do vektorového formátu SVG:

(ns svg-output (:use (incanter core stats charts svg))) (save-svg (histogram (sample-normal 1000)) "histogram1.svg") (save-svg (histogram (sample-normal 100000) :nbins 50 :title "Normální rozložení" :legend true :y-label "Četnost") "histogram2.svg") (save-svg (function-plot (fn [x] ($= x ** 3 - 5 * x ** 2 + 3 * x + 5)) -10 10) "funkce.svg")

Podrobnosti si vysvětlíme příště.

18. Repositář s demonstračními příklady

Zdrojové kódy všech dnes popsaných demonstračních příkladů byly uloženy do Git repositáře dostupného na adrese https://github.com/tisnik/incanter-examples (stále na GitHubu :-). V případě, že nebudete chtít klonovat celý repositář (ten je ovšem stále velmi malý, dnes má doslova několik kilobajtů), můžete namísto toho použít odkazy na jednotlivé příklady, které naleznete v následující tabulce:

# Demonstrační příklad Popis Cesta 1 introduction.clj otestování funkčnosti Incanteru https://github.com/tisnik/incanter-examples/blob/master/incanter-1/introduction.clj 2 infix.clj použití infix operátorů https://github.com/tisnik/incanter-examples/blob/master/incanter-1/infix.clj 3 matrices.clj práce s maticemi https://github.com/tisnik/incanter-examples/blob/master/incanter-1/matrices.clj 4 png_output.clj uložení grafu do PNG https://github.com/tisnik/incanter-examples/blob/master/incanter-1/png_output.clj 5 svg_output.clj uložení grafu do SVG https://github.com/tisnik/incanter-examples/blob/master/incanter-1/svg_output.clj 6 heat_map.clj tzv.„heat mapy“ https://github.com/tisnik/incanter-examples/blob/master/incanter-1/heat_map.clj 7 parametric_plot.clj jednoduchý parametrický graf https://github.com/tisnik/incanter-examples/blob/master/incanter-1/parametric_plot.clj

