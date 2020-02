11. Vylepšení předchozích příkladů

12. Serializace jedné struktury jak do JSONu, tak i do XML – problematika anotačních řetězců

13. Binární formáty a programovací jazyk Go

14. Formát gob

15. Serializace datové struktury do formátu gob

16. Formát CBOR (Concise Binary Object Representation)

17. Serializace dat do formátu BSON

18. Deserializace dat z formátu BSON

19. Repositář s demonstračními příklady

20. Odkazy na Internetu

1. Serializace a deserializace datových struktur v programovacím jazyce Go

V dnešní části seriálu o programovacím jazyku Go se zaměříme na popis způsobů použití různých formátů určených pro serializaci a deserializaci dat s jejich případným přenosem do jiné aplikace či služby (přenosem se myslí jak lokální komunikace, tak i přenos do služby běžící na jiném počítači). Již dříve jsme se ve stručnosti seznámili s využitím formátu JSON a nepřímo taktéž s formátem TOML používaným typicky pro konfigurační soubory (a mnohem méně často pro rozsáhlejší data). V případě JSONu se jedná o poměrně důležitý formát, protože JSON (a samozřejmě též XML) se v současnosti používá v mnoha webových službách a i když stále vznikají a jsou postupně adaptovány další formáty, ať již textové (YAML, edn) či binární (BSON, B-JSON, Smile, Protocol-Buffers), CBOR atd., je velmi pravděpodobné, že se JSON bude i nadále poměrně masivně využívat. Nicméně pochopitelně existují situace, v nichž je vhodné textový a relativně neúsporný JSON nahradit právě nějakým binárním formátem.

Některé metody serializace a deserializace datových struktur jsou implementovány přímo ve standardních knihovnách programovacího jazyka Go; další metody (resp. přesněji řečeno formáty) však již vyžadují instalaci zvláštní knihovny, popř. vlastní implementaci daného formátu. Nejdříve se zaměříme na ty formáty, které jsou podporovány bez nutnosti instalace dalších balíčků a posléze si ukážeme i některé přídavné balíčky pro ty nejzajímavější popř. nejpoužívanější formáty.

2. Rozhraní s předpisem metod pro serializaci a deserializaci dat

Základní rozhraní pro serializaci a deserializaci datových struktur jsou definována ve standardním balíčku encoding, jehož dokumentaci je možné nalézt na adrese https://golang.org/pkg/encoding/. Každé z rozhraní předepisuje – jak je ostatně v jazyce Go zvykem – pouze jednu metodu. Jakýkoli objekt, který je schopen své serializace či deserializace může tyto metody obsahovat:

# Rozhraní Signatura metody 1 TextMarshaler MarshalText() (text []byte, err error) 2 TextUnmarshaler UnmarshalText(text []byte) error 3 BinaryMarshaler MarshalBinary() (data []byte, err error) 4 BinaryUnmarshaler UnmarshalBinary(data []byte) error

Typické je, že při serializaci (marshalingu) je výsledkem řez bajtů a nikoli řetězec (ve smyslu jazyka Go). Podobně při deserialiaci (umarshalingu) je zdrojem dat parametr typu řez bajtů. Díky tomu jsme odstíněni od problematiky kódování znaků ve „skutečných“ textových řetězcích.

Poznámka: připomeňme si, že v jazyce Go není zapotřebí rozhraní explicitně implementovat (implement) tak, jak je tomu například v Javě. Plně postačuje, aby nějaký datový typ obsahoval příslušnou metodu. Potom říkáme, že tento typ rozhraní vyhovuje (satisfy).

3. Krátké zopakování – práce s formátem JSON

Před popisem dalších metod serializace a deserializace datových struktur si krátce zopakujme, jakým způsobem je ve standardní knihovně programovacího jazyka Go podporován formát JSON. Tento formát je dnes široce rozšířen a používá se jak pro ukládání konfigurací, specifikaci schématu v OpenAPI (vedle YAMLu), uložení konfigurace dashboardu v Grafaně atd., tak – a to možná především – ve webových službách a aplikacích pro přenos strukturovaných dat. Jedná se o formát, jehož syntaxe a sémantika je odvozená od JavaScriptu, s čímž je nutné počítat, protože ne všechny knihovny například umožňují, aby se v klíčích objevovaly pomlčky či jiné „podivné“ znaky, i když to teoreticky formát JSON umožňuje.

Podívejme se na příklad služby vracející dokument reprezentovaný ve formátu JSON (tuto službu můžete použít pro testování apod.):

$ curl http://httpbin.org/json { "slideshow": { "author": "Yours Truly", "date": "date of publication", "slides": [ { "title": "Wake up to WonderWidgets!", "type": "all" }, { "items": [ "Why <em>WonderWidgets</em> are great", "Who <em>buys</em> WonderWidgets" ], "title": "Overview", "type": "all" } ], "title": "Sample Slide Show" } }

Formát JSON umožňuje uložení a tím pádem i přenos jediné (nijak nepojmenované) hodnoty. Podporovány jsou přitom hodnoty, které můžeme zařadit do šesti kategorií (viz též příslušná část graficky vyjádřené syntaxe formátu JSON):

# Hodnota Stručný popis 1 string řetězec (s plnou podporou Unicode) 2 number celé číslo, popř. hodnota typu double 3 object ve skutečnosti se jedná o asociativní pole (mapu), viz poznámka v úvodní kapitole 4 array pole, ovšem v JSONu nemusí mít všechny prvky pole stejný typ 5 true, false pravdivostní hodnota 6 null prázdná hodnota

Poznámka: díky tomu, že onou jedinou hodnotou může být pole či objekt, lze ve skutečnosti pracovat i s rozsáhlými a složitě strukturovanými daty.

Pro převod libovolného typu (přesněji řečeno hodnoty libovolného typu) do JSONu se používá funkce nazvaná Marshal, kterou nalezneme v balíčku encoding/json:

func Marshal(v interface{}) ([]byte, error)

Povšimněte si, že tato funkce skutečně akceptuje hodnotu libovolného typu, protože prázdné rozhraní implementuje (zcela automaticky!) každý datový typ (s tímto zajímavým konceptem „univerzálního datového typu“ se ještě několikrát setkáme, zejména v rozhraních mezi Go a dalšími systémy). Návratovou hodnotou je sekvence bajtů (nikoli řetězec!) a popř. i struktura reprezentující chybový stav, pokud k chybě skutečně došlo. V opačném případě se ve druhé návratové hodnotě funkce Marshal vrací nil, jak jsme ostatně zvyklí ze všech podobně koncipovaných funkcí.

V typických zdrojových kódech se tedy setkáme s tímto idiomatickým zápisem:

json_bytes, err := json.Marshal(a) if err != nil { log.Fatal(err) } ... ... ...

4. Některá úskalí převodu hodnot do formátu JSON

V některých případech, například při přenosu výsledků z různých simulací, měření, výpočtů apod. je nutné pracovat s celočíselnými hodnotami, popř. s hodnotami s plovoucí řádovou čárkou. A právě zde můžeme narazit na různá úskalí, které se týkají speciálních hodnot typu +Inf, -Inf (kladné a záporné nekonečno) a pochopitelně taktéž NaN (výsledkem nějaké operace není skutečné číslo, výsledek nelze vyjádřit atd.). Nejprve se podívejme na serializaci běžných hodnot s plovoucí řádovou čárkou. Podporován by měl být rozsah i přesnost odpovídající typu double, resp. v programovacím jazyku Go typu float64:

package main import ( "encoding/json" "fmt" ) func main() { var a float64 = 0.0 var b float64 = 1e10 var c float64 = 1e100 var d float64 = 2.3e-50 var jsonOutput []byte jsonOutput, _ = json.Marshal(a) fmt.Println(string(jsonOutput)) jsonOutput, _ = json.Marshal(b) fmt.Println(string(jsonOutput)) jsonOutput, _ = json.Marshal(c) fmt.Println(string(jsonOutput)) jsonOutput, _ = json.Marshal(d) fmt.Println(string(jsonOutput)) }

V tomto případě nedochází k chybám (ostatně chybové hodnoty zcela ignorujeme) a serializace do JSONu vypadá následovně:

0 10000000000 1e+100 2.3e-50

Ovšem u výše uvedených speciálních hodnot dochází k problémům, což je zmíněno například na Stack Overflow. Můžeme se o tom přesvědčit nepatrnou úpravou předchozího příkladu:

package main import ( "encoding/json" "fmt" "math" ) func main() { var a float64 = -0.0 var b float64 = math.NaN() var c float64 = -math.NaN() var d float64 = math.Inf(1) var e float64 = math.Inf(-1) var jsonOutput []byte jsonOutput, _ = json.Marshal(a) fmt.Println(string(jsonOutput)) jsonOutput, _ = json.Marshal(b) fmt.Println(string(jsonOutput)) jsonOutput, _ = json.Marshal(c) fmt.Println(string(jsonOutput)) jsonOutput, _ = json.Marshal(d) fmt.Println(string(jsonOutput)) jsonOutput, _ = json.Marshal(e) fmt.Println(string(jsonOutput)) }

Tentokrát se zdá, že serializace do formátu JSON vrátila pouze prázdné řetězce:

0

Ovšem skutečnost je jiná, protože balíček encoding/json hlídá, které hodnoty lze převést a které nikoli. Musíme ovšem naši aplikaci naprogramovat korektně, tj. v tomto konkrétním případě reagovat na všechny chybové stavy:

package main import ( "encoding/json" "fmt" "math" ) func main() { var a float64 = -0.0 var b float64 = math.NaN() var c float64 = -math.NaN() var d float64 = math.Inf(1) var e float64 = math.Inf(-1) var jsonOutput []byte var err error jsonOutput, err = json.Marshal(a) fmt.Println(err, string(jsonOutput)) jsonOutput, err = json.Marshal(b) fmt.Println(err, string(jsonOutput)) jsonOutput, err = json.Marshal(c) fmt.Println(err, string(jsonOutput)) jsonOutput, err = json.Marshal(d) fmt.Println(err, string(jsonOutput)) jsonOutput, err = json.Marshal(e) fmt.Println(err, string(jsonOutput)) }

Nyní již bude po spuštění příkladu patrné, že došlo k chybám při serializaci speciálních hodnot:

0 json: unsupported value: NaN json: unsupported value: NaN json: unsupported value: +Inf json: unsupported value: -Inf

Ještě si ukažme, jakým způsobem je možné do JSONu uložit pole s prvky různých typů, včetně dvojrozměrných polí (což v JSONu není nic jiného, než pole polí):

package main import ( "encoding/json" "fmt" ) func main() { var a1 [10]byte var a2 [10]int32 a3 := [10]int32{1, 10, 2, 9, 3, 8, 4, 7, 5, 6} a4 := []string{"www", "root", "cz"} a5 := []interface{}{1, "root", 3.1415, true, []int{1, 2, 3, 4}} matice := [4][3]float32{ {1, 2, 3}, {4, 5, 6}, {7, 8, 9}, {0, -1, 0}, } a1_json, _ := json.Marshal(a1) fmt.Println(string(a1_json)) a2_json, _ := json.Marshal(a2) fmt.Println(string(a2_json)) a3_json, _ := json.Marshal(a3) fmt.Println(string(a3_json)) a4_json, _ := json.Marshal(a4) fmt.Println(string(a4_json)) a5_json, _ := json.Marshal(a5) fmt.Println(string(a5_json)) matice_json, _ := json.Marshal(matice) fmt.Println(string(matice_json)) }

Výsledky budou vypadat následovně:

[0,0,0,0,0,0,0,0,0,0] [0,0,0,0,0,0,0,0,0,0] [1,10,2,9,3,8,4,7,5,6] ["www","root","cz"] [1,"root",3.1415,true,[1,2,3,4]] [[1,2,3],[4,5,6],[7,8,9],[0,-1,0]]

a5, protože tato datová struktura může obsahovat libovolnou hodnotu programovacího jazyka Go, a to z toho důvodu, že prázdné rozhraní (bez signatur metod) je implementováno jakýmkoli datovým typem. Poznámka: zajímavé je především pole (resp. přesněji řečeno řez s pohledem na pole), protože tato datová struktura může obsahovat libovolnou hodnotu programovacího jazyka Go, a to z toho důvodu, že prázdné rozhraní (bez signatur metod) je implementováno jakýmkoli datovým typem.

5. Serializace dat do formátu XML

Ve druhé části článku si ukážeme způsoby serializace dat (tedy prakticky libovolné datové struktury) do formátu XML. Zcela nejjednodušší demonstrační příklad, v němž se pokusíme serializovat hodnoty typu User1 a User2, bude vypadat následovně:

package main import ( "encoding/xml" "fmt" ) type User1 struct { id uint32 name string surname string } type User2 struct { Id uint32 Name string Surname string } func main() { user1 := User1{ 1, "Pepek", "Vyskoč"} user2 := User2{ 1, "Pepek", "Vyskoč"} user1asXML, _ := xml.Marshal(user1) fmt.Println(string(user1asXML)) fmt.Println() user2asXML, _ := xml.Marshal(user2) fmt.Println(string(user2asXML)) }

Podívejme se nyní na výsledek běhu tohoto příkladu:

<User1></User1> <User2><Id>1</Id><Name>Pepek</Name><Surname>Vyskoč</Surname></User2>

Poznámka: povšimněte si, že první XML obsahuje pouze prázdný kořenový uzel, což je možná na první pohled podivné, neboť datová struktura evidentně obsahuje trojici prvků. Ovšem jména těchto prvků začínají malými písmeny a proto jsou považována za lokální.

Podobně jako při exportu do JSONu lze i při exportu do formátu XML specifikovat jména uzlů (v JSONu jména atributů, tedy klíče). Slouží k tomu speciálně naformátované řetězce přidané k jednotlivým prvkům a začínající prefixem „xml:“. Celý příklad si tedy nepatrně upravíme následujícím způsobem:

package main import ( "encoding/xml" "fmt" ) type User1 struct { id uint32 `xml:"id"` name string `xml:"user_name"` surname string `xml:"surname"` } type User2 struct { Id uint32 `xml:"id"` Name string `xml:"user_name"` Surname string `xml:"surname"` } func main() { user1 := User1{ 1, "Pepek", "Vyskoč"} user2 := User2{ 1, "Pepek", "Vyskoč"} user1asXML, _ := xml.Marshal(user1) fmt.Println(string(user1asXML)) fmt.Println() user2asXML, _ := xml.Marshal(user2) fmt.Println(string(user2asXML)) }

Výsledek běhu takto upraveného příkladu:

<User1></User1> <User2><id>1</id><user_name>Pepek</user_name><surname>Vyskoč</surname></User2>

6. Specifikace jména kořenového uzlu, konfigurace odsazení při formátování XML

Na rozdíl od formátu JSON, v němž neexistuje koncept kořenového uzlu (přenáší se jen hodnota jediného objektu, nikoli i jeho název), je v XML použit právě kořenový uzel. V předchozích příkladech bylo jméno tohoto uzlu odvozeno od jména serializované datové struktury (User1 nebo User2), což ovšem nemusí být ve všech případech vyhovující. Ovšem relativně snadno je možné tento nedostatek napravit, a to následujícím způsobem – použitím nového prvku typu xml.Name se specifikovaným jménem. Upravený a vylepšený demonstrační příklad vypadá následovně:

package main import ( "encoding/xml" "fmt" ) type User1 struct { XMLName xml.Name `xml:"user"` id uint32 `xml:"id"` name string `xml:"user_name"` surname string `xml:"surname"` } type User2 struct { XMLName xml.Name `xml:"user"` Id uint32 `xml:"id"` Name string `xml:"user_name"` Surname string `xml:"surname"` } func main() { user1 := User1{ id: 1, name: "Pepek", surname: "Vyskoč"} user2 := User2{ Id: 1, Name: "Pepek", Surname: "Vyskoč"} user1asXML, _ := xml.Marshal(user1) fmt.Println(string(user1asXML)) fmt.Println() user2asXML, _ := xml.Marshal(user2) fmt.Println(string(user2asXML)) }

Tento příklad si samozřejmě spustíme. Z výsledku je patrné, že se skutečně změnilo i jméno kořenového uzlu:

<user></user> <user><id>1</id><user_name>Pepek</user_name><surname>Vyskoč</surname></user>

V některých případech je požadováno, aby výsledné XML bylo korektně naformátováno, což se hodí zejména při práci s relativně krátkými konfiguračními soubory atd. Naformátování výsledného XML zajišťuje metoda nazvaná MarshalIndent, které se navíc předá prefix všech řádků (může se jednat o prázdný řetězec) a libovolná sekvence znaků použitá při odsazování vnořených uzlů. Zde můžeme použít například čtyři mezery, znak Tab atd.:

package main import ( "encoding/xml" "fmt" ) type User1 struct { XMLName xml.Name `xml:"user"` id uint32 `xml:"id"` name string `xml:"user_name"` surname string `xml:"surname"` } type User2 struct { XMLName xml.Name `xml:"user"` Id uint32 `xml:"id"` Name string `xml:"user_name"` Surname string `xml:"surname"` } func main() { user1 := User1{ id: 1, name: "Pepek", surname: "Vyskoč"} user2 := User2{ Id: 1, Name: "Pepek", Surname: "Vyskoč"} user1asXML, _ := xml.MarshalIndent(user1, "", " ") fmt.Println(string(user1asXML)) fmt.Println() user2asXML, _ := xml.MarshalIndent(user2, "", " ") fmt.Println(string(user2asXML)) fmt.Println() user2asXML, _ = xml.MarshalIndent(user2, "", "\t") fmt.Println(string(user2asXML)) fmt.Println() user2asXML, _ = xml.MarshalIndent(user2, "\t", "\t") fmt.Println(string(user2asXML)) }

Zde nás bude zajímat vygenerovaný výsledek, který má tvar:

<user></user> <user> <id>1</id> <user_name>Pepek</user_name> <surname>Vyskoč</surname> </user> <user> <id>1</id> <user_name>Pepek</user_name> <surname>Vyskoč</surname> </user> <user> <id>1</id> <user_name>Pepek</user_name> <surname>Vyskoč</surname> </user>

Poznámka: povšimněte si vlivu prefixu v posledním případě. Tento trik lze použít při ručním spojování více XML pod jeden kořenový uzel.

7. Struktura XML odlišná od struktury původních serializovaných dat

Při serializaci datových struktur do formátu XML je možné zvolit odlišnou strukturu výsledného souboru. Pokud například namísto následující struktury:

<user> <id>1</id> <user_name>Pepek</user_name> <surname>Vyskoč</surname> </user>

Budeme požadovat, aby výsledný soubor XML vypadal odlišně – jméno a příjmení má být ve zvláštním poduzlu:

<user> <id>1</id> <name> <first>Pepek</first> <last>Vyskoč</last> </name> </user>

Tohoto chování lze docílit odlišnou specifikací dekorátoru, který je zapsaný za každou datovou položkou, která má být serializována:

type User2 struct { XMLName xml.Name `xml:"user"` Id uint32 `xml:"id"` Name string `xml:"name>first"` Surname string `xml:"name>last"` }

Poznámka: povšimněte si způsobu zápisu – určujeme nový uzel „name“, v němž se mají vytvořit poduzly „first“ a „last“.

Upravený zdrojový kód tohoto demonstračního příkladu vypadá takto:

package main import ( "encoding/xml" "fmt" ) type User1 struct { XMLName xml.Name `xml:"user"` id uint32 `xml:"id"` name string `xml:"name>first"` surname string `xml:"name>last"` } type User2 struct { XMLName xml.Name `xml:"user"` Id uint32 `xml:"id"` Name string `xml:"name>first"` Surname string `xml:"name>last"` } func main() { user1 := User1{ id: 1, name: "Pepek", surname: "Vyskoč"} user2 := User2{ Id: 1, Name: "Pepek", Surname: "Vyskoč"} user1asXML, _ := xml.MarshalIndent(user1, "", " ") fmt.Println(string(user1asXML)) fmt.Println() user2asXML, _ := xml.MarshalIndent(user2, "", " ") fmt.Println(string(user2asXML)) fmt.Println() user2asXML, _ = xml.MarshalIndent(user2, "", "\t") fmt.Println(string(user2asXML)) fmt.Println() user2asXML, _ = xml.MarshalIndent(user2, "\t", "\t") fmt.Println(string(user2asXML)) }

Výsledek běhu příkladu (všechny varianty formátování):

<user></user> <user> <id>1</id> <name> <first>Pepek</first> <last>Vyskoč</last> </name> </user> <user> <id>1</id> <name> <first>Pepek</first> <last>Vyskoč</last> </name> </user> <user> <id>1</id> <name> <first>Pepek</first> <last>Vyskoč</last> </name> </user>

Pochopitelně je možné určit, které hodnoty mají být uloženy ve formě pojmenovaných atributů. Podívejme se na následující demonstrační příklad:

package main import ( "encoding/xml" "fmt" ) type User1 struct { XMLName xml.Name `xml:"user"` id uint32 `xml:"id,attr"` name string `xml:"name&first,attr"` surname string `xml:"name&last,attr"` } type User2 struct { XMLName xml.Name `xml:"user"` Id uint32 `xml:"id,attr"` Name string `xml:"name&first"` Surname string `xml:"name&last"` } func main() { user1 := User1{ id: 1, name: "Pepek", surname: "Vyskoč"} user2 := User2{ Id: 1, Name: "Pepek", Surname: "Vyskoč"} user1asXML, _ := xml.MarshalIndent(user1, "", " ") fmt.Println(string(user1asXML)) fmt.Println() user2asXML, _ := xml.MarshalIndent(user2, "", " ") fmt.Println(string(user2asXML)) fmt.Println() user2asXML, _ = xml.MarshalIndent(user2, "", "\t") fmt.Println(string(user2asXML)) fmt.Println() user2asXML, _ = xml.MarshalIndent(user2, "\t", "\t") fmt.Println(string(user2asXML)) }

Výsledek:

<user></user> <user id="1"> <name> <first>Pepek</first> <last>Vyskoč</last> </name> </user> <user id="1"> <name> <first>Pepek</first> <last>Vyskoč</last> </name> </user> <user id="1"> <name> <first>Pepek</first> <last>Vyskoč</last> </name> </user>

8. Serializace polí, speciální hodnoty, ukazatele apod.

Pro úplnost se ještě podívejme na způsob serializace polí. Následující demonstrační příklad vypadá podobně, jako již výše uvedený příklad na serializaci do formátu JSON, pouze se provede uložení do souboru ve formátu XML:

package main import ( "encoding/xml" "fmt" ) func main() { var a1 [10]byte var a2 [10]int32 a3 := [10]int32{1, 10, 2, 9, 3, 8, 4, 7, 5, 6} a4 := []string{"www", "root", "cz"} a5 := []interface{}{1, "root", 3.1415, true, []int{1, 2, 3, 4}} matice := [4][3]float32{ {1, 2, 3}, {4, 5, 6}, {7, 8, 9}, {0, -1, 0}, } a1asXML, _ := xml.Marshal(a1) fmt.Println(string(a1asXML)) a2asXML, _ := xml.Marshal(a2) fmt.Println(string(a2asXML)) a3asXML, _ := xml.Marshal(a3) fmt.Println(string(a3asXML)) a4asXML, _ := xml.Marshal(a4) fmt.Println(string(a4asXML)) a5asXML, _ := xml.Marshal(a5) fmt.Println(string(a5asXML)) maticeasXML, _ := xml.Marshal(matice) fmt.Println(string(maticeasXML)) }

U polí jsme nijak nespecifikovali jména prvků, takže výsledné XML použije jména použitých datových typů (což je většinou v praxi zcela nepoužitelné):

<int32>0</int32><int32>0</int32><int32>0</int32><int32>0</int32><int32>0</int32><int32>0</int32><int32>0</int32><int32>0</int32><int32>0</int32><int32>0</int32> <int32>1</int32><int32>10</int32><int32>2</int32><int32>9</int32><int32>3</int32><int32>8</int32><int32>4</int32><int32>7</int32><int32>5</int32><int32>6</int32> <string>www</string><string>root</string><string>cz</string> <int>1</int><string>root</string><float64>3.1415</float64><bool>true</bool><int>1</int><int>2</int><int>3</int><int>4</int> <float32>1</float32><float32>2</float32><float32>3</float32><float32>4</float32><float32>5</float32><float32>6</float32><float32>7</float32><float32>8</float32><float32>9</float32><float32>0</float32><float32>-1</float32><float32>0</float32>

Dále se pokusme zjistit, zda a jak vůbec je možné do XML serializovat speciální numerické hodnoty, s nimiž jsme se již seznámili v souvislosti s formátem JSON, tedy nekonečna a NaN. Kromě toho nás bude zajímat práce s ukazateli, protože právě přes ukazatele lze tvořit složitější datové struktury. Příklad nepatrně upravíme takovým způsobem, aby obsahoval lineárně vázaný seznam prvků typu Foobar:

package main import ( "encoding/xml" "fmt" "math" ) type Foobar struct { XMLName xml.Name `xml:"foobar"` Id uint32 `xml:"id"` X float64 `xml:"x"` Y float64 `xml:"y"` Z float64 `xml:"z"` Next *Foobar `xml:"foobar"` } func main() { f := Foobar{ Id: 42, X: math.NaN(), Y: math.Inf(1), Z: math.Inf(-1), Next: nil} g := Foobar{ Id: 43, X: math.NaN(), Y: math.Inf(1), Z: math.Inf(-1), Next: &f} asXML, err := xml.MarshalIndent(g, "", " ") if err != nil { fmt.Println(err) } else { fmt.Println(string(asXML)) } }

Z výstupu – serializované struktury g – je patrné, že z lineárně vázaného seznamu vznikla dvojice vnořených uzlů, což je ostatně jeden z nejlepších způsobů vizualizace této datové struktury. Dále můžeme vidět, že speciální numerické hodnoty jsou skutečně podporovány (záleží jen na kódu pro deserializaci, jak je zpracuje):

<foobar> <id>43</id> <x>NaN</x> <y>+Inf</y> <z>-Inf</z> <foobar> <id>42</id> <x>NaN</x> <y>+Inf</y> <z>-Inf</z> </foobar> </foobar>

9. Serializace sekvence struktur

Velmi často se setkáme s požadavkem na serializaci sekvence nějaké datové struktury. Představme si například seznam uživatelů. Přímé uložení pole je problematické, protože výsledek není validním XML:

package main import ( "encoding/xml" "fmt" ) type User struct { XMLName xml.Name `xml:"user"` Id uint32 `xml:"id"` Name string `xml:"user_name"` Surname string `xml:"surname"` } func main() { var users = [3]User{ User{ Id: 1, Name: "Pepek", Surname: "Vyskoč"}, User{ Id: 2, Name: "Pepek", Surname: "Vyskoč"}, User{ Id: 3, Name: "Josef", Surname: "Vyskočil"}, } usersAsXML, _ := xml.MarshalIndent(users, "", " ") fmt.Println(string(usersAsXML)) }

S výsledkem:

<user> <id>1</id> <user_name>Pepek</user_name> <surname>Vyskoč</surname> </user> <user> <id>2</id> <user_name>Pepek</user_name> <surname>Vyskoč</surname> </user> <user> <id>3</id> <user_name>Josef</user_name> <surname>Vyskočil</surname> </user>

10. Obalení sekvence struktur dalším datovým typem

V takovém případě bývá nejjednodušší obalit celou strukturu jinou strukturou, která bude obsahovat pouze specifikaci kořenového uzlu a vlastní sekvenci. Zde je navíc kořenový uzel pojmenován:

type Users struct { XMLName xml.Name `xml:"users"` List []User }

Úplný kód příkladu, v němž serializujeme několik uživatelů do formátu XML, vypadá následovně:

package main import ( "encoding/xml" "fmt" ) type User struct { Id uint32 `xml:"id"` Name string `xml:"user_name"` Surname string `xml:"surname"` } type Users struct { XMLName xml.Name `xml:"users"` List []User } func main() { var users Users = Users{ List: []User{ User{ Id: 1, Name: "Pepek", Surname: "Vyskoč"}, User{ Id: 2, Name: "Pepek", Surname: "Vyskoč"}, User{ Id: 3, Name: "Josef", Surname: "Vyskočil"}, }, } usersAsXML, _ := xml.MarshalIndent(users, "", " ") fmt.Println(string(usersAsXML)) }

Výsledek je již mnohem lepší:

<users> <List> <id>1</id> <user_name>Pepek</user_name> <surname>Vyskoč</surname> </List> <List> <id>2</id> <user_name>Pepek</user_name> <surname>Vyskoč</surname> </List> <List> <id>3</id> <user_name>Josef</user_name> <surname>Vyskočil</surname> </List> </users>

11. Vylepšení předchozích příkladů

Specifikaci jména opakujícího se uzlu (User) lze pochopitelně k této datové struktuře přidat:

type User struct { XMLName xml.Name `xml:"user"` Id uint32 `xml:"id"` Name string `xml:"user_name"` Surname string `xml:"surname"` }

Potom se kořenový uzel nezmění:

type Users struct { XMLName xml.Name `xml:"users"` List []User }

Můžeme ovšem postupovat i opačně a ponechat původní strukturu User bez uvedení jména uzlu:

type User struct { Id uint32 `xml:"id"` Name string `xml:"user_name"` Surname string `xml:"surname"` }

V tomto případě je vhodnější jméno poduzlů specifikovat v datové struktuře představující kořenový uzel:

type Users struct { XMLName xml.Name `xml:"users"` List []User `xml:"user"` }

Jen pro úplnost si obě varianty ukažme na úplném zdrojovém kódu.

První varianta:

package main import ( "encoding/xml" "fmt" ) type User struct { XMLName xml.Name `xml:"user"` Id uint32 `xml:"id"` Name string `xml:"user_name"` Surname string `xml:"surname"` } type Users struct { XMLName xml.Name `xml:"users"` List []User } func main() { var users Users = Users{ List: []User{ User{ Id: 1, Name: "Pepek", Surname: "Vyskoč"}, User{ Id: 2, Name: "Pepek", Surname: "Vyskoč"}, User{ Id: 3, Name: "Josef", Surname: "Vyskočil"}, }, } usersAsXML, _ := xml.MarshalIndent(users, "", " ") fmt.Println(string(usersAsXML)) }

Druhá varianta:

package main import ( "encoding/xml" "fmt" ) type User struct { Id uint32 `xml:"id"` Name string `xml:"user_name"` Surname string `xml:"surname"` } type Users struct { XMLName xml.Name `xml:"users"` List []User `xml:"user"` } func main() { var users Users = Users{ List: []User{ User{ Id: 1, Name: "Pepek", Surname: "Vyskoč"}, User{ Id: 2, Name: "Pepek", Surname: "Vyskoč"}, User{ Id: 3, Name: "Josef", Surname: "Vyskočil"}, }, } usersAsXML, _ := xml.MarshalIndent(users, "", " ") fmt.Println(string(usersAsXML)) }

12. Serializace jedné struktury jak do JSONu, tak i do XML – problematika anotačních řetězců

Z předchozího textu již víme, jak lze specifikovat formát uložení nějaké datové struktury do formátu JSON i do formátu XML. Ovšem v některých případech je vyžadováno, aby se stejná struktura serializovala i deserializovala do obou těchto formátů. I takového chování je pochopitelně možné docílit, a to navíc poměrně jednoduše – pouze se v anotačním řetězci specifikuje název uzlu v XML a současně i jméno atributu ve formátu JSON:

type User struct { XMLName xml.Name `xml:"user" json:"-"` Id uint32 `xml:"id" json:"user_id"` Name string `xml:"name>first" json:"user_name"` Surname string `xml:"name>last" json:"surname"` }

Úplný zdrojový kód takto upraveného demonstračního příkladu může vypadat následovně:

package main import ( "encoding/json" "encoding/xml" "fmt" ) type User struct { XMLName xml.Name `xml:"user" json:"-"` Id uint32 `xml:"id" json:"user_id"` Name string `xml:"name>first" json:"user_name"` Surname string `xml:"name>last" json:"surname"` } func main() { user := User{ Id: 1, Name: "Pepek", Surname: "Vyskoč"} userAsXML, _ := xml.MarshalIndent(user, "", " ") fmt.Println(string(userAsXML)) fmt.Println() userAsJSON, _ := json.Marshal(user) fmt.Println(string(userAsJSON)) }

Výsledky jsou očekávané:

<user> <id>1</id> <name> <first>Pepek</first> <last>Vyskoč</last> </name> </user> {"user_id":1,"user_name":"Pepek","surname":"Vyskoč"}

13. Binární formáty a programovací jazyk Go

I přesto, že se s výše uvedenými formáty JSON a XML setkáme prakticky ve všech oblastech moderního IT, nemusí se vždy jednat o nejlepší možné řešení problému přenosu strukturovaných dat. Tyto formáty totiž data neukládají v kompaktní binární podobě a navíc je parsing numerických hodnot relativně zdlouhavý, což se projevuje zejména tehdy, pokud je nutné zpracovat skutečně obrovské množství dat (buď mnoho malých zpráv či událostí, nebo naopak rozsáhlé datové soubory). A právě v těchto situacích může být výhodnější sáhnout po nějakém vhodném binárním formátu. Těch již dnes existuje velké množství, od staršího a dosti těžkopádného ASN.1 (Abstract Syntax Notation One) po formáty, které se snaží napodobit některé vlastnosti JSONu. Příkladem může být formát CBOR, jenž je podporován knihovnou https://github.com/fxamacker/cbor, popř. formát BSON, pro který pochopitelně taktéž existuje varianta pro Go. A konečně, ve světě Go se setkáme i s formátem nazvaným gob (Go Objects).

Poznámka: dnes se seznámíme pouze se základním použitím výše zmíněných binárních formátů, podrobnější popis i mnoho dalších demonstračních příkladů bude uvedeno až příště.

14. Formát gob

Prvním binárním formátem, s nímž se setkáme, je formát nazvaný gob neboli Go Objects. Jedná se o formát určený primárně pro použití v programovacím jazyku Go, což znamená, že jeho využití je relativně specifické (ukládání rozsáhlých dat, komunikace mezi dvojicí služeb naprogramovaných v Go atd.). Tento formát umožňuje serializaci prakticky jakékoli datové struktury, ovšem je ho možné použít i pro primitivní datové typy, resp. pro jejich hodnoty. To si ostatně ukážeme v dalším příkladu, v němž jsou serializovaná data zobrazena ve formě sekvence hexadecimálních hodnot:

package main import ( "bytes" "encoding/gob" "encoding/hex" "fmt" ) func main() { var a bool = true var buffer bytes.Buffer encoder := gob.NewEncoder(&buffer) err := encoder.Encode(a) if err != nil { fmt.Println(err) } else { content := buffer.Bytes() fmt.Printf("Encoded into %d bytes

", len(content)) encoded := hex.EncodeToString(content) fmt.Println(encoded) } }

Výsledkem je:

Encoded into 4 bytes 03020001

Formát je v tomto případě jednoduchý:

Délka dat (bez prvního bajtu) Typ dat Pozice prvku ve fiktivní struktuře (zde 0=první prvek) Hodnota (true se převádí na 1)

15. Serializace datové struktury do formátu gob

Do formátu gob lze uložit prakticky jakoukoli datovou strukturu, což se samozřejmě týká i uživatelsky definovaných struktur. Pokusme se tedy uložit obsah struktury typu User. V tomto případě se neuloží pouze vlastní data, ale i základní formát této struktury, což později usnadní deserializaci:

package main import ( "bytes" "encoding/gob" "encoding/hex" "fmt" ) type User struct { Id uint32 Name string Surname string } func main() { user := User{ 1, "Pepek", "Vyskoč"} var buffer bytes.Buffer encoder := gob.NewEncoder(&buffer) err := encoder.Encode(user) if err != nil { fmt.Println(err) } else { content := buffer.Bytes() fmt.Printf("Encoded into %d bytes

", len(content)) encoded := hex.EncodeToString(content) fmt.Println(encoded) } }

Popis struktury User i její obsah se uloží do sekvence 69 bajtů, což je poměrně mnoho, ovšem na rozdíl od JSONu jsou přeneseny i datové typy apod.:

Encoded into 69 bytes 2eff81030101045573657201ff820001030102496401060001044e616d65010c0001075375726e616d65010c00000015ff8201010105506570656b01075679736b6fc48d00

16. Formát CBOR (Concise Binary Object Representation)

Jedním z binárních formátů určených pro přenos prakticky libovolně strukturovaných dat je formát nazvaný CBOR neboli plným jménem Concise Binary Object Representation. Tímto formátem, jenž se snaží nabízet podobné vlastnosti jako JSON (až na možnost jeho přímého čtení člověkem), se budeme podrobněji zabývat v navazující části tohoto seriálu, takže si prozatím jen ukažme jeden příklad, jenž používá knihovnu dostupnou na adrese github.com/fxamacker/cbor/v2 (tu lze nainstalovat běžným způsobem, ovšem pozor – vyžaduje Go 1.13 či novější). V příkladu je ukázána serializace jediné hodnoty, konkrétně pravdivostní hodnoty nastavené na hodnotu true:

package main import ( "fmt" "github.com/fxamacker/cbor/v2" ) func main() { var a bool = true var jsonOutput []byte cborOutput, _ = cbor.Marshal(a) fmt.Println(string(cborOutput)) }

Poznámka: zajímavé je, že tento formát podporuje i numerické hodnoty typu half float, s nimiž jsme se setkali v článku o typu bfloat16

17. Serializace dat do formátu BSON

Dalším sice relativně novým, ale rozšiřujícím se binárním formátem je formát nazvaný BSON (zde je odkaz na JSON nesporný). Tento formát je podporován v knihovně dodávané společně s ovladači pro MongoDB, ale lze ho používat zcela samostatně a nezávisle. Rozhraní balíčku bson je totožné s rozhraním encoding/json, takže například serializace naší struktury User do souboru typu BSON může vypadat následovně:

package main import ( "fmt" "gopkg.in/mgo.v2/bson" "io/ioutil" ) type User struct { Id uint32 Name string Surname string } func main() { user := User{ 1, "Pepek", "Vyskoč"} var bsonOutput []byte bsonOutput, err := bson.Marshal(user) if err != nil { fmt.Println(err) } else { fmt.Printf("Encoded into %d bytes

", len(bsonOutput)) err := ioutil.WriteFile("1.bson", bsonOutput, 0644) if err != nil { fmt.Println(err) } else { fmt.Println("And stored into file") } } }

18. Deserializace dat z formátu BSON

V předchozím příkladu jsme si ukázali serializaci datové struktury do BSONu, takže nám logicky zbývá provést její zpětnou deserializaci. Postup je velmi jednoduchý a je ukázán v dnešním posledním příkladu. Prozatím si ukazujeme pouze „happy path“, tj. situaci, kdy je deserializace úspěšná, ale příště se budeme zabývat i složitějšími stavy, které mohou v praxi nastat:

package main import ( "fmt" "gopkg.in/mgo.v2/bson" "io/ioutil" ) type User struct { Id uint32 Name string Surname string } func main() { var user User bsonInput, err := ioutil.ReadFile("1.bson") if err != nil { fmt.Println(err) return } fmt.Printf("Read %d bytes

", len(bsonInput)) err = bson.Unmarshal(bsonInput, &user) if err != nil { fmt.Println(err) return } fmt.Println("Deserialized value") fmt.Println(user) }

19. Repositář s demonstračními příklady

Zdrojové kódy všech dnes použitých demonstračních příkladů byly uloženy do Git repositáře, který je dostupný na adrese https://github.com/tisnik/go-root (stále na GitHubu :-). V případě, že nebudete chtít klonovat celý repositář (ten je ovšem – alespoň prozatím – velmi malý, dnes má přibližně šest až sedm megabajtů), můžete namísto toho použít odkazy na jednotlivé demonstrační příklady, které naleznete v následující tabulce:

20. Odkazy na Internetu