11. Rozhraní io.RuneScanner

12. Rozhraní io.Reader

13. Čtení bloku bajtů ze standardního vstupu a z řetězce

14. Spojení více vstupů – multireader

15. Rozhraní io.Writer

16. Kopie souborů po blocích

17. Načtení celého řádku ze standardního vstupu

18. Skládání rozhraní souvisejících se vstupně-výstupními operacemi

19. Repositář s demonstračními příklady

20. Odkazy na Internetu

1. Vstupně-výstupní funkce standardní knihovny programovacího jazyka Go

Již v předchozích částech seriálu o programovacím jazyku Go jsme se seznámili s některými balíčky patřícími do standardní knihovny tohoto jazyka. Ve skutečnosti je standardní knihovna poměrně rozsáhlá a obsahuje funkce a datové typy používané především pro tvorbu síťových služeb, webových služeb, mikroslužeb, utilit používaných systémovými administrátory, aplikací ovládaných z příkazové řádky (CLI) apod. Naopak ve standardní knihovně nenalezneme například podporu pro tvorbu plnohodnotných desktopových aplikací s grafickým uživatelským rozhraním, protože (alespoň prozatím) používá většina Go aplikací s uživatelským rozhraním možností poskytovaných moderními webovými prohlížeči (což ostatně pro jazyk vyvinutý primárně ve společnosti Google pravděpodobně dává smysl, i když se v delším časovém horizontu může jednat o dvousečnou zbraň – ostatně historie IT zná už mnoho jednoúčelových programovacích jazyků, které se mimo svou niku nijak významně nerozšířily).

V dnešním článku si přiblížíme některé další možnosti poskytované standardní knihovnou. Nejprve se budeme zabývat systémem používaným pro vstup a výstup dat (a zdaleka se nejedná pouze o operace nad soubory). Mohlo by se možná zdát, že se jedná o triviální téma, ovšem například zkušenosti z jiných jazyků (příkladem může být Java a jejich několik generací IO a NIO knihoven) ukazují, že dobře navržená a především pak rozšiřitelná IO knihovna je pro další rozvoj jazyka velmi užitečná a důležitá. V jazyku Go je celý systém vstupně-výstupních operací založen na několika rozhraních, jejichž metody mohou být (a ve skutečnosti i jsou) implementovány hned několika různými způsoby a použít je lze pro různé účely. Většina těchto rozhraní obsahuje pouze jedinou metodu, což je ovšem v programovacím jazyku Go velmi často používané řešení, s nímž se setkáme nejenom ve standardní knihovně.

To, že mnoho dále popsaných rozhraní obsahuje předpis pouze jediné metody má i další praktický dopad – pokud budeme potřebovat vytvořit další mechanismus používaný z pohledu programátora stejným způsobem, jako další vstupně-výstupní prostředky (soubory, síť, obsah archivu atd.), postačuje nadeklarovat nový datový typ a pro něj jedinou metodu z vybraného rozhraní (například ByteReader, Reader či ReadWriter. Nový takto navržený mechanismus bude od této chvíle možné do aplikací zařadit bez nutnosti jejich dalších modifikací.

2. Nejdůležitější rozhraní používaná vstupně-výstupním systémem

V následující tabulce jsou zmíněny základní informace o rozhraních, s nimiž se prakticky vždy setkáme při práci se vstupně-výstupním systémem základní knihovny programovacího jazyka Go:

Typ operace Čtení Zápis jednotlivých bajtů io.ByteReader io.ByteWriter jednotlivých znaků io.RuneReader × jednotlivých bajtů s bufferem io.ByteScanner × jednotlivých znaků s bufferem io.RuneScanner × bloku bajtů io.Reader io.Writer

implements tak, jako je tomu v některých jiných programovacích jazycích. Poznámka: připomeňme si, že v programovacím jazyce Go pro implementaci nějakého rozhraní postačuje pouze vytvořit metodu, jejíž hlavička odpovídá metodě předepsané v rozhraní. Nemusíme tedy nikde uvádět (ostatně neexistující) klíčové slovotak, jako je tomu v některých jiných programovacích jazycích.

3. Rozhraní io.ByteReader

Základním rozhraním, které může být implementováno pro prakticky libovolné vstupní či vstupně-výstupní zařízení, je rozhraní nazvané ByteReader. Toto rozhraní předepisuje jedinou metodu nazvanou ReadByte, která pochopitelně slouží k načtení jednoho bajtu ze vstupu. Pokud už další bajt nelze z nějakého důvodu načíst, například proto, že se dosáhlo konce dat nebo došlo k nějaké vstupně-výstupní chybě (výpadek připojení, odpojení souborového systému, skutečná chyba na fyzické datové vrstvě…), vrátí se ve druhé návratové hodnotě informace o chybě a první vrácená hodnota z metody ReadByte není obecně definována (musíme tedy počítat s tím, že může obsahovat jakoukoli hodnotu):

type ByteReader interface { ReadByte() (byte, error) }

ReadByte (a tím pádem i celé rozhraní ByteReader) například v implementacích dekomprimačních algoritmů, u některých síťových protokolů atd. Dále se explicitně nepředpokládá operace typu Close; tu je nutné v případě potřeby implementovat přes další rozhraní. Poznámka: povšimněte si, že toto rozhraní nepředpokládá žádné další vlastnosti vstupního zařízení – to nemusí umět například vrátit bajt zpátky do vstupního bufferu (pokud takový buffer vůbec existuje) a už vůbec není zapotřebí umět v datech provádět operaci typu seek nebo rozpoznávat jednotlivé znaky (v Unicode, konkrétně v kódování UTF-8). Z tohoto důvodu nalezneme metodu(a tím pádem i celé rozhraní) například v implementacích dekomprimačních algoritmů, u některých síťových protokolů atd. Dále se explicitně nepředpokládá operace typu; tu je nutné v případě potřeby implementovat přes další rozhraní.

Demonstrační příklad používající rozhraní nazvané ByteReader a jeho metodu ReadByte je ve skutečnosti velmi jednoduchý. Využijeme zde faktu, že metoda ReadByte je implementována i datovým typem nazvaným Reader, tentokrát ovšem definovaným v balíčku strings a nikoli v balíčku io. Konstruktor tohoto datového typu se volá funkcí NewReader, které předáme řetězec použitý jako zdroj dat:

reader := strings.NewReader("Hello world!")

Povšimněte si, jakým způsobem je realizován test na to, zda řetězec, z něhož načítáme jednotlivé bajty, ještě obsahuje nějaká data či zda jsme došli až na konec řetězce:

b, err := reader.ReadByte() if err == nil { fmt.Printf("%c", b) } else { fmt.Printf("

error %v", err) break }

Následuje výpis úplného zdrojového kódu tohoto demonstračního příkladu:

package main import ( "fmt" "strings" ) func main() { reader := strings.NewReader("Hello world!") for { b, err := reader.ReadByte() if err == nil { fmt.Printf("%c", b) } else { fmt.Printf("

error %v", err) break } } }

Příklad výstupu:

Hello world! error EOF

4. Vylepšení testu na zdetekovaný konec dat

Ve skutečnosti ovšem můžeme test na to, zda jsme na vstupu došli až na konec dat, napsat daleko explicitněji, a to kontrolou, jaká konkrétní chybová hodnota se vrátila z metody ReadByte. V případě, že se vrátila hodnota odpovídající konstantě io.EOF, nejedná se o skutečnou chybu, ale o „obyčejný“ konec dat, který většinou budeme chtít zpracovat jiným způsobem, než odlišný typ chyby. Tato úprava zdrojového kódu je provedena v další verzi demonstračního příkladu, jenž je vypsán pod tímto odstavcem:

package main import ( "fmt" "io" "strings" ) func main() { reader := strings.NewReader("Hello world!") for { b, err := reader.ReadByte() if err == io.EOF { fmt.Println("

EOF detected") break } if err == nil { fmt.Printf("%c", b) } else { fmt.Printf("

error %v", err) break } } }

Opět si ukažme příklad výstupu, který bude od prvního příkladu nepatrně odlišný:

Hello world! EOF detected

5. Bajty versus znaky

Další komplikace při praktickém používání vstupně-výstupních operací může nastat v případě, kdy budeme potřebovat ze vstupu načítat celé znaky a nikoli jednotlivé dále nezpracovávané bajty. Připomeňme si, že v programovacím jazyku Go existuje striktní rozlišení mezi bajty a znaky, přičemž znaky jsou reprezentovány datovým typem nazvaným rune, protože je nutné rozpoznávat celý rozsah Unicode a nikoli už pouhé ASCII, které je jen nepatrnou (i když velmi důležitou) podmnožinou Unicode. Nejdříve se podívejme na způsob, jakým se vlastně zpracovávají jednotlivé bajty metodou pojmenovanou ReadByte v tom případě, kdy zdroj dat obsahuje znaky Unicode (samotný zdrojový kód napsaný v Go přitom používá kódování UTF-8, tj. jedno z nejčastějších kódování Unicode). Postačí nám nepatrná úprava předchozího demonstračního příkladu do modifikovaného tvaru:

package main import ( "fmt" "io" "strings" ) func main() { reader := strings.NewReader("* ěščř ½µ§я¤ *") for { b, err := reader.ReadByte() if err == io.EOF { fmt.Println("

EOF detected") break } if err == nil { fmt.Printf("%02x ", b) } else { fmt.Printf("

error %v", err) break } } }

Výsledkem by měla být sekvence bajtů vypsaných v hexadecimální soustavě:

2a 20 c4 9b c5 a1 c4 8d c5 99 20 c2 bd c2 b5 c2 a7 d1 8f c2 a4 20 2a EOF detected

Poznámka: počet vypsaných hodnot a tedy i počet načtených bajtů je samozřejmě v tomto případě numericky vyšší, než počet znaků ve vstupním řetězci. Obě hodnoty by byly shodné jen ve chvíli, kdyby řetězec obsahoval pouze ASCII znaky.

6. Rozhraní io.RuneReader

V případě, že skutečně budeme chtít postupně načítat jednotlivé znaky a nikoli bajty, je výhodnější namísto rozhraní ByteReader využít spíše rozhraní nazvané RuneReader s jedinou předepsanou metodou, jejíž jméno je ReadRune. Tato metoda vrací jak načtený znak, tak i jeho velikost reprezentovanou v bajtech (přičemž znaky z původní ASCII jsou reprezentovány jedním bajtem, ostatní znaky pak více bajty). V případě, že se načtení dalšího znaku nezdaří, vrátí se ve třetí návratové hodnotě chyba (a první dvě návratové hodnoty by se neměly dále zpracovávat):

type RuneReader interface { ReadRune() (r rune, size int, err error) }

Samozřejmě si opět všechno vyzkoušíme v demonstračním příkladu, v němž pro jednoduchost opět použijeme objekt typu Reader, jehož zdrojem dat je obyčejný řetězec:

package main import ( "fmt" "io" "strings" ) func main() { reader := strings.NewReader("* ěščř ½µ§я¤ *") for { c, size, err := reader.ReadRune() if err == io.EOF { fmt.Println("

EOF detected") break } if err == nil { fmt.Printf("%c %d

", c, size) } else { fmt.Printf("

error %v", err) break } } }

V tomto případě by měl výsledek práce tohoto demonstračního příkladu vypadat následovně:

* 1 1 ě 2 š 2 č 2 ř 2 1 ½ 2 µ 2 § 2 я 2 ¤ 2 1 * 1 EOF detected

Poznámka: povšimněte si, že ASCII znaky jsou skutečně reprezentovány jediným bajtem, kdežto ostatní znaky více bajty.

7. Rozhraní io.ByteWriter

Opakem rozhraní ByteReader, s nímž jsme se seznámili v předchozích kapitolách, je rozhraní, které se – což asi nebude příliš překvapující – jmenuje ByteWriter. Toto rozhraní předepisuje pouze jedinou metodu s názvem WriteByte, která slouží k zápisu bajtu do výstupního zařízení (či libovolného výstupního mechanismu) a vrací hodnotu obsahující popis případné chyby, která může při zápisu nastat:

type ByteWriter interface { WriteByte(c byte) error }

Toto rozhraní je implementováno například datovým typem se jménem Buffer ze standardního balíčku bytes. Samotný buffer umožňuje zápis a čtení na úrovni jednotlivých bajtů či znaků do operační paměti, přičemž velikost bufferu se dynamicky podle potřeb mění. V následujícím demonstračním příkladu je buffer zpočátku prázdný a hodnoty (jednotlivé bajty) do něj zapíšeme právě metodou WriteByte a zpětně je pro kontrolu přečteme metodou ReadByte, kterou již dobře známe z předchozího textu:

package main import ( "bytes" "fmt" ) func main() { buffer := bytes.Buffer{} buffer.WriteByte(65) b, _ := buffer.ReadByte() fmt.Printf("%02x

", b) buffer.WriteByte(0xff) b, _ = buffer.ReadByte() fmt.Printf("%02x

", b) }

Příklad výstupu:

41 ff

V předchozím odstavci jsme si řekli, že buffer umožňuje, aby se čtení a zápis prováděly na úrovni jednotlivých bajtů či znaků. To nám umožňuje i kombinaci obou přístupů, tj. například zápis bajtů, které se následně pokusíme přečíst jako jednotlivé znaky Unicode zakódované pomocí UTF-8. Vyzkoušejme si to na dalším příkladu:

package main import ( "bytes" "fmt" ) func main() { buffer := bytes.Buffer{} buffer.WriteByte(65) c, size, err := buffer.ReadRune() fmt.Printf("%c %d %v

", c, size, err) buffer.WriteByte(0xc4) buffer.WriteByte(0x9b) c, size, err = buffer.ReadRune() fmt.Printf("%c %d %v

", c, size, err) c, size, err = buffer.ReadRune() fmt.Printf("%c %d %v

", c, size, err) }

Výsledek činnosti tohoto demonstračního příkladu by měl vypadat následovně:

A 1 <nil> ě 2 <nil> 0 EOF

Poznámka: povšimněte si, že na posledním řádku se ve skutečnosti žádný znak nevrátil – naopak se vrátila chybová hodnota oznamující, že buffer je prázdný a čtení tedy nelze provést.

8. Zápis jednotlivých znaků metodou WriteRune

Vzhledem k tomu, že existují standardní rozhraní io.ByteWriter, io.ByteReader a io.RuneReader, mohlo by se očekávat, že bude existovat i rozhraní pojmenované io.RuneWriter. Ve skutečnosti tomu tak není, i když například již výše zmíněný typ Buffer z balíčku bytes obsahuje metodu nazvanou WriteRune, která by byla předepsána právě teoretickým rozhraním io.RuneWriter. Ostatně si chování této metody můžeme velmi snadno otestovat, a to překladem a spuštěním dalšího demonstračního příkladu, jehož zdrojový kód vypadá takto:

package main import ( "bytes" "fmt" ) func main() { buffer := bytes.Buffer{} buffer.WriteRune('a') buffer.WriteRune('ě') buffer.WriteRune('я') for { b, err := buffer.ReadByte() if err == nil { fmt.Printf("%02x ", b) } else { fmt.Printf("

error %v", err) break } } }

Tento příklad by měl po svém spuštění vypsat následující trojici řádků:

A 1 <nil> ě 2 <nil> 0 EOF

RuneWriter se většinou používají funkce a metody sloužící pro zápis celých řetězců, popř. je možné znaky před jejich zápisem převést na sekvenci bajtů. S tímto přístupem se setkáme později. Poznámka: namísto rozhraníse většinou používají funkce a metody sloužící pro zápis celých řetězců, popř. je možné znaky před jejich zápisem převést na sekvenci bajtů. S tímto přístupem se setkáme později.

9. Rozhraní io.ByteScanner

Další dvojice rozhraní, s nimiž se v dnešním článku alespoň ve stručnosti seznámíme, se jmenuje io.ByteScanner a io.RuneScanner. Rozhraní io.ByteScanner je založeno na již popsaném rozhraní io.ByteReader, ovšem k metodě ReadByte je navíc přidána i metoda pojmenovaná UnreadByte:

type ByteScanner interface { ByteReader UnreadByte() error }

Tato metoda – pokud ji samozřejmě nějaký datový typ implementuje – zajistí, že další volání metody ReadByte vrátí stejný bajt, jako předchozí volání této metody. Jak je popsané chování interně zajištěno, již pochopitelně do značné míry závisí na tom, jaké zařízení či vstupní mechanismus je použit. Někde je možné použít vstupní buffer, jindy se zapamatuje pouze poslední načítaný znak atd. Většinou není možné metodu UnreadByte zavolat vícekrát za sebou, a to právě z toho důvodu, že její interní implementace si pamatuje pouze poslední čtený znak.

Buffer, naopak umožňují prakticky libovolné volání metody UnreadByte, protože je tato metoda implementována pouhým posunem indexu či ukazatele v poli reprezentujícím vstupní data. Jedná se však spíše o výjimku, než o pravidlo a na možnost vícenásobného volání UnreadByte se není obecně možné spoléhat. Poznámka: některé implementace, například ty založené na typu, naopak umožňují prakticky libovolné volání metody, protože je tato metoda implementována pouhým posunem indexu či ukazatele v poli reprezentujícím vstupní data. Jedná se však spíše o výjimku, než o pravidlo a na možnost vícenásobného voláníse není obecně možné spoléhat.

Tato dvě rozhraní jsou velmi užitečná, protože v mnoha algoritmech se při zpracování vstupních dat dozvíme, že například nějaký blok již skončil, až ve chvíli, kdy přečteme následující bajt či znak, který již má logicky patřit do dalšího bloku. Čistě programové řešení by většinou bylo zbytečně komplikované, takže použití rozhraní ByteScanner a RuneScanner je snadnější a čistější.

V dalším demonstračním příkladu si ukážeme použití metody UnreadByte při čtení bajtů (nikoli celých znaků!) z řetězce představujícího zdroj dat pro objekt typu strings.Reader. Úplný zdrojový kód tohoto demonstračního příkladu naleznete na adrese https://github.com/tisnik/go-root/blob/master/article 22 /08_un­read_byte.go:

package main import ( "fmt" "strings" ) func main() { reader := strings.NewReader("Hello world!") cnt := 0 for { b, err := reader.ReadByte() if err == nil { fmt.Printf("%c", b) } else { fmt.Printf("

error %v", err) break } cnt++ if cnt == 5 || cnt == 10 || cnt == 14 || cnt == 15 { reader.UnreadByte() } } }

Z výpisu produkovaného tímto příkladem je patrné, že se skutečně podařilo zdvojit pátý, desátý, čtrnáctý a patnáctý bajt v řetězci:

Helloo worrld!!! error EOF

10. Vícenásobné vrácení bajtu do vstupu

Objekt typu strings.Reader ve skutečnosti umožňuje několikanásobné zpětné vložení bajtu, protože se interně jedná pouze o posun ukazatele ve vstupních datech. Můžeme tedy napsat například:

if cnt == 6 { for i := 0; i <= 6; i++ { reader.UnreadByte() } }

Chování takto upraveného příkladu si samozřejmě můžeme otestovat; zde je jeho úplný zdrojový kód:

package main import ( "fmt" "strings" ) func main() { reader := strings.NewReader("Hello world!") cnt := 0 for { b, err := reader.ReadByte() if err == nil { fmt.Printf("%c", b) } else { fmt.Printf("

error %v", err) break } cnt++ if cnt == 6 { for i := 0; i <= 6; i++ { reader.UnreadByte() } } } }

Výsledek činnosti tohoto demonstračního příkladu by měl vypadat následovně:

Hello Hello world!

r.i) na jeho začátek. Poznámka: povšimněte si, že se v tomto případě ve skutečnosti skutečně vrátila zpět operace čtení bajtu, nedošlo tedy k několikanásobnému vložení stejného bajtu do řetězce (což by platilo, pokud by čtení nenávratně mazalo vstupní data a systém by si pamatoval jen poslední načtený bajt), ale k posunu ukazatele () na jeho začátek.

func (r *Reader) UnreadByte() error { r.prevRune = -1 if r.i <= 0 { return errors.New("strings.Reader.UnreadByte: at beginning of string") } r.i-- return nil }

11. Rozhraní io.RuneScanner

Další rozhraní se stejnou filozofií, jako má výše popsané rozhraní io.ByteScanner, se jmenuje RuneScanner. Toto rozhraní je odvozeno od io.RuneReader, ovšem navíc je do něj přidána metoda určená pro vrácení posledně čteného znaku/runy:

type RuneScanner interface { RuneReader UnreadRune() error }

Použití tohoto rozhraní je snadné, což si ostatně můžeme ukázat v pořadí již desátém příkladu:

package main import ( "fmt" "io" "strings" ) func main() { reader := strings.NewReader("* ěščř ½µ§я¤ *") cnt := 0 for { c, size, err := reader.ReadRune() if err == io.EOF { fmt.Println("

EOF detected") break } if err == nil { fmt.Printf("%c %d

", c, size) } else { fmt.Printf("

error %v", err) break } cnt++ if cnt == 5 || cnt == 10 || cnt == 14 || cnt == 15 { reader.UnreadRune() } } }

Na výstupu můžeme vidět, že se některé znaky/runy skutečně načetly a vypsaly vícekrát. Zdvojené a ztrojené znaky jsou zvýrazněny:

* 1 1 ě 2 š 2 č 2 č 2 ř 2 1 ½ 2 µ 2 µ 2 § 2 я 2 ¤ 2 ¤ 2 ¤ 2 1 * 1 EOF detected

12. Rozhraní Reader

Ve standardní knihovně programovacího jazyka Go nalezneme i další dvě důležitá rozhraní, s nimiž se dokonce v praxi setkáme většinou mnohem častěji, než s výše zmíněnými rozhraními ByteReader a ByteWriter. První z těchto rozhraní předepisuje jedinou metodu určenou pro bufferované čtení dat z prakticky libovolného vstupního mechanismu (zařízení, souboru, roury atd.), u něhož se předpokládá, že dokáže načítat blok dat a rozeznávat jejich případný konec. Toto rozhraní se jmenuje jednoduše Reader a jediná metoda tohoto rozhraní má jméno Read:

type Reader interface { Read(p []byte) (n int, err error) }

Počet načítaných bajtů závisí na velikosti/kapacitě pole bajtů a taktéž na tom, kolik bajtů se ještě na vstupu nachází. Ideálně se vždy načte tolik bajtů, kolik odpovídá kapacitě předaného pole, ovšem například na konci souboru (pokud provádíme načítání ze souboru) to bude méně. Počet skutečně načtených bajtů získáme snadno – z první návratové hodnoty.

Podívejme se nyní na typické použití tohoto rozhraní při načítání dat ze vstupního souboru. Soubor nejdříve otevřeme a zajistíme jeho uzavření na konci funkce:

fin, err := os.Open(filename) if err != nil { log.Fatal(err) } defer fin.Close()

Dále vytvoříme buffer pro čtení dat:

const buffer_size = 16 buffer := make([]byte, buffer_size)

Další čtení (v našem případě po šestnácti bajtech) je již snadné:

for { read, err := fin.Read(buffer) if read > 0 { fmt.Printf("read %d bytes

", read) fmt.Println(buffer[:read]) } if err != nil { fmt.Printf("other error %v

", err) break } }

Úplná implementace čtení bajtů ze souboru po blocích pevné délky vypadá takto:

package main import ( "fmt" "io" "log" "os" ) const filename = "test_input.txt" const buffer_size = 16 func main() { fin, err := os.Open(filename) if err != nil { log.Fatal(err) } defer fin.Close() buffer := make([]byte, buffer_size) for { read, err := fin.Read(buffer) if read > 0 { fmt.Printf("read %d bytes

", read) fmt.Println(buffer[:read]) } if err == io.EOF { fmt.Println("reached end of file") break } if err != nil { fmt.Printf("other error %v

", err) break } } }

13. Čtení bloku bajtů ze standardního vstupu a z řetězce

Nepatrnou úpravou předchozího příkladu můžeme zajistit čtení bloku bajtů ze standardního vstupu. Ten je představován objektem os.Stdin, který pochopitelně nemusíme ani otevírat ani uzavírat. Podívejme se tedy jen na způsob implementace:

package main import ( "fmt" "io" "os" ) const buffer_size = 16 func main() { buffer := make([]byte, buffer_size) for { read, err := os.Stdin.Read(buffer) if read > 0 { fmt.Printf("read %d bytes

", read) fmt.Println(buffer[:read]) } if err == io.EOF { fmt.Println("reached end of file") break } if err != nil { fmt.Printf("other error %v

", err) break } } }

Podobně můžeme využít objekt strings.Reader pro čtení bloku bajtů z řetězce, což je implementováno v dnešním třináctém demonstračním příkladu:

package main import ( "fmt" "io" "strings" ) const input_string = "Hello world!" const buffer_size = 4 func main() { r := strings.NewReader(input_string) buffer := make([]byte, buffer_size) for { read, err := r.Read(buffer) if read > 0 { fmt.Printf("read %d bytes

", read) fmt.Println(buffer[:read]) } if err == io.EOF { fmt.Println("reached end of file") break } if err != nil { fmt.Printf("other error %v

", err) break } } }

Načtené bloky bajtů se můžeme pokusit převést na řetězec konstruktorem string. Opět si ukažme celý zdrojový kód takto upraveného příkladu:

package main import ( "fmt" "io" "strings" ) const input_string = "Hello world!" const buffer_size = 4 func main() { r := strings.NewReader(input_string) buffer := make([]byte, buffer_size) for { read, err := r.Read(buffer) if read > 0 { fmt.Printf("read %d bytes

", read) fmt.Println(string(buffer[:read])) } if err == io.EOF { fmt.Println("reached end of file") break } if err != nil { fmt.Printf("other error %v

", err) break } } }

14. Spojení více vstupů – multireader

Konečně se dostáváme k zajímavějším způsobům použití standardních vstupně-výstupních rozhraní. Dobrým příkladem může být funkce io.MultiReader, které se na vstup předá libovolné množství objektů implementujících rozhraní io.Reader a výsledkem bude opět objekt typu io.Reader, který ovšem bude vracet spojené vstupní proudy. To je potenciálně velmi užitečné a především – toto spojení dat se provede zcela automaticky a bez toho, abychom museli nějakým způsobem měnit logiku aplikace. V dalším příkladu je ukázáno, jak se spojí tři objekty typu Reader:

package main import ( "fmt" "io" "strings" ) const input_string_1 = "Hello" const input_string_2 = "world" const input_string_3 = "!" const buffer_size = 4 func main() { r1 := strings.NewReader(input_string_1) r2 := strings.NewReader(input_string_2) r3 := strings.NewReader(input_string_3) r := io.MultiReader(r1, r2, r3) buffer := make([]byte, buffer_size) for { read, err := r.Read(buffer) if read > 0 { fmt.Printf("read %d bytes

", read) fmt.Println(string(buffer[:read])) } if err == io.EOF { fmt.Println("reached end of file") break } if err != nil { fmt.Printf("other error %v

", err) break } } }

Příklad výstupu:

read 4 bytes Hell read 1 bytes o read 4 bytes worl read 1 bytes d read 1 bytes ! reached end of file

15. Rozhraní io.Writer

Opakem rozhraní io.Reader je pochopitelně rozhraní pojmenované io.Writer. Toto rozhraní předepisuje jedinou metodu určenou pro zápis bloku bajtů do libovolného výstupu. Metoda vrací počet skutečně zapsaných bajtů (ten se může lišit od kapacitu bufferu, například při chybě) a případnou hodnotu reprezentující chybu:

type Writer interface { Write(p []byte) (n int, err error) }

Typicky se tato metoda využívá při zápisu do souborů s binárním obsahem, ovšem můžeme ji pochopitelně použít i v případě, že potřebujeme pracovat s textovými soubory obsahujícími pouze ASCII znaky. A právě tento způsob použití je použit v dalším demonstračním příkladu:

package main import ( "fmt" "log" "os" ) const filename = "test_output.txt" const message = "Hello world!" func main() { fout, err := os.Create(filename) if err != nil { log.Fatal(err) } defer fout.Close() buffer := []byte(message) written, err := fout.Write(buffer) if written > 0 { fmt.Printf("written %d bytes

", written) } if err != nil { fmt.Printf("I/O error %v

", err) } }

16. Kopie souborů po blocích

Ukažme si ještě, jak zajistit kopii souborů po blocích nějaké pevně zadané délky. Samotná kopie po blocích samozřejmě není nic složitého, pouze musíme zajistit, aby se správně pracovalo s posledním blokem, který pochopitelně nemusí být zcela zaplněn. To je zajištěno zvýrazněným výrazem:

read, err := src.Read(buffer) if read > 0 { fmt.Printf("read %d bytes

", read) written, err := dst.Write(buffer[:read]) if written > 0 { fmt.Printf("written %d bytes

", written) } if err != nil { fmt.Printf("write error %v

", err) return copied, err } copied += int64(written) }

Následuje výpis celého zdrojového kódu tohoto příkladu:

package main import ( "fmt" "io" "os" ) func closeFile(file *os.File) { fmt.Printf("Closing file '%s'

", file.Name()) file.Close() } func copyFile(srcName, dstName string) (written int64, err error) { src, err := os.Open(srcName) if err != nil { panic(err) } defer closeFile(src) dst, err := os.Create(dstName) if err != nil { panic(err) } defer closeFile(dst) buffer := make([]byte, 16) copied := int64(0) for { read, err := src.Read(buffer) if read > 0 { fmt.Printf("read %d bytes

", read) written, err := dst.Write(buffer[:read]) if written > 0 { fmt.Printf("written %d bytes

", written) } if err != nil { fmt.Printf("write error %v

", err) return copied, err } copied += int64(written) } if err == io.EOF { fmt.Println("reached end of file") break } if err != nil { fmt.Printf("other error %v

", err) return copied, err } } return copied, nil } func testCopyFile(srcName, dstName string) { copied, err := copyFile(srcName, dstName) if err != nil { fmt.Printf("copyFile('%s', '%s') failed!!!

", srcName, dstName) } else { fmt.Printf("Copied %d bytes

", copied) } fmt.Println() } func main() { testCopyFile("test_input.txt", "output.txt") }

17. Načtení celého řádku ze standardního vstupu

V dnešním posledním demonstračním příkladu je ukázáno jiné použití standardních vstupně-výstupních funkcí a metod. Využijeme zde balíček bufio, v němž se mj. nachází i objekt typu Reader obsahující metodu ReadString, které se předá znak, jenž reprezentuje konec dat. V případě, že metodě předáme znak konce řádku, načte tato metoda celý textový řádek a vrátí ho ve formě řetězce, tedy s využitím základních konverzních funkcí pro převod bajtů na Unicode:

package main import ( "bufio" "os" ) func main() { reader := bufio.NewReader(os.Stdin) print("Login: ") login, err := reader.ReadString('

') if err != nil { println("Error reading login") } print("Password: ") password, err := reader.ReadString('

') if err != nil { println("Error reading password") } println(login) println(password) }

18. Skládání rozhraní souvisejících se vstupně-výstupními operacemi

Ve standardní knihovně nalezneme i rozhraní, která jsou složena z některých rozhraní jednodušších. Příkladem může být především rozhraní se jménem io.ReadWriter s oběma metodami Read i Write. Tyto metody ovšem nejsou předepsány přímo, ale nové rozhraní je skutečně složeno z rozhraní jednodušších, o čemž se ostatně můžeme snadno přesvědčit:

type ReadWriter interface { Reader Writer }

Podobně nalezneme ve standardní knihovně i další podobná rozhraní vycházející ze dvou či tří rozhraní s původně jedinou metodou, zejména pak:

type ReadCloser interface { Reader Closer } type WriteCloser interface { Writer Closer } type ReadWriteCloser interface { Reader Writer Closer } type ReadSeeker interface { Reader Seeker } type WriteSeeker interface { Writer Seeker } type ReadWriteSeeker interface { Reader Writer Seeker }

19. Repositář s demonstračními příklady

Zdrojové kódy všech dnes popsaných demonstračních příkladů byly uloženy do Git repositáře, který je dostupný na adrese https://github.com/tisnik/go-root (stále na GitHubu :-). V případě, že nebudete chtít klonovat celý repositář (ten je ovšem – alespoň prozatím – velmi malý, dnes má přibližně dva megabajty), můžete namísto toho použít odkazy na jednotlivé příklady, které naleznete v následující tabulce:

