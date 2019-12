11. Programové přečtení obsahu vybraného objektu

1. Další možnosti nabízené projektem MinIO

V úvodním článku o projektu MinIO, který vyšel v úterý, jsme se seznámili se základními koncepty, na nichž je toto objektové úložiště postaveno. Taktéž jsme si řekli, že MinIO lze ovládat podobným způsobem jako známé cloudové úložiště AWS S3 (S3=Simple Storage Service) a je tak možné tento projekt nasadit do privátního clusteru, použít ho jako lokální úložiště, využít MinIO pro vývoj a testování aplikací, které v reálném nasazení použijí AWS S3 atd. atd.

Všechny demonstrační příklady ukázané minule byly vyvinuty v programovacím jazyku Go, což však v žádném případě neznamená, že se jedná o jediný jazyk, ve kterém mohou být psány aplikace, které k Miniu přistupují. K dispozici je šest oficiálních klientů pro šest platforem:

# Jazyk/platforma Klient 1 Go https://docs.min.io/docs/golang-client-api-reference.html 2 Python https://docs.min.io/docs/python-client-api-reference.html 3 Java https://docs.min.io/docs/java-client-api-reference.html 4 .NET https://docs.min.io/docs/dotnet-client-api-reference.html 5 JavaScript https://docs.min.io/docs/javascript-client-api-reference.html 6 Haskell https://docs.min.io/docs/haskell-client-api-reference.html

Poznámka: na tomto místě je dobré upozornit na to, že mezi jednotlivými klienty existují rozdíly. Například některé metody dostupné pro Go nenajdeme v klientovi pro Python atd. Ovšem všechny základní operace popsané dnes i minule jsou podporovány napříč jazyky/platformami.

Obrázek 1: Služba MinIO aktivně upozorňuje administrátory ve chvíli, kdy se pokouší pracovat se starší verzí, což nastalo i v našem případě – verze, která byla ještě v době vydání první verze článku aktuální, je dnes již považována za zastaralou a je nabídnuta možnost reinstalace (která je mimochodem bezproblémová).

2. Spuštění Minia

Všechny dnes ukázané demonstrační příklady vyžadují, aby na systému běžela instance služby Minia s nastaveným úložištěm. Minio lze spustit z Dockeru (k dispozici je oficiální obraz) či přímo s využitím binárního spustitelného souboru – viz popis instalace uvedený minule:

$ ./minio server /tmp/minio/ Endpoint: http://10.0.0.29:9000 http://127.0.0.1:9000 AccessKey: WDGGENVCJDQVFM3TBM88 SecretKey: 8YxAW5qxYKBzo7qLGuqxuVDwK5NekY2k7v9ZIZ9C Browser Access: http://10.0.0.29:9000 http://127.0.0.1:9000 Command-line Access: https://docs.min.io/docs/minio-client-quickstart-guide $ mc config host add myminio http://10.0.0.29:9000 WDGGENVCJDQVFM3TBM88 8YxAW5qxYKBzo7qLGuqxuVDwK5NekY2k7v9ZIZ9C Object API (Amazon S3 compatible): Go: https://docs.min.io/docs/golang-client-quickstart-guide Java: https://docs.min.io/docs/java-client-quickstart-guide Python: https://docs.min.io/docs/python-client-quickstart-guide JavaScript: https://docs.min.io/docs/javascript-client-quickstart-guide .NET: https://docs.min.io/docs/dotnet-client-quickstart-guide

3. Nejdůležitější funkce a metody z SDK Minia pro Go

V úvodním článku o Miniu jsme se seznámili s některými funkcemi a metodami nabízenými SDK určeným pro programovací jazyk Go. Připomeňme si ve stručnosti, o jaké funkce a metody se jednalo:

# Funkce/metoda Stručný popis 1 minio.New vytvoří novou instanci klienta, který reprezentuje připojení k Miniu (ostatní metody tuto instanci používají jako příjemce – receiver) 2 minio.Client.ListBuckets získání seznamu všech dostupných bucketů 3 minio.Client.ListObjects získání seznamu objektů v určitém bucketu 4 minio.Client.GetObject přečtení obsahu vybraného objektu, obsah je reprezentován objektem Reader 5 minio.Client.FGetObject uložení obsahu vybraného objektu z úložiště do lokálního souboru 6 minio.Client.FPutObject kopie dat ze souboru do vybraného objektu v úložišti 7 minio.Client.CopyObject kopie objektu v rámci úložiště (i mezi různými buckety)

Funkce minio.New vytvoří novou instanci klienta, který reprezentuje připojení k Miniu (tedy ke službě obsluhující úložiště). Je možné, aby se v jedné aplikaci použilo větší množství klientů, protože se například může jednat o implementaci message brokera s více úložišti, synchronizační službu atd.:

minioClient, err := minio.New(endpoint, accessKeyID, secretAccessKey, useSSL) if err != nil { log.Fatalln(err) }

Dále jsme si popsali metodu nazvanou minio.Client.ListBucket, která vrátí seznam všech dostupných bucketů. Použití této metody je většinou snadné (i když je nutné kontrolovat, zda nedošlo k chybě):

fmt.Println("List of buckets:") buckets, err := minioClient.ListBuckets() if err != nil { log.Fatalln(err) return } for i, bucket := range buckets { fmt.Printf("%d\t%+v

", i, bucket) }

Třetí důležitou metodou je metoda pojmenovaná minio.Client.ListObjects sloužící pro získání seznamu objektů v určitém bucketu. Ovšem tato metoda nabízí i další možnosti použití, protože lze specifikovat prefix klíče objektu a taktéž příznak, zda se má vyhledávání provádět rekurzivně. Navíc tato metoda používá i kanál (channel) pro oznámení, že již došlo k ukončení vyhledávání:

fmt.Println("List of objects for bucket:", bucket) done := make(chan struct{}) defer close(done) objects := minioClient.ListObjects(bucket, prefix, false, done) for object := range objects { if object.Err != nil { log.Println(object.Err) return } fmt.Printf("Key: %s, Size: %d, Tag: %s

", object.Key, object.Size, object.ETag) }

Další metoda se jmenuje minio.Client.FGetObject a slouží pro přečtení obsahu vybraného objektu a uložení tohoto obsahu do lokálního souboru:

err = minioClient.FGetObject("foo", "logos.jpg", "logos.jpg", minio.GetObjectOptions{}) if err != nil { log.Fatalln(err) }

Opakem metody minio.Client.FGetObject je metoda minio.Client.FPutObject, která naopak obsah lokálního souboru přenese do úložiště pod zadaným jménem bucketu a klíče (=jména objektu):

length, err := minioClient.FPutObject("foo", "minio9.go", "minio9.go", minio.PutObjectOptions{ ContentType: "text/plain;charset=UTF-8", }) if err != nil { fmt.Println(err) }

A nakonec nesmíme zapomenout na metodu minio.Client.GetObject, která slouží pro přečtení obsahu objektu. Z pohledu aplikace se vrací objekt implementující rozhraní Reader, takže lze použít prakticky všechny funkce, které s Readerem pracují (včetně komprimace streamu atd. atd.):

object, err := minioClient.GetObject(bucket, objectName, minio.GetObjectOptions{}) if err != nil { log.Fatalln(err) } defer object.Close() bytes, err := ioutil.ReadAll(object) if err != nil { log.Fatalln(err) }

4. Přečtení informací o objektu uloženém v Miniu

V některých případech je nutné zjistit informace o objektu, který je v Miniu uložen. Připomeňme si, že objekt je určen jménem bucketu a klíčem (což je taktéž jméno), přičemž na jména bucketů jsou kladena podobná omezení, jako na URL či cesty v adresářové struktuře. Samotný objekt přitom není reprezentován pouze svým obsahem (sekvence bajtů), ale i dalšími metadaty, typicky příznaky přístupu, časovými razítky, určením typu dat (content-type) a v S3 i verzí (což je ovšem vlastnost, kterou Minio prozatím nepodporuje). Pro přečtení těchto informací slouží metoda minio.Client.StatObject:

# Funkce/metoda Stručný popis 1 minio.Client.StatObject získání podrobnějších informací o objektu

Přečtení informací o objektu je jednoduché, pouze nesmíme zapomenout na správnou reakci na případný chybový stav:

info, err := minioClient.StatObject(bucket, name, minio.StatObjectOptions{}) if err != nil { log.Fatalln(err) }

Nejprve se podívejme na zdrojový kód demonstračního příkladu, posléze si ukážeme, jaké informace jsme získali:

package main import ( "flag" "fmt" "github.com/minio/minio-go/v6" "log" ) func listBuckets(minioClient *minio.Client) { fmt.Println("List of buckets:") buckets, err := minioClient.ListBuckets() if err != nil { log.Fatalln(err) return } for i, bucket := range buckets { fmt.Printf("%d\t%+v

", i, bucket) } } func getObjectInfo(minioClient *minio.Client, bucket string, name string) { fmt.Printf("Info for object %s in bucket %s

", name, bucket) info, err := minioClient.StatObject(bucket, name, minio.StatObjectOptions{}) if err != nil { log.Fatalln(err) } fmt.Printf("Key: %s

Size: %d

Tag: %s

Content-type: %s

", info.Key, info.Size, info.ETag, info.ContentType) } func main() { var endpoint = flag.String("endpoint", "127.0.0.1:9000", "MinIO service endpoint") var accessKeyID = flag.String("accessKeyID", "", "Access key ID for MinIO") var secretAccessKey = flag.String("secretAccessKey", "", "Secret access key for MinIO") var useSSL = flag.Bool("useSSL", false, "Use SSL for communication with MinIO") flag.Parse() // initialize minio client object minioClient, err := minio.New(*endpoint, *accessKeyID, *secretAccessKey, *useSSL) if err != nil { log.Fatalln(err) } // everything seems to be ok log.Printf("%#v

", minioClient) listBuckets(minioClient) fmt.Println() getObjectInfo(minioClient, "foo", "minio9.go") fmt.Println() getObjectInfo(minioClient, "foo", "logos.jpg") fmt.Println() getObjectInfo(minioClient, "foo", "something_else") }

Po spuštění tohoto příkladu by se měly zobrazit informace o dvou existujících objektech se jmény „minio9.go“ a „logos.jpg“ a o neexistujícím objektu „something_else“:

$ ./minio11 -accessKeyID=3V8WMANF061SGOIVR7AA -secretAccessKey=AHTM6+74n1Z8DZRZ4V7o83QcnYRnTEVblVb8sIlE 2019/12/17 10:28:06 &minio.Client{endpointURL:(*url.URL)(0xc000172000), credsProvider:(*credentials.Credentials)(0xc0000ac7e0), overrideSignerType:0, appInfo:struct { appName string; appVersion string }{appName:"", appVersion:""}, secure:false, httpClient:(*http.Client)(0xc0000938c0), bucketLocCache:(*minio.bucketLocationCache)(0xc00009e780), isTraceEnabled:false, traceErrorsOnly:false, traceOutput:io.Writer(nil), s3AccelerateEndpoint:"", region:"", random:(*rand.Rand)(0xc000093920), lookup:0} List of buckets: 0 {Name:bar CreationDate:2019-12-14 10:30:57.918 +0000 UTC} 1 {Name:foo CreationDate:2019-12-14 17:13:38.282 +0000 UTC} Info for object minio9.go in bucket foo Key: minio9.go Size: 1304 Tag: 34a37b73d9402b51201f42569f506d4b-1 Content-type: text/plain;charset=UTF-8 Info for object logos.jpg in bucket foo Key: logos.jpg Size: 48913 Tag: f95e4a85dafc56313883f8571cfc8143-1 Content-type: image/jpeg Info for object something_else in bucket foo 2019/12/17 10:28:06 The specified key does not exist.

Poznámka: povšimněte si, že se zobrazil klíč objektu, jeho tag (ve skutečnosti MD5 heš) a především pak typ obsahu, který je ovšem nutné nastavit při zakládání objektu.

5. Přístup do úložiště Minia z aplikací naprogramovaných v Pythonu

Ve druhé části dnešního článku si ukážeme, jakým způsobem lze přistupovat do úložiště Minia z aplikací, které jsou naprogramované v Pythonu. Uvidíme, že až na několik rozdílů je přístup z Pythonu prakticky totožný jako přístup z aplikací naprogramovaných v jazyku Go, pochopitelně s přihlédnutím k tomu, že v Pythonu se používají odlišné jmenné konvence, než je tomu v Go. Taktéž se liší způsob zpracování chyb – v Pythonu se používají klasické výjimky, zatímco Go se spoléhá na struktury typu error.

Před spuštěním demonstračních příkladů zmíněných v navazujících kapitolách je nutné mít nainstalován Pythonovský balíček nazvaný jednoduše minio. Tento balíček je dostupný na PyPi, takže je jeho instalace jednoduchá. Použijeme nástroj pip3 určený pro Python 3 (protože pro Python 2 se již odpočítává posledních několik dnů jeho oficiální podpory):

$ pip3 install --user minio Collecting minio Downloading https://files.pythonhosted.org/packages/14/46/60bff78df1b112cc50f95c5ffb2e14aaf9aa279a5219845b55c56f214383/minio-5.0.5-py2.py3-none-any.whl (62kB) 100% |████████████████████████████████| 71kB 1.7MB/s Requirement already satisfied: certifi in /usr/lib/python3.7/site-packages (from minio) Requirement already satisfied: urllib3 in /usr/lib/python3.7/site-packages (from minio) Requirement already satisfied: pytz in /usr/lib/python3.7/site-packages (from minio) Requirement already satisfied: python-dateutil in ./.local/lib/python3.7/site-packages (from minio) Requirement already satisfied: six>=1.5 in ./.local/lib/python3.7/site-packages (from python-dateutil->minio) Installing collected packages: minio Successfully installed minio-5.0.5

Většina funkcí a metod, které jsme si již popsali v souvislosti s SDK pro programovací jazyk Go, existuje i v Pythonu. Ovšem kvůli tomu, že jmenné konvence jsou v Pythonu odlišné a liší se i možnosti volání funkcí/metod (nepovinné parametry atd.), je ovládání Minia z Pythonu poněkud rozdílné. Ostatně se stačí podívat na následující tabulku s porovnáním jmen funkcí/metod v jazyku Go a jazyku Python:

# Funkce/metoda v Go Funkce/metoda v Pythonu 1 minio.New (konstruktor) minio.Minio (de facto konstruktor) 2 minio.Client.ListBuckets minio.Minio.list_buckets 3 minio.Client.ListObjects minio.Minio.list_objects 4 minio.Client.GetObject minio.Minio.get_object 5 minio.Client.FGetObject minio.Minio.fget_object 6 minio.Client.FPutObject minio.Minio.fput_object 7 minio.Client.CopyObject minio.Minio.copy_object 8 minio.Client.StatObject minio.Minio.stat_object

Poznámka: v předchozí tabulce jsou vypsány pouze ty funkce, které jsou skutečně v demonstračních příkladech použity.

6. Vytvoření instance klienta pro připojení k Miniu

Nejprve si ukažme aplikaci, které pouze vytvoří instanci klienta sloužícího pro připojení k Miniu. Jedná se o obdobu prvního demonstračního příkladu z předchozího článku:

from minio import Minio from minio.error import ResponseError endpoint = "127.0.0.1:9000" accessKeyID = "3V8WMANF061SGOIVR7AA" secretAccessKey = "AHTM6+74n1Z8DZRZ4V7o83QcnYRnTEVblVb8sIlE" useSSL = True minioClient = Minio(endpoint, access_key=accessKeyID, secret_key=secretAccessKey, secure=useSSL) print(minioClient)

Po spuštění se pouze zobrazí základní informace o nově vytvořeném objektu, a to bez toho, aby se klient pokoušel o připojení k Miniu:

$ python3 minio1.py <minio.api.Minio object at 0x7fa8955c5550>

7. Nastavení údajů nutných pro připojení k Miniu z příkazového řádku

Předchozí demonstrační příklad náležitě upravíme, a to takovým způsobem, aby se údaje nutné pro připojení do služby Minio získávaly z příkazového řádku. Pro tento účel použijeme standardní balíček argparse, který se však používá odlišným způsobem než balíček flag v jazyce Go:

import argparse from minio import Minio from minio.error import ResponseError parser = argparse.ArgumentParser() parser.add_argument("--endpoint", default="127.0.0.1:9000", help="MinIO service endpoint") parser.add_argument("--accessKeyID", default="", help="Access key ID for MinIO") parser.add_argument("--secretAccessKey", default="", help="Secret access key for MinIO") parser.add_argument("--enable-ssl", dest="useSSL", action="store_true", help="Use SSL for communication with MinIO") parser.add_argument("--disable-ssl", dest="useSSL", action="store_false", help="Don't SSL for communication with MinIO") args = parser.parse_args() minioClient = Minio(args.endpoint, access_key=args.accessKeyID, secret_key=args.secretAccessKey, secure=args.useSSL) print(minioClient)

Opět si můžeme ukázat chování příkladu po jeho spuštění, tentokrát se specifikací všech potřebných údajů:

$ python3 minio2.py --accessKeyID=3V8WMANF061SGOIVR7AA --secretAccessKey=AHTM6+74n1Z8DZRZ4V7o83QcnYRnTEVblVb8sIlE --disable-ssl <minio.api.Minio object at 0x7fec0933c710>

8. Vytištění všech bucketů, které jsou klientovi dostupné

Třetí demonstrační příklad naprogramovaný v Pythonu rozšíříme takovým způsobem, aby se vypsaly všechny buckety, které jsou v Miniu uloženy a jsou dostupné pro zvoleného uživatele (specifikovaného klíčem). Použijeme metodu list_buckets, která vrátí seznam bucketů (chyba je zde hlášena formou výjimky, na rozdíl od Go):

import argparse from minio import Minio from minio.error import ResponseError def list_buckets(minioClient): buckets = minioClient.list_buckets() for bucket in buckets: print(bucket.name, bucket.creation_date) parser = argparse.ArgumentParser() parser.add_argument("--endpoint", default="127.0.0.1:9000", help="MinIO service endpoint") parser.add_argument("--accessKeyID", default="", help="Access key ID for MinIO") parser.add_argument("--secretAccessKey", default="", help="Secret access key for MinIO") parser.add_argument("--enable-ssl", dest="useSSL", action="store_true", help="Use SSL for communication with MinIO") parser.add_argument("--disable-ssl", dest="useSSL", action="store_false", help="Don't SSL for communication with MinIO") args = parser.parse_args() minioClient = Minio(args.endpoint, access_key=args.accessKeyID, secret_key=args.secretAccessKey, secure=args.useSSL) list_buckets(minioClient)

Příklad výstupu pro platné klíče a existující úložiště:

$ python3 minio3.py --accessKeyID=3V8WMANF061SGOIVR7AA --secretAccessKey=AHTM6+74n1Z8DZRZ4V7o83QcnYRnTEVblVb8sIlE --disable-ssl bar 2019-12-14 10:30:57.918000+00:00 foo 2019-12-14 17:13:38.282000+00:00

Chyba v případě, že je zadán neplatný klíč:

$ python3 minio3.py --accessKeyID=3V8WMANF061SGOIVR7AA --secretAccessKey=AHTM6+74n1Z8DZRZ4V7o83QcnYRnTEVblVb8sIl --disable-ssl Traceback (most recent call last): File "minio3.py", line 30, in list_buckets(minioClient) File "minio3.py", line 8, in list_buckets buckets = minioClient.list_buckets() File "/home/ptisnovs/.local/lib/python3.7/site-packages/minio/api.py", line 385, in list_buckets raise ResponseError(response, method).get_exception() minio.error.SignatureDoesNotMatch: SignatureDoesNotMatch: message: The request signature we calculated does not match the signature you provided.

Chyba v případě, že vyžadujeme připojení přes SSL/TSL, ovšem služba je nakonfigurována odlišným způsobem:

$ python3 minio3.py --accessKeyID=3V8WMANF061SGOIVR7AA --secretAccessKey=AHTM6+74n1Z8DZRZ4V7o83QcnYRnTEVblVb8sIlE --enable-ssl Traceback (most recent call last): ... ... ... urllib3.exceptions.MaxRetryError: HTTPSConnectionPool(host='127.0.0.1', port=9000): Max retries exceeded with url: / (Caused by SSLError(SSLError(1, '[SSL: WRONG_VERSION_NUMBER] wrong version number (_ssl.c:866)'),))

9. Zjištění základních informací o objektech uložených do zvoleného bucketu

Další skript je obdobou třetího příkladu z předchozího článku. Po jeho spuštění se vypíšou všechny objekty uložené ve zvoleném bucketu. Pro získání seznamu objektů se používá metoda list_objects objektu typu Minio:

import argparse from minio import Minio from minio.error import ResponseError def list_buckets(minioClient): buckets = minioClient.list_buckets() for bucket in buckets: print(bucket.name, bucket.creation_date) def list_objects(minioClient, bucket): print("List of objects for bucket:", bucket) objects = minioClient.list_objects(bucket, prefix="", recursive=False) for object in objects: print(object.bucket_name, object.last_modified, object.etag, object.size, object.object_name) parser = argparse.ArgumentParser() parser.add_argument("--endpoint", default="127.0.0.1:9000", help="MinIO service endpoint") parser.add_argument("--accessKeyID", default="", help="Access key ID for MinIO") parser.add_argument("--secretAccessKey", default="", help="Secret access key for MinIO") parser.add_argument("--enable-ssl", dest="useSSL", action="store_true", help="Use SSL for communication with MinIO") parser.add_argument("--disable-ssl", dest="useSSL", action="store_false", help="Don't SSL for communication with MinIO") args = parser.parse_args() minioClient = Minio(args.endpoint, access_key=args.accessKeyID, secret_key=args.secretAccessKey, secure=args.useSSL) list_buckets(minioClient) list_objects(minioClient, "foo")

Následuje ukázka, jakým způsobem se informace o objektech vypíšou. Nejprve je vypsáno jméno bucketu, potom čas modifikace objektu, MD5 heš, velikost objektu v bajtech a nakonec i jméno objektu:

$ python3 minio4.py --accessKeyID=3V8WMANF061SGOIVR7AA --secretAccessKey=AHTM6+74n1Z8DZRZ4V7o83QcnYRnTEVblVb8sIlE --disable-ssl bar 2019-12-14 10:30:57.918000+00:00 foo 2019-12-14 17:13:38.282000+00:00 List of objects for bucket: foo foo 2019-12-14 12:01:10.533000+00:00 f95e4a85dafc56313883f8571cfc8143-1 48913 logos.jpg foo 2019-12-14 17:13:38.282000+00:00 f3025fabac6f9648eb6408911379b595-1 1304 minio10.go foo 2019-12-14 17:09:38.517000+00:00 34a37b73d9402b51201f42569f506d4b-1 1304 minio9.go foo 2019-12-14 16:10:38.411000+00:00 f2042bf5780d07253480fb8c64c60850-1 56 t.go

10. Přečtení objektu z Minia a uložení jeho obsahu do souboru

V dalším demonstračním příkladu se setkáme s metodou nazvanou fget_object, která je určena pro přečtení obsahu objektu a jeho uložení do lokálního souboru. Této metodě, která je obdobou Go metody FGetObject, je nutné předat název bucketu, klíč objektu, jméno lokálního souboru a popř. další parametry předané v nepovinných argumentech:

import argparse from minio import Minio from minio.error import ResponseError parser = argparse.ArgumentParser() parser.add_argument("--endpoint", default="127.0.0.1:9000", help="MinIO service endpoint") parser.add_argument("--accessKeyID", default="", help="Access key ID for MinIO") parser.add_argument("--secretAccessKey", default="", help="Secret access key for MinIO") parser.add_argument("--enable-ssl", dest="useSSL", action="store_true", help="Use SSL for communication with MinIO") parser.add_argument("--disable-ssl", dest="useSSL", action="store_false", help="Don't SSL for communication with MinIO") args = parser.parse_args() minioClient = Minio(args.endpoint, access_key=args.accessKeyID, secret_key=args.secretAccessKey, secure=args.useSSL) minioClient.fget_object("foo", "logos.jpg", "logos.jpg")

Po spuštění tohoto příkladu by se měl v aktuálním adresáři objevit soubor se jménem „logos.go“ obsahující šestici log programovacího jazyka Go:

$ python3 minio6.py --accessKeyID=3V8WMANF061SGOIVR7AA --secretAccessKey=AHTM6+74n1Z8DZRZ4V7o83QcnYRnTEVblVb8sIlE --disable-ssl

Pro jistotu se o výsledku přesvědčíme:

$ file logos.jpg logos.jpg: JPEG image data, JFIF standard 1.01, aspect ratio, density 1x1, segment length 16, baseline, precision 8, 1600x878, frames 3

11. Programové přečtení obsahu vybraného objektu

Ve chvíli, kdy je nutné obsah objektu z úložiště přečíst a nějakým způsobem zpracovat, použijeme namísto metody fget_object metodu nazvanou get_object (tedy bez „f“ na začátku). Tato metoda umožňuje, aby se s její návratovou hodnotou pracovalo stejným způsobem, jakoby se jednalo o otevřený soubor:

import argparse from minio import Minio from minio.error import ResponseError def print_object(minioClient, bucket, object_name): try: data = minioClient.get_object(bucket, object_name) for line in data.readlines(): print(line) except ResponseError as err: print(err) parser = argparse.ArgumentParser() parser.add_argument("--endpoint", default="127.0.0.1:9000", help="MinIO service endpoint") parser.add_argument("--accessKeyID", default="", help="Access key ID for MinIO") parser.add_argument("--secretAccessKey", default="", help="Secret access key for MinIO") parser.add_argument("--enable-ssl", dest="useSSL", action="store_true", help="Use SSL for communication with MinIO") parser.add_argument("--disable-ssl", dest="useSSL", action="store_false", help="Don't SSL for communication with MinIO") args = parser.parse_args() minioClient = Minio(args.endpoint, access_key=args.accessKeyID, secret_key=args.secretAccessKey, secure=args.useSSL) print_object(minioClient, "foo", "t.go")

Po spuštění tohoto demonstračního příkladu ovšem zjistíme, že je obsah zpracováván jako pole bajtů, nikoli jako skutečné (Unicode) řetězce:

$ python3 minio7.py --accessKeyID=3V8WMANF061SGOIVR7AA --secretAccessKey=AHTM6+74n1Z8DZRZ4V7o83QcnYRnTEVblVb8sIlE --disable-ssl b'package main

' b'

' b'func main() {

' b'\tprintln(`foo "bar" baz`)

' b'}

'

12. Načtení textového obsahu z vybraného objektu

Ve chvíli, kdy objekt obsahuje textová data, je nutné provést (alespoň v Pythonu 3) jejich dekódování do řetězce, a to konkrétně s využitím metody decode. V případě objektu obsahujícího zdrojové kódy v Go je situace jednoduchá, protože kódování je definitoricky nastaveno na UTF-8:

data = minioClient.get_object(bucket, object_name) for line in data.readlines(): print(line.decode('utf-8')[:-1])

[:-1] zajistíme odstranění konce řádku, neboť ten je tištěn automaticky funkcí print. Poznámka: pomocízajistíme odstranění konce řádku, neboť ten je tištěn automaticky funkcí

Dekódování by mělo zajistit, že se obsah vybraného objektu skutečně zpracuje (zde jen vytiskne) jako sekvence textových řádků a nikoli sekvence polí bajtů:

$ python3 minio7B.py --accessKeyID=3V8WMANF061SGOIVR7AA --secretAccessKey=AHTM6+74n1Z8DZRZ4V7o83QcnYRnTEVblVb8sIlE --disable-ssl package main func main() { println(`foo "bar" baz`) }

Opět se podívejme na kompletní zdrojový kód demonstračního příkladu, který výše popsané dekódování používá:

import argparse from minio import Minio from minio.error import ResponseError def print_object(minioClient, bucket, object_name): try: data = minioClient.get_object(bucket, object_name) for line in data.readlines(): print(line.decode('utf-8')[:-1]) except ResponseError as err: print(err) parser = argparse.ArgumentParser() parser.add_argument("--endpoint", default="127.0.0.1:9000", help="MinIO service endpoint") parser.add_argument("--accessKeyID", default="", help="Access key ID for MinIO") parser.add_argument("--secretAccessKey", default="", help="Secret access key for MinIO") parser.add_argument("--enable-ssl", dest="useSSL", action="store_true", help="Use SSL for communication with MinIO") parser.add_argument("--disable-ssl", dest="useSSL", action="store_false", help="Don't SSL for communication with MinIO") args = parser.parse_args() minioClient = Minio(args.endpoint, access_key=args.accessKeyID, secret_key=args.secretAccessKey, secure=args.useSSL) print_object(minioClient, "foo", "t.go")

13. Uložení obsahu souboru do Minia

V posledním příkladu naprogramovaném v Pythonu použijeme metodu fput_object pro uložení obsahu lokálního souboru do úložiště Minia. V tomto konkrétním případě do Minia pošleme přímo zdrojové kódy spuštěného skriptu:

import argparse from minio import Minio from minio.error import ResponseError parser = argparse.ArgumentParser() parser.add_argument("--endpoint", default="127.0.0.1:9000", help="MinIO service endpoint") parser.add_argument("--accessKeyID", default="", help="Access key ID for MinIO") parser.add_argument("--secretAccessKey", default="", help="Secret access key for MinIO") parser.add_argument("--enable-ssl", dest="useSSL", action="store_true", help="Use SSL for communication with MinIO") parser.add_argument("--disable-ssl", dest="useSSL", action="store_false", help="Don't SSL for communication with MinIO") args = parser.parse_args() minioClient = Minio(args.endpoint, access_key=args.accessKeyID, secret_key=args.secretAccessKey, secure=args.useSSL) minioClient.fput_object("foo", "minio9.py", "minio9.py", content_type="text/plain")

14. Přístupová práva k bucketu

Z webového rozhraní lze nastavit základní přístupová práva k vybranému bucketu:

Obrázek 2: Dvojice bucketů vytvořených v rámci předchozího článku.

Obrázek 3: Dialog pro nastavení přístupových práv k bucketu může být poněkud matoucí. Poslední řádek není ukládán, slouží pro nastavení nových práv.

Obrázek 4: Takto vypadají konkrétně nastavená práva.

Ve skutečnosti jsou ovšem přístupová práva přiřazována pro jednotlivé operace:

PutObject DeleteObject GetBucketLocation ListBucketMultipartUploads AbortMultipartUpload

atd. Tato práva lze nastavit metodou SetBucketPolicy a přečíst metodou GetBucketPolicy, což je téma, kterému se budeme věnovat v navazujících dvou kapitolách.

15. Přečtení informací o přístupových právech k bucketu

Ve třetí části článku se budeme věnovat některým dalším užitečným funkcím a metodám, tentokrát opět při použití klienta resp. aplikace vytvářené v programovacím jazyce Go. Použijeme zde metodu nazvanou GetBucketPolicy, která vrátí informace o přístupových právech k objektům v zadaném bucketu:

package main import ( "flag" "fmt" "github.com/minio/minio-go/v6" "log" ) func printBucketPolicy(minioClient *minio.Client, bucket string) { fmt.Printf("Policy for bucket: %s

", bucket) policy, err := minioClient.GetBucketPolicy(bucket) if err != nil { log.Fatalln(err) } fmt.Println(policy) fmt.Println() } func main() { var endpoint = flag.String("endpoint", "127.0.0.1:9000", "MinIO service endpoint") var accessKeyID = flag.String("accessKeyID", "", "Access key ID for MinIO") var secretAccessKey = flag.String("secretAccessKey", "", "Secret access key for MinIO") var useSSL = flag.Bool("useSSL", false, "Use SSL for communication with MinIO") flag.Parse() // initialize minio client object minioClient, err := minio.New(*endpoint, *accessKeyID, *secretAccessKey, *useSSL) if err != nil { log.Fatalln(err) } // everything seems to be ok log.Printf("%#v

", minioClient) printBucketPolicy(minioClient, "foo") printBucketPolicy(minioClient, "readonly") printBucketPolicy(minioClient, "writeonly") printBucketPolicy(minioClient, "readwrite") }

Po spuštění příkladu se zobrazí informace o bucketem, které jsme vytvořili a nastavili v rámci předchozí kapitoly:

$ ./minio13 -accessKeyID=3V8WMANF061SGOIVR7AA -secretAccessKey=AHTM6+74n1Z8DZRZ4V7o83QcnYRnTEVblVb8sIlE 2019/12/18 09:44:27 &minio.Client{endpointURL:(*url.URL)(0xc000176000), credsProvider:(*credentials.Credentials)(0xc0000b47e0), overrideSignerType:0, appInfo:struct { appName string; appVersion string }{appName:"", appVersion:""}, secure:false, httpClient:(*http.Client)(0xc00009b8c0), bucketLocCache:(*minio.bucketLocationCache)(0xc0000a6780), isTraceEnabled:false, traceErrorsOnly:false, traceOutput:io.Writer(nil), s3AccelerateEndpoint:"", region:"", random:(*rand.Rand)(0xc00009b920), lookup:0} Policy for bucket: foo Policy for bucket: readonly {"Version":"2012-10-17","Statement":[{"Effect":"Allow","Principal":{"AWS":["*"]},"Action":["s3:GetBucketLocation","s3:ListBucket"],"Resource":["arn:aws:s3:::readonly"]},{"Effect":"Allow","Principal":{"AWS":["*"]},"Action":["s3:GetObject"],"Resource":["arn:aws:s3:::readonly/*"]}]} Policy for bucket: writeonly {"Version":"2012-10-17","Statement":[{"Effect":"Allow","Principal":{"AWS":["*"]},"Action":["s3:GetBucketLocation","s3:ListBucketMultipartUploads"],"Resource":["arn:aws:s3:::writeonly"]},{"Effect":"Allow","Principal":{"AWS":["*"]},"Action":["s3:AbortMultipartUpload","s3:DeleteObject","s3:ListMultipartUploadParts","s3:PutObject"],"Resource":["arn:aws:s3:::writeonly/*"]}]} Policy for bucket: readwrite {"Version":"2012-10-17","Statement":[{"Effect":"Allow","Principal":{"AWS":["*"]},"Action":["s3:GetBucketLocation","s3:ListBucket","s3:ListBucketMultipartUploads"],"Resource":["arn:aws:s3:::readwrite"]},{"Effect":"Allow","Principal":{"AWS":["*"]},"Action":["s3:DeleteObject","s3:GetObject","s3:ListMultipartUploadParts","s3:PutObject","s3:AbortMultipartUpload"],"Resource":["arn:aws:s3:::readwrite/*"]}]}

Vidíme, že práva jsou vrácena ve formě řetězce obsahujícího strukturu reprezentovanou v JSONu. Tuto strukturu je výhodné poslat do filtru pro pretty-printing JSONu, aby byly výsledky čitelnější.

Bucket „readonly“:

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Principal": { "AWS": [ "*" ] }, "Action": [ "s3:GetBucketLocation", "s3:ListBucket" ], "Resource": [ "arn:aws:s3:::readonly" ] }, { "Effect": "Allow", "Principal": { "AWS": [ "*" ] }, "Action": [ "s3:GetObject" ], "Resource": [ "arn:aws:s3:::readonly/*" ] } ] }

Bucket „writeonly“:

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Principal": { "AWS": [ "*" ] }, "Action": [ "s3:GetBucketLocation", "s3:ListBucketMultipartUploads" ], "Resource": [ "arn:aws:s3:::writeonly" ] }, { "Effect": "Allow", "Principal": { "AWS": [ "*" ] }, "Action": [ "s3:AbortMultipartUpload", "s3:DeleteObject", "s3:ListMultipartUploadParts", "s3:PutObject" ], "Resource": [ "arn:aws:s3:::writeonly/*" ] } ] }

Bucket „readwrite“:

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Principal": { "AWS": [ "*" ] }, "Action": [ "s3:GetBucketLocation", "s3:ListBucket", "s3:ListBucketMultipartUploads" ], "Resource": [ "arn:aws:s3:::readwrite" ] }, { "Effect": "Allow", "Principal": { "AWS": [ "*" ] }, "Action": [ "s3:DeleteObject", "s3:GetObject", "s3:ListMultipartUploadParts", "s3:PutObject", "s3:AbortMultipartUpload" ], "Resource": [ "arn:aws:s3:::readwrite/*" ] } ] }

Poznámka: povšimněte si, že práva jsou nastavována pro jednotlivé konkrétní operace, nejedná se tedy o pouhé čtení či zápis.

16. Změna přístupových práv k bucketu

Změnu přístupových práv k bucketu na úrovni jednotlivých operací lze realizovat metodou SetBucketPolicy. Této metodě je nutné předat řetězec obsahující validní JSON se specifikací povolených operací. Pro jednoduchost tento JSON vytvoříme skutečně v řetězci, ovšem v praxi je lepší použít marshalling (zajímavé je, že tato operace není přímo podporována v SDK pro Minio v Go):

policyReadOnly := `{"Version": "2012-10-17","Statement": [{"Effect":"Allow","Principal":{"AWS": ["*"]},"Resource": ["arn:aws:s3:::readonly/*"],"Sid": "", "Action":["s3:GetObject","s3:PutObject"]}]}` err = minioClient.SetBucketPolicy("readonly", policyReadOnly) if err != nil { fmt.Println(err) return }

V dalším příkladu je tato možnost ukázána – nastavíme v něm nová práva pro bucket „readonly“, který byl původně určen skutečně pouze pro čtení:

package main import ( "flag" "fmt" "github.com/minio/minio-go/v6" "log" ) func printBucketPolicy(minioClient *minio.Client, bucket string) { fmt.Printf("Policy for bucket: %s

", bucket) policy, err := minioClient.GetBucketPolicy(bucket) if err != nil { log.Fatalln(err) } fmt.Println(policy) fmt.Println() } func main() { var endpoint = flag.String("endpoint", "127.0.0.1:9000", "MinIO service endpoint") var accessKeyID = flag.String("accessKeyID", "", "Access key ID for MinIO") var secretAccessKey = flag.String("secretAccessKey", "", "Secret access key for MinIO") var useSSL = flag.Bool("useSSL", false, "Use SSL for communication with MinIO") flag.Parse() // initialize minio client object minioClient, err := minio.New(*endpoint, *accessKeyID, *secretAccessKey, *useSSL) if err != nil { log.Fatalln(err) } // everything seems to be ok log.Printf("%#v

", minioClient) policyFoo := `{"Version": "2012-10-17","Statement": [{"Effect":"Allow","Principal":{"AWS": ["*"]},"Resource": ["arn:aws:s3:::foo/*"],"Sid": "", "Action":["s3:PutObject"]}]}` err = minioClient.SetBucketPolicy("foo", policyFoo) if err != nil { fmt.Println(err) return } policyReadOnly := `{"Version": "2012-10-17","Statement": [{"Effect":"Allow","Principal":{"AWS": ["*"]},"Resource": ["arn:aws:s3:::readonly/*"],"Sid": "", "Action":["s3:GetObject","s3:PutObject"]}]}` err = minioClient.SetBucketPolicy("readonly", policyReadOnly) if err != nil { fmt.Println(err) return } printBucketPolicy(minioClient, "foo") printBucketPolicy(minioClient, "readonly") printBucketPolicy(minioClient, "writeonly") printBucketPolicy(minioClient, "readwrite") }

Spuštění příkladu:

$ ./minio14 -accessKeyID=3V8WMANF061SGOIVR7AA -secretAccessKey=AHTM6+74n1Z8DZRZ4V7o83QcnYRnTEVblVb8sIlE 2019/12/18 10:09:31 &minio.Client{endpointURL:(*url.URL)(0xc00015a000), credsProvider:(*credentials.Credentials)(0xc00006e840), overrideSignerType:0, appInfo:struct { appName string; appVersion string }{appName:"", appVersion:""}, secure:false, httpClient:(*http.Client)(0xc0000138f0), bucketLocCache:(*minio.bucketLocationCache)(0xc00000e7c0), isTraceEnabled:false, traceErrorsOnly:false, traceOutput:io.Writer(nil), s3AccelerateEndpoint:"", region:"", random:(*rand.Rand)(0xc000013950), lookup:0} Policy for bucket: foo {"Version":"2012-10-17","Statement":[{"Effect":"Allow","Principal":{"AWS":["*"]},"Action":["s3:PutObject"],"Resource":["arn:aws:s3:::foo/*"]}]} Policy for bucket: readonly {"Version":"2012-10-17","Statement":[{"Effect":"Allow","Principal":{"AWS":["*"]},"Action":["s3:PutObject","s3:GetObject"],"Resource":["arn:aws:s3:::readonly/*"]}]} Policy for bucket: writeonly {"Version":"2012-10-17","Statement":[{"Effect":"Allow","Principal":{"AWS":["*"]},"Action":["s3:GetBucketLocation","s3:ListBucketMultipartUploads"],"Resource":["arn:aws:s3:::writeonly"]},{"Effect":"Allow","Principal":{"AWS":["*"]},"Action":["s3:AbortMultipartUpload","s3:DeleteObject","s3:ListMultipartUploadParts","s3:PutObject"],"Resource":["arn:aws:s3:::writeonly/*"]}]} Policy for bucket: readwrite {"Version":"2012-10-17","Statement":[{"Effect":"Allow","Principal":{"AWS":["*"]},"Action":["s3:GetBucketLocation","s3:ListBucket","s3:ListBucketMultipartUploads"],"Resource":["arn:aws:s3:::readwrite"]},{"Effect":"Allow","Principal":{"AWS":["*"]},"Action":["s3:AbortMultipartUpload","s3:DeleteObject","s3:GetObject","s3:ListMultipartUploadParts","s3:PutObject"],"Resource":["arn:aws:s3:::readwrite/*"]}]}

17. Přiřazení verze k objektům, uložení více verzí objektu se stejným jménem

V této kapitole si ukážeme, že některé vlastnosti, které uživatelům nabízí AWS S3, prozatím v Miniu nenajdeme. Ostatně si můžeme ocitovat slova jednoho z vývojářů Minia:

„Amazon keeps introducing new features to stay ahead of others. Minio will instead focus on minimalist design. We only need to implement what we see as a core functionality for object storage. „Core“ is defined as bare essential features to store and retrieve objects.“

Jednou z vlastností, kterou v Miniu nenalezneme, je podpora pro „verzování“ objektů, tj. možnost mít jeden objekt uložený ve více verzích. V Miniu je nutné použít jiný přístup, například:

„Idea of application layer versioning is to show that „versioning“ doesn't belong to the core. Saving newer objects with .1, .2 and so on (or with a timestamp suffix) is a simple idea that applications may do it themselves. I proposed to do it inside Minio library just for convenience.“

Na druhou stranu ovšem SDK pro Go umožňuje verzování povolit, ovšem funkční bude pouze při připojení do AWS S3. V dalším příkladu je jeden objekt uložen v deseti verzích:

package main import ( "flag" "fmt" "github.com/minio/minio-go/v6" "log" ) func createBucket(minioClient *minio.Client, bucket string) { err := minioClient.MakeBucket(bucket, "us-east-1") if err != nil { log.Fatalln(err) } log.Println("New bucket has been created") } func enableVersioning(minioClient *minio.Client, bucket string) { err := minioClient.EnableVersioning(bucket) if err != nil { log.Fatalln(err) } log.Println("Versioning has been enabled") } func uploadFile(minioClient *minio.Client, bucket string, filename string) { length, err := minioClient.FPutObject(bucket, filename, filename, minio.PutObjectOptions{ ContentType: "text/plain;charset=UTF-8", }) if err != nil { fmt.Println(err) return } fmt.Println("Successfully uploaded bytes: ", length) } func main() { var endpoint = flag.String("endpoint", "127.0.0.1:9000", "MinIO service endpoint") var accessKeyID = flag.String("accessKeyID", "", "Access key ID for MinIO") var secretAccessKey = flag.String("secretAccessKey", "", "Secret access key for MinIO") var useSSL = flag.Bool("useSSL", false, "Use SSL for communication with MinIO") flag.Parse() // initialize minio client object minioClient, err := minio.New(*endpoint, *accessKeyID, *secretAccessKey, *useSSL) if err != nil { log.Fatalln(err) } // everything seems to be ok log.Printf("%#v

", minioClient) createBucket(minioClient, "versioned") enableVersioning(minioClient, "versioned") for i := 1; i < 10; i++ { uploadFile(minioClient, "versioned", "minio13.go") } }

18. Konfigurace životního cyklu objektů

Další vlastnost, kterou v Miniu nelze použít, je konfigurace životního cyklu objektů. V AWS S3 je totiž možné určit, po jakou dobu budou objekty v S3 uložené platné. Je tak možné rozlišit například mezi logy, zdrojovými daty pro analýzu AI/ML, skutečná data (například obsah CRM) atd. Pro úplnost si ukažme, jak se takové nastavení může provést. Tentokrát se nepoužívá formát JSON, ale XML:

<LifecycleConfiguration> <Rule> <ID>expire-bucket</ID> <Prefix></Prefix> <Status>Enabled</Status> <Expiration> <Days>` + strconv.Itoa(days) + `</Days> </Expiration> </Rule> </LifecycleConfiguration>`

Celý příklad (nefunkční v Miniu):

package main import ( "flag" "github.com/minio/minio-go/v6" "log" "strconv" ) func createBucket(minioClient *minio.Client, bucket string) { err := minioClient.MakeBucket(bucket, "us-east-1") if err != nil { log.Fatalln(err) } log.Println("New bucket has been created") } func setExpiration(minioClient *minio.Client, bucket string, days int) { rules := ` <LifecycleConfiguration> <Rule> <ID>expire-bucket</ID> <Prefix></Prefix> <Status>Enabled</Status> <Expiration> <Days>` + strconv.Itoa(days) + `</Days> </Expiration> </Rule> </LifecycleConfiguration>` println(rules) err := minioClient.SetBucketLifecycle(bucket, rules) if err != nil { log.Fatalln(err) } log.Println("Expiration has been configured") } func main() { var endpoint = flag.String("endpoint", "127.0.0.1:9000", "MinIO service endpoint") var accessKeyID = flag.String("accessKeyID", "", "Access key ID for MinIO") var secretAccessKey = flag.String("secretAccessKey", "", "Secret access key for MinIO") var useSSL = flag.Bool("useSSL", false, "Use SSL for communication with MinIO") flag.Parse() // initialize minio client object minioClient, err := minio.New(*endpoint, *accessKeyID, *secretAccessKey, *useSSL) if err != nil { log.Fatalln(err) } // everything seems to be ok log.Printf("%#v

", minioClient) //createBucket(minioClient, "temporary") setExpiration(minioClient, "temporary", 1) }

19. Repositář s demonstračními příklady

Zdrojové kódy všech dnes použitých demonstračních příkladů byly uloženy do Git repositáře, který je dostupný na adrese https://github.com/tisnik/go-root (stále na GitHubu :-). V případě, že nebudete chtít klonovat celý repositář (ten je ovšem – alespoň prozatím – velmi malý, dnes má přibližně pět až šest megabajtů), můžete namísto toho použít odkazy na jednotlivé příklady, které naleznete v následující tabulce:

20. Odkazy na Internetu