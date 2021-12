Začnu úvodem o tom, proč svět nástroj jako apkg potřebuje a proč by vás to mohlo zajímat, pokud vyvíjíte software. V druhé půlce článku pak naleznete ukázku použití v praxi.

V textu hojně odkazuji na relevantní sekce oficiální dokumentace (v angličtině), nestyďte se tam nahlédnout v případě nejasností.

Píši o problematice balení poprvé v češtině, takže je na místě definice klíčových pojmů:

Mezi stovkami existujících dister otevřeného softwaru existuje široká škála formátů balíků a také nástrojů pro jejich správu. Z mé zkušenosti jsou v divočině současně nejrozšířenější a nejpoptávanější balíky pro:

Sehnat balík v podporovaném formátu však ještě neznamená, že bude na systému fungovat. Závislosti balíků jsou obvykle generovány pro konkrétní vydání konkrétního distra a tedy není zaručena ani kompatibilita mezi různými verzemi stejného distra, natož mezi různými distry a jejich verzemi.

Distribuce softwaru je komplexní problém a možná i proto je ve světě otevřeného software zvykem delegovat ji na specializované baliče. Každé linuxové distro má jinou politiku, procesy, zvyklosti a nástroje a z nich vyplývající zážitek pro své přispěvatele a uživatele.

Univerzální je však oddělení vývoje softwaru od jeho distribuce/balení. Zdrojové soubory pro tvorbu distribučních balíků žijí odděleně od zdrojů projektu. Práce vývojářů obvykle končí s vydáním nové verze a o tvorbu balíků se starají neopěvovaní hrdinové komunit jednotlivých dister.

Tento distribuovaný komunitní systém má své výhody i nevýhody. Zřejmou výhodou je efektivní dělba práce – vývojáři nemusí připravovat balíky pro stovky různých systémů přičemž každý z nich má svá specifika a temná zákoutí, ve kterých zkušený balič už umí chodit, ale neznalý vývojář je odsouzen k mnoha hodinám zbytečného utrpení. Pro uživatele je nejjednodušší získat software z oficiálních distribučních repozitářů a je zaručena určitá míra kompatibility s ostatními balíky v rámci distra.

Mezi nevýhody patří ztráta kontroly nad celým aspektem distribuce softwaru. Konzervativní distra jako Debian stable mají striktní pravidla, která omezují možnosti aktualizace balíků na novější verze. To může být problematické pro projekty s velkou kadencí vydání nebo pro projekty závisející na nových verzích závislostí, které ještě nejsou dostupné.

Různé politiky dister mohou vést k nekonzistencím mezi balíky stejného projektu napříč distry, například na Debianu je zvykem služby v balíku standardně povolit, na Fedoře jsou obvykle zakázané.

Nezávislí baliči obvykle nemají tak hlubokou znalost baleného softwaru jako vývojáři, což může vést k suboptimálním balíkům a chování v rozporu se záměry upstreamu.

Dle mého názoru také často dochází k nezdravému oddělení vývojářů od reálných zážitků uživatelů s jejich softwaru. V ideálním případě funguje komunikace mezi baliči a vývojáři směrem k lepšímu uživatelskému zážitku, ale to nelze zaručit, takže často žijí balíky svým vlastním životem a nebo naopak nežijí vůbec.

Jak jsem nastínil výše, existuje mnoho dobrých důvodů, proč nedelegovat veškeré balení na distro baliče a místo toho ho zahrnout do upstream vývojoveho procesu.

Upstream balíky mohou posloužit uživatelům na distrech, kde nejsou oficiální balíky dostupné nebo jsou ve starých verzích. Tvorba a instalace balíků na různých systémech může být zahrnuta v CI projektu, což umožní odchytit problémy před vydáním. Vývojáři mají plnou kontrolu nad upstream balíky a jejich repozitáři.

U nových projektů dává smysl začít upstream balíky a postupně je dostat do dister, což může trvat delší dobu. U starších projektů v distrech jsou zase upstream balíky způsob, jak poskytnout uživatelům nejnovější verze nezávisle na politikách a cyklech jednotlivých dister.

Na rozdíl od zdrojových kódů distro balíků, které bydlí v oddělených repozitářích, nic nebrání zahrnutí zdrojů upstream balíku přímo do zdrojového kódu projektu. Neexistuje však jednotný standard ani adekvátní nástroje, a tak to každý projekt řeší po svém.

V divočině můžeme vidět zdroje balíků různě rozmístěné v projektech, často v adresářích jako debian/ či rpm/ a obvykle doplněné kontroverzními skripty pro sestavení balíku. Zážitek neznalé osoby s tímto chaosem může být až traumatický.

apkg vzniklo jako chybějící dílek skládačky upstream balení. Cílem je schopnost postavit kdykoliv balíky projektu pro konkrétní distro přímo ze zdrojů jedním příkazem.

apkg zavádí jednoduché konvence ohledně umístění zdrojů balíků v rámci projektu a poskytuje jednotné minimální rozhraní k balícím nástrojům podporovaných dister. Ve výsledku pak stačí ve zdrojích projektu zavolat apkg build a výsledkem jsou balíky projektu pro detekovaný systém.

Zvolené konvence jsou souborem dobrých zvyklostí z balící praxe spojených dohromady s cílem automatizovaného a konzistentního procesu tvorby upstream balíků. Zásadní vliv měly projekty Knot Resolver a Knot DNS, které už před nasazením apkg stavěly upstream balíky přímo ze zdrojů pro širokou škálu dister.

apkg lze plnohodnotně používat jak interaktivně z terminálu, tak v rámci CI/CD systémů, ať už jako příkaz ve skriptech nebo jako python modul. apkg CI průběžně testuje funkčnost apkg na 5 různých projektech napříč 11 distry.

Důležité: apkg negeneruje zdrojové soubory balíků ani je automaticky nemodifikuje – tato práce je stejně jako v případě distro balíků zodpovědností baličů.

Více se můžete dočíst v dokumentaci, je čas se podívat, jak to vypadá v praxi.

Pro demonstraci použiji projekt libyang, protože má málo závislostí a kompiluje se rychle, ale proces je univerzální a můžete ho aplikovat na kterýkoliv z projektů, které používají apkg .

Pokud si chcete apkg vyzkoušet, nastartuje systém založený na Debianu ( .deb balíky) nebo Fedoře ( .rpm balíky). Můžete použít váš vývojový systém, pokud vám nevadí balící závislosti a nebo virtuální stroj či kontejner dle libosti.

apkg je momentálně zhruba po roce vývoje v BETA fázi, kdy ho první projekty používají v produkci, ale vývoj je stále svižný, takže než dospěje, je oficiální cestou instalace PyPI:

Více možností instalace naleznete v dokumentaci.

Jednorázově nainstalujeme balící závislosti:

Seženeme si zdrojové kódy projektu a dostavíme se do jeho kořenového adresáře:

Všechny další apkg příkazy spouštíme v kořenovém adresáři projektu.

Je čas zjistit, co si o tom myslí apkg :

Ve výstupu vidíme:

Když spustíme apkg status ve stejném adresáři na Fedora 34 systému, vidíme změnu v detekovném distru a z toho vyplývající jiný zvolený balící styl a šablonu:

apkg podporuje také Arch, ale libyang pro něj neobsahuje balící šablonu (obvykle distro/pkg/arch ):

distro/ adresář je konvencí vstupní adresář apkg , do kterého nikdy nezasahuje.

distro/config adresář obsahuje jediný konfigurační soubor

apkg.toml , který odkazuje na skripty v distro/scripts :

Tyto skripty jsou volitelné a mohou bydlet i mimo distro adresář.

Každý adresář v distro/pkg je konvencí šablona balíku – zdrojové soubory balíku pro určitý balící styl šablonované pomocí univerzálního jinja šablonovacího systému, který poskytuje extra flexibilitu potřebnou pro automatizaci.

Zdrojové soubory v šablonách jsou stejné jako ve zdrojích oficiálních distro balíků, jen s extra možností šablonování jako například náhrada {{ version }} aktuální verzí balíku atd.

distro/pkg/deb šablona obsahuje zdrojové soubory pro vytvoření balíku na Debianu a klonech.

distro/pkg/rpm šablona obsahuje zdrojové soubory pro vytvoření balíku na RPM systémech (Fedora a její klony).

Bez dalšího otálení nainstalujeme závislosti pro sestavení balíku. Potřebujeme mít zprovozněné sudo a nebo být root :

To samé na Fedoře:

Tento krok lze vykonat také v rámci příkazů build a install pomocí přepínače -b/--build-dep pro maximální pohodlí.

Závislosti lze také pouze vypsat bez instalace přepínačem -l/--list a zpracovat dle uvážení:

Konečně je čas sestavit balíky pomocí hlavního příkazu apkg build !

Stejný příkaz ve stejném adresáři na Fedoře:

Zde si kromě změn kvůli jinému distru můžete všimnout odchylky v podobě:

apkg zjistilo, že se stav projektu nezměnil od minula a není tedy třeba znova vyvářet zdrojový archiv, místo toho přepoužilo ten vytvořený v rámci předchozího buildu na Debianu.

Když spustíme stejný příkaz znova beze změn v projektu, apkg prostě přepoužije předchozí výstupy:

Cache lze vypnout přepínačem –no-cache .

Adresář pkg/ je výstupní adresář apkg, který obsahuje veškerý výstup – archivy, zdrojové balíky, balíky a všechno mezi. Tento adresář můžete kdykoliv bez obav smazat.

Více o struktuře výstupního adresáře se můžete dočíst v dokumentaci.

apkg umožňuje výsledné balíky nainstalovat, což se hodí zejména v rámci testování:

apkg opět přepoužilo už postavené balíky. Kdyby nebyly dostupné, postavilo by je pomocí apkg build .

Tím se dostáváme k hierarchii apkg příkazů (převzato z dokumentace):

apkg packaging workflow +------------------------------+ +------------------------------------+ | | | | | $ apkg make-archive | | $ apkg get-archive [-v 1.2.3] | | | | | | in: current project state | OR | in: archive hosted online | | | | | | out: pkg/archives/dev/*.xz | | out: pkg/archives/upstream/*.xz | | | | | +---------------+--------------+ +----------------+-------------------+ | | | | | | v v +----------+------------------------------------+-------------+ | | | $ apkg srcpkg | | | | in: distro/pkg/$TEMPLATE/ (package template) | | pkg/archives/*/*.xz (archive) | | | | out: pkg/srcpkgs/$DISTRO/$SRCPKG (source package) | | pkg/build/srcpkgs/$DISTRO/$SRCPKG/ (build dir) | | | +------------------------------+------------------------------+ | | | v +------------------------------+------------------------------+ | | | $ apkg build | | | | in: pkg/srcpkgs/$DISTRO/$SRCPKG (source package) | | | | out: pkg/pkgs/$DISTRO/$PKG (package) | | pkg/build/pkgs/$DISTRO/$PKG (build dir) | | | +-------------------------------------------------------------+