GNU Awk 5.4.0 vyšel s novým zpracováním regulárních výrazů a rychlejším čtením souborů

Sdílet

Klávesnice světlo ruka Autor: Depositphotos

Byla vydána verze 5.4.0 nástroje GNU Awk (gawk). Jedná se o významnou verzi, která mění výchozí implementaci zpracování regulárních výrazů. Staré enginy regex a DFA zůstávají k dispozici, ale jako výchozí se nyní používá engine MinRX. Tento nový matcher napsal Mike Haertel, původní vývojář nástroje GNU grep. Na rozdíl od původních řešení je MinRX plně kompatibilní s normou POSIX.

Kromě toho je nová verze rychlejší při čtení vstupních souborů z disku. Gawk již u těchto souborů nekontroluje timeouty a u velkých souborů je díky tomu přibližně o 9 % rychlejší. Vylepšeny byly také porty pro Windows a OpenVMS.

Nová verze také mění využití perzistentní paměti, vylepšuje podporu pro vícebajtové znaky s rozšířením ordchr, upravuje chování vzhledem ke specifikaci POSIX 2024 a vylepšuje podporu BSD a možnost sestavení s optimalizacemi  -O3.

Awk je textově orientovaný nástroj a programovací jazyk, určený pro zpracování a analýzu textových souborů a datových proudů v unixových systémech. Pracuje po řádcích, každý řádek rozdělí na pole podle zadaného oddělovače (výchozím je prázdný znak), umožňuje filtrovat řádky podle vzorů, provádět transformace polí, počítat součty či průměry a generovat formátované výstupy.

Našli jste v článku chybu?

Autor zprávičky

Petr Krčmář pracuje jako šéfredaktor serveru Root.cz. Studoval počítače a média, takže je rozpolcen mezi dva obory. Snaží se dělat obojí, jak nejlépe umí.