Hlavní navigace

Novinky v jazyce Python 3.0

Adam Štrauch

Změny provedené v Pythonu 3.0 oproti řadě 2.x jsou víc než velké. Zpětná kompatibilita byla částečně potlačena, byly protlačeny dlouho plánované funkce a některé se nyní chovají jinak. Některé kroky jsou vítané, jiné ne. Pojďme se tedy podívat na co si dát při programování a upravování starého kódu pozor.

Ukázky kódu jsou vždy pro Python 3.0. Pokud je kód pro verzi 2.5, tak k těmto ukázkám dávám poznámku o verzi.

Print je mrtev, ať žije print()

Nejdiskutovanější změnou je patrně zrušení jazykového konstruktu print a jeho nahrazení funkcí print(). Je to změna, která nám patrně zabere nejméně času.

>>> print "ahoj"
  File "<stdin>", line 1
     print "ahoj"
                ^
SyntaxError: invalid syntax
>>> print("ahoj")
ahoj 

Jako funkce nám print přináší i zajímavé maličkosti, které umí potěšit:

>>> import sys
>>> print("Chybka",file=sys.stderr)
Chybka
>>> print(1,2,3,4,5,sep="|",end=";\n")
1|2|3|4|5; 

Integer a float

Vítanou změnou, která také nebude tou náročnější, je prakticky zrušení limitů na velikost čísla. Z objektu long se stává int a tím pádem je v Pythonu pouze jeden celočíselný typ.

Python 2.5:
>>> long
<type 'long'>
>>> int
<type 'int'>

Python 3.0:
>>> long
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
NameError: name 'long' is not defined
>>> int
<class 'int'> 

Práce s typem float je teď o něco chytřejší, než bývala. V 2.x Pythonech použití 1/2 vracelo int a 3.0 konečně vrací float.

Python 2.5
>>> type(1/2)
<type 'int'>

Python 3.0:
>>> type(1/2)
<class 'float'> 

Příznivcům starého chování stačí doplnit jedno lomítko navíc.

>>> type(1//2)
<class 'int'> 

Pohledy a iterátory

Některé funkce vracející v minulých verzích list, už tak dále nedělají a vrací tzv. pohledy neboli „views“. Pohled je iterovatelný objekt a lze ho používat stejně jako list.

>>> d = {"a":1,"b":2,"c":3}
>>> for x in d.keys():
...     print(x)
...
a
c
b 

V tomto případě metoda keys() vrací pohled a při zpracování cyklem se při použití prakticky nic nemění. Problém může nastat v případě, kdy potřebujeme něčemu předat list a máme pouze pohled. V tom případě to můžeme udělat třeba takto:

l = [x for x in d.keys()] 

Tento problém se projeví například hned, jak chceme pořadí první otočit:

>>> d.keys().reverse()
>>> for x in d:
...     print(x)
...
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
AttributeError: 'dict_keys' object has no attribute 'reverse' 

Jedno možné řešení:

>>> l = [x for x in d.keys()]
>>> l
['a', 'c', 'b']
>>> l.reverse()
>>> l
['b', 'c', 'a'] 

Funkce map() a filter() vrací místo listu tzv. iterátory. Funkčně se iterátory liší od pohledů tím, že po získání jedné hodnoty tuto hodnotu již nemůžeme získat znovu. Na konci je iterátor prázdný.

>>> def myfce(v):
...     return v**2
...
>>> i = map(myfce,[1,2,3])
>>> [x for x in i]
[1, 4, 9]
>>> [x for x in i]
[] 

Porovnávání

Operátory <, <=, > a >= se na rozdíl od nové verze chovají „více logicky“. Už není možné požadovat po Pythonu třeba:

Python 2.5:
>>> 1 < ''
True
>>> 1 > ''
False 

Po zavolání něčeho podobného v nové verzi nám Python vrátí výjimku:

Python 3.0:
>>> 1 < ''
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: unorderable types: int() < str()
>>> 1 > ""
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: unorderable types: int() > str() 

S tím souvisí o porovnávání ve funkcích sort() a sorted(). Ty nadále nedisponují argumentem cmp, kterým jim můžeme předat ukazatel na porovnávací funkci, ale mají tzv. klíč. Seřazení s ohledem na velikost písmen pak uděláme takto:

>>> s = ["abc","ABC","BcF","RGdd","aAaA"]
>>> s
['abc', 'ABC', 'BcF', 'RGdd', 'aAaA']
>>> s.sort(key=str.lower)
>>> s
['aAaA', 'abc', 'ABC', 'BcF', 'RGdd']
>>> s.sort()
>>> s
['ABC', 'BcF', 'RGdd', 'aAaA', 'abc'] 

Text vs. data

Python 3.0 používá ve všech textech unicode. Cokoli co není unicode, je označováno za data a je reprezentováno typem bytes. Unicode je teď reprezentován typem str.

>>> type("aa")
<class 'str'>
>>> type("aa".encode("cp1250"))
<class 'bytes'> 

Problém může nastat v situacích, kdy chceme z nějakého důvodu míchat typy str a bytes. V takovém případě Python 3.0 vrátí výjimku TypeError.

V Pythonu 2.x se unicode řetězce vytvářely přes funkci unicode(). Ta v 3.0 není k dipozici. S touto funkcí také zmizel zápis u"text". Pro změnu b"text" budeme používat pro zápis binárních resp. osmibitových dat.

>>> type(b"text")
<class 'bytes'>
>>> type("text")
<class 'str'> 

Vytváření neunicodových řetězců je možné i pomocí funkce bytes, které můžeme dát jako parametr cílovou znakovou sadu.

>>> bytes("čř",encoding="cp1250")
b'\xe8\xf8' 

Převod mezi znakovými sadami je podobný jako v Pythonu 2.x. Z unicodu do osmibitu a zase zpět:

>>> "ěščřž".encode("iso-8859-2")
b'\xec\xb9\xe8\xf8\xbe'
>>> "ěščřž".encode("iso-8859-2").decode("iso-8859-2")
'ěščřž' 

Pro ukládání dat do binárních souborů se používá typ bytes, pro textové se výstup převádí na výchozí znakovou sadu (v mém případě utf8).

>>> f = open("test","w")
>>> f.write("ěščř")
4
>>> f.close()
>>> f = open("test")
>>> f.read()
'ěščř'
>>> f.close() 

Zápis binárních dat vyžaduje typ bytes.

>>> f = open("test","wb")
>>> f.write("ěščř")
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/usr/local/lib/python3.0/io.py", line 1035, in write
raise TypeError("can't write str to binary stream")
TypeError: can't write str to binary stream 

Ukládáme data jako konkrétní znakovou sadu.

>>> f.write("ěščř".encode("cp1250"))
4
>>> f.close(
... )
>>> f = open("test","rb")
>>> f.read()
b'\xec\x9a\xe8\xf8'
>>> f.close() 

A po načtení je převedeme zpátky.

>>> f = open("test","rb")
>>> f.read().decode("cp1250")
'ěščř'
>>> f.close() 

Funkce open() má také argument encoding, kde můžeme konkretizovat znakovou sadu, ve které bude soubor uložen.

>>> f = open("test","w",encoding="iso-8859-2")
>>> f.write("ěščř")
4
>>> f.close()
>>> f = open("test",encoding="iso-8859-2")
>>> f.read()
'ěščř'
>>> f.close() 

Závěr

Novinek a nekompatibilit je mnoho. Podpora Pythonu 2.6 tu ještě nějaký čas bude a myslím si, že zavedením nekompatibilit se jazyk posunul zas o nějaký kus dopředu. Nic nelze navrhnout správně již od začátku a díky těmto změnám Python jen tak nezestárne a nebude nahrazen jazykem, který by jeho neduhy opravoval. Programátoři velkých aplikací postavených na Pythonu budou mít v příštích měsících případně letech co dělat, aby vychytali všechny problémy. Ty se budou lišit aplikace od aplikace, protože ne vždy musí být použit právě postižený kus kódu.

Příště se podíváme na další novinky a zkusíme si převod aplikace z Pythonu 2.x na Python 3.0 pomocí nástroje 2to3.

Odkazy

Našli jste v článku chybu?

8. 12. 2008 8:51

Jan Švec (neregistrovaný)
Dobrý den pane Štrauchu,
se zájmem jsem přečetl váš článek a v ničem mě nepřekvapil - přesně jak jsem čekal je psaný horkou jehlou. Nechci vám sahat do svědomí, ale chtěl bych vědět, proč pro vytvoření seznamu z iterátoru neustále používáte konstrukci l=[x for x in iterable]? Není lepší zapsat l=list(iterable)?

Další naprosto fatální chyba - ukázka práce s dictionary (slovníky). Zkoušel jste si onen příklad s for x in d.keys().reverse(): v Pythonu 2.x? Pravděpodobně ne, protože byste zjistil…


8. 12. 2008 9:44

František Jahoda (neregistrovaný)
Pane Švec,
Ve většině svých poznámek máte pravdu, ale v jedné věci se ve své horlivé kritice mýlíte.
Typ bytes je v pythonu 3.0 neměnitelný (immutable).

zdroj: http://docs.python.org/3.0/whatsnew/3.0.html
Like str, the bytes type is immutable. There is a separate mutable type to hold buffered binary data, bytearray. Nearly all APIs that accept bytes also accept bytearray. The mutable API is based on collections.MutableSequence.

Domnívám se, že i kritiku lze napsat mírnějším tónem a veřejně nep…






DigiZone.cz: TV Philips a Android verze 6.0

TV Philips a Android verze 6.0

Podnikatel.cz: K EET. Štamgast už peníze na stole nenechá

K EET. Štamgast už peníze na stole nenechá

Lupa.cz: Kdo pochopí vtip, může jít do ČT vyvíjet weby

Kdo pochopí vtip, může jít do ČT vyvíjet weby

Měšec.cz: Air Bank zruší TOP3 garanci a zdražuje kurzy

Air Bank zruší TOP3 garanci a zdražuje kurzy

Podnikatel.cz: Změny v cestovních náhradách 2017

Změny v cestovních náhradách 2017

Podnikatel.cz: Chtějte údaje k dani z nemovitostí do mailu

Chtějte údaje k dani z nemovitostí do mailu

Vitalia.cz: Potvrzeno: Pobyt v lese je skvělý na imunitu

Potvrzeno: Pobyt v lese je skvělý na imunitu

Root.cz: Certifikáty zadarmo jsou horší než za peníze?

Certifikáty zadarmo jsou horší než za peníze?

Měšec.cz: U levneELEKTRO.cz už reklamaci nevyřídíte

U levneELEKTRO.cz už reklamaci nevyřídíte

Podnikatel.cz: Udávání a účtenková loterie, hloupá komedie

Udávání a účtenková loterie, hloupá komedie

Lupa.cz: Insolvenční řízení kvůli cookies? Vítejte v ČR

Insolvenční řízení kvůli cookies? Vítejte v ČR

Vitalia.cz: Proč vás každý zubař posílá na dentální hygienu

Proč vás každý zubař posílá na dentální hygienu

Lupa.cz: Proč firmy málo chrání data? Chovají se logicky

Proč firmy málo chrání data? Chovají se logicky

Vitalia.cz: Když přijdete o oko, přijdete na rok o řidičák

Když přijdete o oko, přijdete na rok o řidičák

Vitalia.cz: Mondelez stahuje rizikovou čokoládu Milka

Mondelez stahuje rizikovou čokoládu Milka

120na80.cz: Pánové, pečujte o svoje přirození a prostatu

Pánové, pečujte o svoje přirození a prostatu

120na80.cz: Horní cesty dýchací. Zkuste fytofarmaka

Horní cesty dýchací. Zkuste fytofarmaka

Vitalia.cz: Láska na vozíku: Přitažliví jsme pro tzv. pečovatelky

Láska na vozíku: Přitažliví jsme pro tzv. pečovatelky

Lupa.cz: Propustili je z Avastu, už po nich sahá ESET

Propustili je z Avastu, už po nich sahá ESET

Podnikatel.cz: Udávání kvůli EET začalo

Udávání kvůli EET začalo