Úvod
Každý programovací jazyk má vestavěné datové typy, včetně Pythonu. Datové typy poskytují informace o různých druzích proměnných a určují tok programování. Jiné knihovny často vytvářejí své datové typy, jako jsou DataFrames v Pandas.
Výběr správného datového typu závisí na daném problému. Nejlepší je začít tím, že se seznámíte se základními typy dat Pythonu a jejich případy použití.
Zjistěte o různých typech dat Pythonu a o tom, kdy je použít, prostřednictvím příkladů v tomto kurzu.
Základní datové typy v Pythonu
Datový typ je charakteristika, která říká kompilátoru (nebo interpretu), jak programátor zamýšlí data použít. Existují dvě obecné kategorie datových typů, které se liší tím, zda jsou data po definici měnitelná:
1. Neměnný . Datové typy, které nelze po přiřazení změnit.
2. Proměnlivé . Datové typy, které lze po přiřazení změnit.
Proměnné ukládají různé typy dat. Vytvořením proměnné určitého datového typu se vytvoří objekt třídy datového typu. Interpret Pythonu automaticky předpokládá typ při vytváření proměnné.
Datový typ libovolného objektu lze nalézt pomocí vestavěného type()
funkce. Výstup zobrazuje název třídy pro daný objekt.
Číselný typ
Objekty číselného typu představují číselné hodnoty. Jsou rozděleny do tří podskupin:
- Celá čísla
- Čísla s plovoucí desetinnou čárkou
- Komplexní čísla
Celá čísla
Celočíselné hodnoty patří do int třída. Konkrétně celá čísla představují kladná nebo záporná celá čísla bez desetinného místa. Některé příklady celých čísel zahrnují:
print(0, "is", type(0))
print(-1, "is", type(-1))
print(10, "is", type(10))
print(1234567890, "is", type(1234567890))
Celá čísla mají neomezenou přesnost. Mezi dlouhými a krátkými čísly není žádný rozdíl. Délka závisí na paměti počítače:
very_long = 1234567890123456789012345678901234567890123456789012345678901234567890123456789012345678901234567890
print("Long numbers are type", type(very_long), ", such as this one:", very_long)
Binární, osmičkové a hexadecimální číselné základy se také vyhodnocují jako celá čísla:
print(0b1010, "in base 2 is 1010 and the type is ", type(0b1010))
print(0o12, "in base 8 is 12 and the type is ", type(0o12))
print(0xA, "in base 16 is A and the type is ", type(0xA))
Tisk hodnot se automaticky převede na jejich základních deset.
Čísla s plovoucí desetinnou čárkou
Čísla s plovoucí desetinnou čárkou v Pythonu jsou čísla definovaná s desetinnou čárkou. Typ třídy je plovoucí . Například:
print(0.1, "is", type(0.1))
print(-1.0, "is", type(-1.0))
print(10., "is", type(10.))
print(123.4567890, "is", type(123.4567890))
Interně jsou to binární zlomky, což znamená, že číslo se blíží desetinnému protějšku. Rozdíl mezi skutečnou a přibližnou hodnotou je často nepostřehnutelný. Zaokrouhlením hodnoty získáte přesné číslo. Například:
Případně číslo se znakem E následované číslem označuje vědecký zápis:
print(1E2, "is", type(1E2))
print(1e2, "is", type(1e2))
Do třídy čísel s plovoucí desetinnou čárkou patří také vědecký zápis. Syntaxe přijímá obě malá písmena e stejně jako velká písmena E .
Čísla s plovoucí desetinnou čárkou po 1,79×10 jsou vyhodnocena do nekonečna. Nejmenší nenulové číslo je 5,0×10. Menší čísla se vyhodnotí na nulu:
Hodnoty odpovídají 64bitovým hodnotám s dvojitou přesností.
Komplexní čísla
V matematických vědách se často používají komplexní čísla. Python poskytuje třídu pro komplexní čísla nazývanou komplexní . Chcete-li psát komplexní čísla, použijte:
<real part> + <complex part>j
Případně můžete vynechat skutečnou část:
<complex part>j
Například:
print(1+2j, "is", type(1 + 2j))
print(2j, "is", type(2j))
Výstup ukazuje, že data patří do komplexu třída.
Typ sekvence
Sekvenční typy pomáhají reprezentovat sekvenční data uložená do jedné proměnné. V Pythonu se používají tři typy sekvencí:
- Řetězec
- Seznam
- Nice
Jednotlivé typy sekvencí se od sebe liší, pokud jde o proměnlivost a pořadí.
Řetězce
Řetězce jsou sekvence bajtů představující znaky Unicode. Typ řetězce v Pythonu se nazývá str .
Vytvořte řetězec
V závislosti na případu použití a potřebných znacích existují čtyři různé způsoby, jak vytvořit řetězec. Liší se podle oddělovačů a toho, zda je řetězec jednořádkový nebo víceřádkový.
1. Vytvořte řetězec pomocí dvojitých oddělovačů uvozovek :
print("This is a string with 'single' quotes delimited by double quotes")
Řetězec oddělený dvojitými uvozovkami je užitečný pro řetězce obsahující jednoduché uvozovky nebo apostrofy. Případně můžete použít znaky escape:
print("Thanks to the \"\\\" character, we can use double quotes inside double quote delimiters")
Příklad navíc ukazuje, jak zobrazit znak zpětného lomítka v řetězci.
2. Vytvořte řetězec pomocí oddělovačů v jednoduchých uvozovkách :
print('This is a string with "double" quotes delimited by single quotes')
Řetězce Pythonu oddělené jednoduchými uvozovkami jsou platné, pokud řetězec obsahuje dvojité uvozovky. Dalším způsobem je použití únikových znaků. Například:
print('Thanks to the \'\\\' character, we can use single quotes inside single quote delimiters')
Existují dva způsoby, jak oddělit víceřádkový řetězec.
a) Vytvořte víceřádkový řetězec pomocí trojitých oddělovačů jednoduchých uvozovek :
print('''This is a multiline string
with 'single', "double" and """triple-double""" quotes
delimited with triple single quotes''')
Pomocí trojitých jednoduchých uvozovek oddělte řetězec, pokud obsahuje jednoduché, dvojité, trojité dvojité uvozovky nebo končí dvojitými uvozovkami.
b) Vytvořte řetězec pomocí trojitých dvojitých oddělovačů :
print("""'This is a multiline string
with 'single', "double" and ```triple single``` quotes
delimited with triple double quotes'""")
Použijte oddělovač trojitých dvojitých uvozovek pro řetězce obsahující jednoduché, dvojité, trojité uvozovky nebo řetězce končící jednou uvozovkou.
Přístup k prvkům řetězce
Řetězce v Pythonu jsou pole znaků. Pro přístup k jednotlivým prvkům použijte indexování:
s = "phoenixNap"
s[0], s[2], s[-1]
Pro přístup k částem řetězce použijte slicing:
print(s[0:7])
print(s[-3:])
Přístup k prvnímu prvku na indexu 0. Počítání zpět od -1 přistupuje na konec sekvence.
Protože řetězce jsou pole, můžete procházet všechny znaky pomocí for smyčka:
for letter in s:
print(letter)
Kód vytiskne všechna písmena řetězce jedno po druhém.
Seznamy
Pythonský seznam je uspořádané měnitelné pole. Seznamy umožňují duplicitní prvky bez ohledu na jejich typ. Přidání nebo odebrání členů ze seznamu umožňuje změny po vytvoření.
Vytvořit seznam
Vytvořte seznam v Pythonu pomocí hranatých závorek , jednotlivé prvky oddělujte čárkou:
A = [1, 2, "Bob", 3.4]
print(A, "is", type(A))
Vytvořte vnořený seznam přidáním seznamu do seznamu:
B = [A, 2, 3, 4]
print(B, "is", type(B))
Vzhledem k tomu, že seznamy Pythonu jsou měnitelné, umožňují vytvářet prázdné seznamy a později přidávat prvky, stejně jako přidávat nebo odebírat členy do existujícího seznamu.
Přístup k prvkům seznamu
Seznamy jsou posloupností prvků. Získejte přístup k členům pomocí zápisu indexování, kde první prvek je na indexu 0:
A[0], A[3], A[1]
Rozdělení seznamu vrátí všechny prvky mezi dva indexy:
A[0:2]
Možné jsou i záporné indexy:
A[-1]
-1 index vytiskne poslední prvek v seznamu. Negativní indexování je zvláště užitečné pro navigaci na konec dlouhého seznamu členů.
Nice
Python N-tice jsou pole neměnných uspořádaných prvků. Jakmile je n-tice uložena do proměnné, nelze členy přidávat ani odebírat. N-tice umožňuje duplikovat členy jakéhokoli typu.
Vytvořit tuple
K vytvoření n-tice použijte standardní kulaté závorky, oddělující jednotlivé prvky čárkou:
t = ("bare", "metal", "cloud", 2.0, "cloud")
print(t, "is", type(t))
Vytvořte vnořenou n-tici přidáním n-tice do n-tice:
c = (t, "computing")
print(c, "is still", type(t))
Chcete-li vytvořit n-tici s jedním prvkem, použijte za prvním prvkem čárku:
p = ("phoenixNap")
n = ("phoenixNap",)
print("p is", type(p), "whereas n is", type(n))
Bez čárky je proměnná řetězec.
Vytvořte prázdnou n-tici pomocí kulatých závorek bez prvků. Ačkoli se to zdá nadbytečné, protože n-tice jsou neměnné, prázdná n-tice pomáhá v určitých případech použití indikovat nedostatek dat.
Přístup k prvkům tuple
N-tice podporují zápis indexování. K jednotlivým prvkům přistupujte pomocí hranatých závorek a indexu prvku:
t[0], t[1], t[-1]
Negativní indexování umožňuje přístup k prvkům na konci seznamu.
Pro přístup k částem n-tice použijte zápis dělení:
t[2:4]
Výstup zobrazuje třetí a čtvrtý prvek n-tice.
Booleovský typ
Booleovské datové typy patří do bool třídy a určit pravdivostní hodnotu výrazů. Objekty typu Boolean se vyhodnotí buď jako True nebo Nepravda :
print(type(True))
print(type(False))
Booleovské hodnoty jsou podtypem celočíselných hodnot. Kontrola pravdivostní hodnoty celých čísel 1 a 0 pomocí True a False vrátí hodnotu true v obou případech:
print(True == 1)
print(False == 0)
Datový typ hodnot je odlišný. True a False jsou oba booleovské typy, zatímco 1 a 0 jsou celočíselné typy.
Nastavit typ
Datový typ Set je součástí set třída. Ukládá kolekce dat do jedné proměnné. Sady jsou neuspořádané a neumožňují přístup k jednotlivým prvkům pomocí indexování. Jakékoli duplicitní hodnoty jsou ignorovány.
Chcete-li vytvořit sadu, použijte zápis ve složených závorkách a jednotlivé prvky oddělte čárkou:
s = {1, 2, 3, 3, 3, 4}
print(s, "is", type(s))
Všimněte si, že několik instancí dat zmizí.
Typ mapování
Mapovací datový typ je reprezentován slovníkem Pythonu. Slovník je sbírka dat s páry klíčů a hodnot patřících do diktátu třída.
Chcete-li vytvořit slovník, použijte notaci složených závorek a definujte páry klíč-hodnota. Například:
d = {"articles":10,
"cost":2.2,
True:"Okay!",
2:"One"}
print(d, "is", type(d))
Páry klíč a hodnota přijímají jakýkoli datový typ. Pro přístup k hodnotě ve slovníku použijte klíč jako index:
print("The cost is:", d["cost"])
Slovníky se hodí při ukládání propojených datových párů.
Správa datových typů v Pythonu
Při psaní dlouhých a složitých programů se správa různých datových typů stává zásadním aspektem řešení problémů s programováním. Je nemožné bezchybně předvídat potřebný datový typ. Pro programování je však nezbytné vědět, jak zkontrolovat nebo změnit typ dat.
Zkontrolujte typ dat
Každá proměnná má datový typ, který se kontroluje pomocí vestavěné funkce type() :
print(type(1))
print(type(1.))
print(type(1+0j))
print(type("1"))
print(type([1]))
print(type((1,)))
print(type({1}))
print(type({1:1}))
Výše uvedený příklad ukazuje několik způsobů, jak zapsat číslo 1 pomocí různých datových typů. Funkce type() funguje také s proměnnými.
Nastavit typ dat
Datový typ v Pythonu se nastavuje automaticky při zápisu hodnoty do proměnné. Konstruktor třídy pro každý datový typ umožňuje také nastavení specifického datového typu proměnné:
Typ dat | Konstruktor |
Řetězec | str(<value>) |
Celé číslo | int(<value>) |
Plovoucí desetinná čárka | float(<value>) |
Komplexní | complex(<value>) |
Seznam | list((<value>, <value>)) |
Nice | tuple((<value>, <value>)) |
Booleovská hodnota | bool(<value) |
Nastavit | set((<value>, <value>)) |
Slovník | dict((<key>=<value>, <key>=<value>)) |
Převést typ dat
Některé datové typy Pythonu jsou převoditelné na jiné datové typy. Existují dva způsoby, jak převést typ proměnné:
- Explicitně . Konstruktor třídy pro datové typy také převádí datové typy.
- Implicitně . Je-li to možné, překladač jazyka Python automaticky převede datový typ – například přidání celého čísla do float poskytne výsledek s plovoucí desetinnou čárkou.