Metode nizov in seznamov
Contents
11. Metode nizov in seznamov#
11.1. Kako kličemo metode#
Funkcijam, ki smo jih srečevali doslej, smo, da so kaj naredile, morali dati podatke, na katerih so delale. Funkcija len
kot argument zahteva seznam ali niz, katerega dolžino bi radi izvedeli. Funkcija input
kot
argument želi niz z vprašanjem, ki bi ga radi zastavili uporabniku. Razen argumentov, ki jih podamo, te funkcije nimajo drugih podatkov (vsaj ne, da bi mi vedeli zanje).
Ko smo se učili o seznamih, pa smo mimogrede naleteli na neko nenavadnost: za dodajanje novega elementa v seznam nismo poklicali funkcije, ki bi ji podali seznam in element (na primer append(imena, "Ana")
), temveč smo morali napisati ime seznama, ki mu je sledila pika in append
, kot argument pa smo navedli le element, ki smo ga želeli dodati, torej imena.append("Ana")
.
imena = []
imena.append("Ana")
imena.append("Berta")
imena
['Ana', 'Berta']
append
je očitno nenavaden, ne kličemo ga tako kot druge funkcije.
Funkcija append
“pripada” seznamu; zato mu pravimo imena.append
.
Naredimo še en seznam.
teze = []
teze.append(55)
imena.append("Cilka")
imena
['Ana', 'Berta', 'Cilka']
teze
[55]
Vsak seznam ima svoj append
: imena
imajo imena.append
in teze
imajo teze.append
.
Takšnim funkcijam pravimo metode. Klic imena.append
si predstavljamo, kot da seznamu imena
rečemo “dodaj si element” "Cene"
in klic teze.append(55)
pomeni, da seznamu teze
rečemo “dodaj si element” 55
.
Pika, .
izraža nekakšno pripadnost, vsebovanost. Ko smo spoznali module, smo videli, da z math.sqrt
pridemo do math
-ove funkcije z imenom sqrt
. Z imena.append
zahtevamo “imenovo” metodo append
. In s teze.append
“tezovo” metodo append
.
Takšnih metod je še veliko: takole prosimo niz ime
, naj nam pove, koliko črk “n” vsebuje.
ime = "Benjamin"
ime.count("n")
2
Takole pa niz fname
vprašamo, ali se konča s “torrent”.
fname = "en film.torrent"
fname.endswith(".torrent")
True
Kako bi Benjamina spremenili v Benjamaxa? Težko: kot vemo, so nizi nespremenljivi (tako kot terke; od vsega, o čemer smo govorili prejšnji teden, lahko spreminjamo samo sezname). Pač pa lahko vprašamo niz, kako bi bil videti, če “min” zamenjano z “max”.
ime.replace("min", "max")
'Benjamax'
Metode niso povezane s tem, ali je niz shranjen v spremenljivki ali ne. Metodo moremo poklicati tudi na nizu “kar tako”.
"Maja".lower()
'maja'
Skoraj vsaka reč v Pythonu ima metode (ali vsaj nekaj podobnega). Celo običajna števila imajo metode, čeprav zgolj tehnično in z zelo čudnimi imeni, kot lahko vedoželjen študent hitro preveri.
x = 3.14
x.is_integer()
False
Med tipi, ki smo jih spoznali doslej, pa imajo uporabe vredne metode nizi in seznami. V okviru predavanj ne bomo podrobneje spoznavali vse mogočih podatkovnih tipov. Temeljiteje pa bomo pogledali metode nizov, seznamov in podobnih reči, ki jih pri programiranju v Pythonu vsakodnevno uporabljamo. Obenem bomo tako dobili vtis, kako te reči izgledajo.
Namen tega poglavja ni, da si zapomnite vse te metode in jih znate na pamet :) Namen je le, da dobite predstavo, kako to deluje in kakšne vse stvari obstajajo. Za konkretna imena pa vam bo vedno na voljo dokumentacija.
11.2. Metode nizov#
Nekaj smo jih že spoznali: count
, replace
in lower
. Zadnja ima sestro, upper
, ki vrne niz, pri katerem so vse črke pretvorjene v velike črke. Podobna sta še capitalize
in title
.
"Maja".lower()
'maja'
"Maja".upper()
'MAJA'
"maja".capitalize()
'Maja'
"stavek, KI GA bomo povelikočrkovali po anGLEško".title()
'Stavek, Ki Ga Bomo Povelikočrkovali Po Angleško'
Da ne bi kdo pozabil, za vsak slučaj še enkrat spomnimo: te metode ne spreminjajo niza, temveč vračajo nove nize. Nizi ostanejo takšni, kot so bili. Po tem primeru bi moralo biti jasno, kaj ne deluje in kako je potrebno pisati, da bo delovalo.
s = "Benjamin"
s.upper()
'BENJAMIN'
s
'Benjamin'
s = s.upper()
s
'BENJAMIN'
Metodo count
smo že spoznali. Povejmo le še, da lahko išče tudi daljše
"Maja".count("a")
2
"Maja".count("aj")
1
Poleg count
imamo tudi nekaj funkcij, ki povedo, kje v nizu se nahaja določen podniz. Prvi sta find
in index
.
"Benjamin".find("jam")
3
"Benjamin".index("jam")
3
Edina razlika med njima je v tem, kaj storita, če iskanega niza ni. find
vrne -1, index
pa javi napako.
"Benjamin".find("max")
-1
"Benjamin".index("max")
---------------------------------------------------------------------------
ValueError Traceback (most recent call last)
<ipython-input-22-c435d9d16506> in <module>
----> 1 "Benjamin".index("max")
ValueError: substring not found
Če se dani podniz pojavi večkrat, bosta funkciji vrnili indeks prve pojavitve - razen, če jima z dodatnimi argumenti povemo, od kod naprej naj iščeta. Poleg find
in index
obstajata še funkciji rfind
in rindex
, ki iščeta s konca in tako vrneta zadnjo pojavitev podniza v nizu.
Mimogrede smo že omenili tudi preprosto, a zelo uporabno funkcijo endswith
, ki pove, ali se niz konča s podanim podnizom. Poleg njega obstaja še startswith
, ki pove ali se niz začne z danim podnizom.
Metode ljust
, rjust
in center
dopolnijo niz s presledki z leve, z desne ali z obeh strani, tako da je dolg toliko, kot želimo. Takole napihnemo Benjamina na 15 znakov:
"Benjamin".ljust(15)
'Benjamin '
"Benjamin".rjust(15)
' Benjamin'
"Benjamin".center(15)
' Benjamin '
Še enkrat: te metode ne spreminjajo niza, temveč vrnejo nov niz! Nobena metoda ne more spremeniti niza.
Metoda strip
naredi ravno nasprotno: odbije presledke (in tabulatorje in znake za prehod v novo vrstico) na levi in desni strani niza. lstrip
in rstrip
pospravita samo levo in samo desno stran.
" Benjamin ".strip()
'Benjamin'
" Benjamin ".lstrip()
'Benjamin '
" Benjamin ".rstrip()
' Benjamin'
Če se zdi ta metoda komu neuporabna, se moti. Zelo. Svojo zmoto bo spoznal, ko pridemo do branja datotek.
Nizi imajo še veliko metod. Pogledali bomo le še dve najzanimivejši.
Metoda split
razbije niz na seznam podnizov, kakor jih ločujejo presledki, tabulatorji in znaki za nove vrstice. (V prvem približku: razbije jih na besede.)
s = "Metoda split razbije niz na seznam podnizov, kakor jih ločujejo presledki."
s.split()
['Metoda',
'split',
'razbije',
'niz',
'na',
'seznam',
'podnizov,',
'kakor',
'jih',
'ločujejo',
'presledki.']
Presledkom, tabulatorjem in znakom za novo vrstico rečemo tudi beli prostor (white space). Namesto glede na beli prostor lahko split
razbije niz tudi glede na kak drug znak, ki ga moramo v tem primeru podati kot argument.
"123-4123-21".split("-")
['123', '4123', '21']
"123-4123-21".split("1")
['', '23-4', '23-2', '']
Zadnja metoda, join
, dela ravno obratno kot split
: združuje nize. Način, na katerega je obrnjena, je nenavaden, a če malo razmislimo, vidimo, da drugače ne bi moglo biti.
imena = ["Ana", "Berta", "Cilka", "Dani", "Ema"]
"".join(imena)
'AnaBertaCilkaDaniEma'
Praznemu nizu, ""
, smo “naročili”, naj združi nize iz podanega seznama. To sicer ni videti preveč lepo, lepše bo, če jih združimo s kakim ločilom.
" - ".join(imena)
'Ana - Berta - Cilka - Dani - Ema'
", ".join(imena)
'Ana, Berta, Cilka, Dani, Ema'
" in ".join(imena)
'Ana in Berta in Cilka in Dani in Ema'
Najlepše pa bo, če vsa imena do zadnjega združimo z vejicami, nato pa z “in” pripnemo še zadnje ime. Ker ravno poznamo rezine.
", ".join(imena[:-1]) + " in " + imena[-1]
'Ana, Berta, Cilka, Dani in Ema'
To, mimogrede, deluje celo z dvema imenoma - prvo bo pač pustil pri miru, saj v seznamu, kot je ["Ana"]
ni česa združevati:
imena = ["Ana", "Benjamin"]
", ".join(imena[:-1]) + " in " + imena[-1]
'Ana in Benjamin'
Pri enem samem pa malo zataji.
imena = ["Ana"]
", ".join(imena[:-1]) + " in " + imena[-1]
' in Ana'
11.3. Metode seznamov#
Tako kot nizi imajo tudi seznami metodi count
in index
, o katerih ne bomo izgubljali besed.
Medtem ko vam pri nizih metoda index
ne bo prišla velikokrat na misel, jo boste, sodeč po izkušnjah iz preteklih generacij, pridno zlorabljali na seznamih. Že kaka dva, tri tedne pred temi predavanji jo nekateri študenti odkrijejo in si z njeno pomočjo otežijo reševanje domačih nalog.
Metoda index
je v resnici uporab(lje)na zelo redko. Metode index
prav gotovo ne gre uporabljati znotraj zanke for
, ki gre prek seznama in ob tem poskuša dobiti indeks trenutnega elementa.
Ena tipičnih zlorab je ta:
imena = ["Ana", "Berta", "Cilka", "Dani", "Ema"]
teze = [72, 78, 70, 65, 68]
for ime in imena:
i = imena.index(ime)
print(ime, "tehta", teze[i], "kilogramov.")
Ana tehta 72 kilogramov.
Berta tehta 78 kilogramov.
Cilka tehta 70 kilogramov.
Dani tehta 65 kilogramov.
Ema tehta 68 kilogramov.
Tole tule slučajno deluje. Neha pa delovati takoj, ko imamo v seznamu dve enaki imeni: index
bo vrnil prvo.
imena = ["Ana", "Ana", "Ana"]
teze = [72, 78, 70]
for ime in imena:
i = imena.index(ime)
print(ime, "tehta", teze[i], "kilogramov.")
Ana tehta 72 kilogramov.
Ana tehta 72 kilogramov.
Ana tehta 72 kilogramov.
Tu se študenti tipično pritožijo: ko se ime
nanaša na drugo Ano v seznamu, bi morala metoda index
po njihovem vrniti indeks drugega elementa, 1
in ne 0
.
Če bi index
res delal tako: kaj bi dobili, če bi poklicali imena.index("Ana")
? V tem primeru se niz "Ana"
ne nanaša na nek specifičen element v seznamu.
V resnici je ime
v gornjem primeru vedno samo "Ana"
. Ne neka konkretna Ana s tega seznama. Samo Ana. In index
vrne prvo Ano.
Vem, vem, zakaj študenti pišejo programe, kot je gornji. Zaradi moje reklame proti range(len(...))
. Radi bi napisali tole, a si ne upajo.
imena = ["Ana", "Berta", "Cilka", "Dani", "Ema"]
teze = [72, 78, 70, 65, 68]
for i in range(len(imena)):
print(imena[i], "tehta", teze[i], "kilogramov.")
Ana tehta 72 kilogramov.
Berta tehta 78 kilogramov.
Cilka tehta 70 kilogramov.
Dani tehta 65 kilogramov.
Ema tehta 68 kilogramov.
In prav je, da si ne upajo. To se naredi tako:
for ime, teza in zip(imena, teze):
print(ime, "tehta", teza, "kilogramov.")
Ana tehta 72 kilogramov.
Berta tehta 78 kilogramov.
Cilka tehta 70 kilogramov.
Dani tehta 65 kilogramov.
Ema tehta 68 kilogramov.
Kadar potrebujemo element in indeks, pa uporabimo enumerate
.
for i, ime in enumerate(imena):
print(i, ":", ime)
0 : Ana
1 : Berta
2 : Cilka
3 : Dani
4 : Ema
Malo smo skrenili s poti, ampak je pomembno. Zato bom povedal še enkrat preden uporabite index
, razmislite, ali ga res potrebujete. Metoda index
je
nevarna, ker vedno vrne prvi element s podano vrednostjo, in tega morda ne pričakujemo,
počasna, ker mora Python dejansko pregledati seznam do iskanega elementa,
navadno nepotrebna, ker lahko pridemo do indeksa po preprostejši poti,
poleg tega pa navadno brez potrebe zapleta program.
Če je tako slab, zakaj obstaja? Ker ga včasih čisto legalno potrebujemo. Zakaj pa o njem govorim programerjem - začetnikom? Zato, ker ga sicer odkrijejo sami. index
je ena od stvari, za katere je boljše, da otroci o njih slišijo od staršev, ne vrstnikov.
Zdaj pa nazaj k metodam.
Že nekaj časa vemo za append
, ki v seznam doda nov element. Pazite, tole je zelo drugače kot pri nizih! Metoda append
ne vrača novega seznama, temveč v resnici spreminja seznam.
Kako pa bi k nizu pripeli seznam? Tule nam append
ne bo pomagal: kar naredi, je povsem narobe.
imena
['Ana', 'Berta', 'Cilka', 'Dani', 'Ema']
imena.append(["Fanči", "Ema", "Greta"])
Kaj smo pa pričakovali? Metoda append
prejme en argument. In to kar prejme, doda k seznamu. Torej: kar
ji podamo kot argument, bo zadnji element seznama. Če torej append
-u podamo seznam, bo seznam zadnji element seznama.
Metoda, ki bo naredila, kar hočemo, je extend
.
imena = ['Ana', 'Berta', 'Cilka', 'Dani', 'Ema']
imena.extend(["Fanči", "Greta"])
imena
['Ana', 'Berta', 'Cilka', 'Dani', 'Ema', 'Fanči', 'Greta']
V resnici extend
-a praktično ne potrebujemo. Ker je sezname možno seštevati, raje uporabimo kar +=
.
imena += ["Helga", "Iva"]
imena
['Ana', 'Berta', 'Cilka', 'Dani', 'Ema', 'Fanči', 'Greta', 'Helga', 'Iva']
Metodi insert
podamo dva argumenta, indeks in element, pa bo vstavila element pred element s podanim indeksom.
imena = ['Ana', 'Berta', 'Dani', 'Ema', 'Greta']
imena.insert(2, "Cilka")
imena.insert(-1, "Fanči")
imena
['Ana', 'Berta', 'Cilka', 'Dani', 'Ema', 'Fanči', 'Greta']
Očitno deluje tudi indeksiranje s konca.
Elemente seznama lahko odstranjujemo na tri načine.
Prvi je del
. del
ni metoda in prihaja iz povsem drugega vica, a vseeno ga pač omenimo, ker se ravno učimo o spreminjanju seznamov. Uporabimo ga tako:
del imena[-2]
imena
['Ana', 'Berta', 'Cilka', 'Dani', 'Ema', 'Greta']
Metoda pop
vrne element s podanim indeksom in ga pobriše s seznama.
imena.pop(2)
'Cilka'
imena
['Ana', 'Berta', 'Dani', 'Ema', 'Greta']
Metodo pop
redko uporabljamo za pobiranje elementov sredi seznamov. Navadno na ta način poberemo prvi ali zadnji element. Pravzaprav najpogosteje zadnjega, zato lahko pop
pokličemo tudi brez argumentov, pa bomo dobili zadnji element.
imena.pop()
'Greta'
imena
['Ana', 'Berta', 'Dani', 'Ema']
Če bi hoteli, recimo, prestaviti prvi element na konec, bi napisali
imena.append(imena.pop(0))
imena
['Berta', 'Dani', 'Ema', 'Ana']
V obeh primeri, pri del
in pop
smo morali podati indeks elementa, ki ga želimo odstarniti. Včasih nimamo indeksa, pač pa poznamo vrednost elementa, ki ga želimo odstraniti. V tem primeru uporabimo remove
.
imena.remove("Dani")
imena
['Berta', 'Ema', 'Ana']
Pri tem ne odstrani vseh takšnih elementov, temveč le prvega, na katerega naleti, kakor lahko vidimo v spodnjem primeru.
s = [7, 1, 2, 3, 4, 1, 1, 2]
s.remove(1)
s
[7, 2, 3, 4, 1, 1, 2]
Za metodo remove
velja vse, kar smo napisali za index
. V resnici za remove
sicer obstaja več situacij, ko ga “legalno uporabimo”, vseeno pa je nevaren, ker odstrani prvi takšen element; počasen, ker mora element najprej poiskati; pogosto nepotreben (ker lahko poznamo indeks). Poleg tega pa je še zelo nevaren: študenti ga radi uporabijo znotraj zanke, v kateri gredo čez prav ta isti seznam. Brisati elemente seznama, čez katerega greš ravnokar z zanko, je vedno zelo slaba ideja. Če uporabljaš for
ali če nisi pošteno previden.
Metoda s.copy()
naredi kopijo seznama s
, tako kot da bi napisali s = s[:]
. Navadno uporabimo s.copy()
, ker bolj eksplicitno pove, kaj počnemo.
Metoda s.clear()
ga izprazni, kar je isto kot s[:] = []
ali del s[:]
in ni isto kot s = []
. Razlika je tako prefinjena, da bo vredna posebnega predavanja. Navadno uporabimo s.clear()
.
Le še dve metodi sta nam ostali. reverse
obrne vrstni red elementov v seznamu.
s = [7, 2, 5, 1, 1]
s.reverse()
s
[1, 1, 5, 2, 7]
Zadnja je sort
, ki uredi elemente po vrsti.
s.sort()
s
[1, 1, 2, 5, 7]
Metoda deluje nad vsakršnimi elementi, ki jih je mogoče primerjati - z njo lahko uredimo seznam števil, nizov… Podamo ji lahko tudi kup argumentov, ki pa jih v tem trenutku še nismo zmožni razumeti.
Ne spreglejte razlike med metodami nizov in seznamov. Metode nizov vračajo nove nize; s.replace("min", "max")
ni spremenil niza s
, temveč vrnil nov niz. Metode seznamov spreminjajo seznam; s.insert(2, "Ana")
ne vrne novega seznama, temveč spremeni s
. Enako velja za sort
in reverse
.
Tule omenimo še dve Pythonovi funkciji, ki nista metodi, sta pa podobni gornjima in študente pogosto bega razlika.
s = [7, 2, 5, 1, 1]
for e in reversed(s):
print(e)
1
1
5
2
7
s
[7, 2, 5, 1, 1]
sorted(s)
[1, 1, 2, 5, 7]
s
[7, 2, 5, 1, 1]
sort
in reverse
sta metodi seznamov. Imeni sta v velelniku - uredi!, obrni! - torej uredita oz. obrneta seznam. Torej: spremenita ga.
sorted
in reversed
sta funkciji. Imeni sta urejen in obrnjen, vrneta torej nov seznam (reversed
v resnici ne vrača seznama, vrne pa nekaj, kar se vede malo podobno kot seznam). Seznam, ki ga podamo kot argument, ostane nespremenjen. Obe funkciji skoraj vedno uporabimo za zanko for
.
Eden od razlogov, zakaj sorted
in reversed
nista metodi, je tudi, da lahko na ta način sprejemata različne argumente. Zadovoljni sta tudi z nizom ali terko (in vsem drugim, čez kar je možno iti z zanko for
).
sorted("berta")
['a', 'b', 'e', 'r', 't']
for e in reversed("berta"):
print(e)
a
t
r
e
b
11.4. Metode terk#
Terke imajo enake metode kot seznami, manjkajo jim le metode, ki spreminjajo seznam.
In, presenečenje: vse metode seznamov spreminjajo seznam. Terke imajo le metodi: count
in index
.