Заметка 9. Функции и прикладные дела. курса Математический практикум по Питону. Шокуров Антон В. shokurov.anton.v@yandex.ru http://машинноезрение.рф Версия 0.12

Аннотация

Создание функций (определение и объявление). Показана важность ранее пройденных объектов: словарь (dict) и кортеж (couple).

Это предварительная версия! Любые замечания приветсвуются.

Функции

Отрисовка графика

#%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt

import scipy.stats as models

Напомню:

import csv # Для рабом с csv файлами.

data = []
with open( 'MTLR_180101_190110.txt' ) as f:
    data_rows = csv.reader( f, delimiter = ';' )
    data = list( data_rows )
close = list( map( lambda x: float(x[-2]), data) ) # Или сразу.
#close Не будем его выводить. Там много данных.

plt.plot( close )
plt.ylabel( 'Цена рубли')
plt.xlabel( 'День начиная с 2018 г')

Text(0.5, 0, 'День начиная с 2018 г')

Как выполнить данное считывания и для других эмитентов, т.е. для других файлов? Можно создать функцию, которая обособит код.

Функции

Мы уже сталкивались с ламбда функциями. Напомню.

# Задаем ламбда функцию, которая удваивает число (объект).
dbl = lambda x : 2*x

# Применим функцию путем её вызова.
dbl( 2 ), dbl( -1.1 ), dbl( 3.5 )

(4, -2.2, 7.0)

# На всякий случай приведем и такой пример.
dbl( 'раз ' ) # Мы все это уже знаем...

'раз раз '

Ламбда функция не позволяет задать больше одного действия. Фактически это обособленное выражение. Дабы можно было отделить несколько последовательных операций необходимо использовать функции. Покажем их сначала как вариант ламбда функций.

Функция задаяется (объявляется и определяется) ключевым словом def в начале строки. Далее, через пробел, идет имя, в скобках список её аргументов. Строка звершается двоеточием.

# В данном случае, функция имеет название dblF и один аргумент x.
def dblF( x ): 
    # Сдесь могут идти действия. Но у нас простая функция. Поэтому их нет.
    # Для возврата значения из функции ипользется оператор return.
    return 2*x # Перед возвратом значения вычисляется выражение.

dblF( 2 ), dblF( -1.3 ), dblF( 'ещё раз ' ) # Вызов полностью совпадает.

(4, -2.6, 'ещё раз ещё раз ')

# Ламбда функция от двух аргументов. Возводит в степень.
mypow = lambda x, y: x**y
# Аналогичная функция mypowW имеет два аргумента.
def mypowW( x, y):
    return x**y

# Вызвали функции от двух аргументов.
mypow( 2, 3), mypowW( 2, 3), mypowW( 25, 0.5)

(8, 8, 5.0)

Конечно можно строить композицию.

# Напомню, что вызовы делаются по значению,
# т.е. сначала вычисляется значение аргумента,
mypow( dbl(1), 4), mypowW( dblF(1), 4), dbl( mypowW(3, 2) )
# а потом это значение передается дальше.

(16, 16, 18)

именные аргументы

# В качестве примера возьмем другую функцию.
def mysum( a, b): # Теперь у функции два аргумента
    return a + b * 2; # Возвращаем значение выражения.

mysum( 3, 2) # 3 + 2 * 2

7

В предыдущем вызове функции mysum число 3 будет присвоено первому аргументу функции, т.е. переменной a, а число 2 второму аргументу, т.е. переменной b. Таким образом, значения присваиваются аргументам исходя из того порядка в котором они идут при вызове функции. В Питоне значения аргументов можно передавать не только по номеру аргумента в списке (по позиции), но и по его названию. В Питоне есть возможность этот порядок изменить и выполнить вызов функции явно указав какому аргументу какое значение присовить. Для этого при вызове используется оператор присвоения.

# Для явного указания какому аргументу
# какое значение присовить используется оператор присвоения.
mysum( b = 3, a = 2) # аргументу b присвоено значение 3,
# а a  число 2. 2 + 3 * 2

8

Естественно что существует ряд ограничений.

mysum( c = 5 ) # Имя аргумента должно сущестовать.

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-16-f87b72b32905> in <module>
----> 1 mysum( c = 5 ) # Имя аргумента должно сущестовать.

TypeError: mysum() got an unexpected keyword argument 'c'

Можно комбинировать режимы. Но при двух аргументов мало что скомбинируешь. Тем не менее...

# При таком вызове система запутается.
mysum( 3, a = 2) # Точнее будет повторное присвоение первому аргументу.

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-17-bb8f5e3d417b> in <module>
      1 # При таком вызове система запутается.
----> 2 mysum( 3, a = 2) # Точнее будет повторное присвоение первому аргументу.

TypeError: mysum() got multiple values for argument 'a'

# А так нельзя потомучто после присвоения переменной значения по имени
mysum( b = 3, 2) # позиции не учитываются.

  File "<ipython-input-18-d671d05ce8fb>", line 2
    mysum( b = 3, 2) # позиции не учитываются.
                 ^
SyntaxError: positional argument follows keyword argument

mysum(0, b=-1)

-2

Но можно так.

# Функция от трех аргументов.
def mymac(a, m, s): # mac -- Multiply–accumulate operation.
    return a + m*s

mymac(10, s=3, m=2) # Так можно. 10 + 2*3

16

Значения по умолчанию

# при вызове функции необходио указать значение всех аргументов.
mysum( 5 )

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-22-ab8b05171279> in <module>
      1 # при вызове функции необходио указать значение всех аргументов.
----> 2 mysum( 5 )

TypeError: mysum() missing 1 required positional argument: 'b'

Упр. Напиши функцию вычисляющую корень квадратного уравнения. Например, а) больший корень. б) оба корня ввиде набора.

# Можно сделать значения по умолчанию
def mysum2( a, b = 5): # У аргумента b задано значение по умолчанию,
    return a + b * 2; # которое используется в случае,
# если оно не задано явно.

mysum2( 3 ) # Так можно. 3 + 5 * 2

13

mysum2( 3, 2) # А можно и указать значение. 3 + 2 * 2

7

# Обычные переменные не могут следовать после переменных
# с заданным значением по умолчанию.
def mysum3( a, b = 5, c):
    return a + b + c

  File "<ipython-input-26-bdb07b823b50>", line 3
    def mysum3( a, b = 5, c):
               ^
SyntaxError: non-default argument follows default argument

Упр. Напиши функцию вычисляющую логарифм. По умолчанию основание пусть будет натуральным. Иначе, оно должно быть указано.

Тело

# Тело функции ествественно может быть сложным
def doCnt( a, c=0 ): # Вычисляем .
    eq = list(map( lambda x: x==c, a))
    return np.mean( eq )

doCnt( [1, 2, 3, 0, 5, 4, 0, 8], 2 ), 1/8 # 8 элементов.

(0.125, 0.125)

doCnt( [1, 2, 3, 0, 5, 4, 0, 8] )

0.25

Упр. Напиши функцию вычисляющую среднее и среднеквадратичное отклонение массива.

Обратно к эмитентам

def txt2data( name ): # Функция принимает на вход название файла.
    with open( name ) as f:
        data_rows = csv.reader( f, delimiter = ';' )
        data = list( data_rows )
    # close = list( map( lambda x: float(x[-2]), data) ) Или сразу
    return data

mechel = txt2data( 'MTLR_180101_190110.txt' )
mtl_cl = np.array( list( map( lambda x: float(x[-2]), mechel) )) # -2 это цена закрытия.

vtb = txt2data( 'VTBR_180101_190110.txt' )
vtb_cl = np.array( list( map( lambda x: float(x[-2]), vtb) ))

plt.plot( mtl_cl )
plt.plot( vtb_cl )
plt.ylabel( 'Цена рубли')
plt.xlabel( 'День начиная с 2018 г')

Text(0.5, 0, 'День начиная с 2018 г')

Чего-то с графиком цены не то... они разного масштаба.

Пусть будет график процентного изменения.

plt.plot( mtl_cl/mtl_cl[0] ) # Поделим все элементы массива на самое первое значение.
plt.plot( vtb_cl/vtb_cl[0] ) # Аналогично для второго эмитента.
plt.ylabel( 'Процентое изменение') # Отображаем не цену, а процентное изменение.
plt.xlabel( 'День начиная с 2018 г')
plt.legend( ["Мечел", "ВТБ"] )

<matplotlib.legend.Legend at 0x7f6d2398eda0>

gaz = txt2data( 'GAZP_180101_190110.txt' )
gaz_cl = np.array( list( map( lambda x: float(x[-2]), gaz) ))

Как во всех этих элементах не запутаться? Напомню, есть такая вещь как словарь.

Каталог эмитентов

ticket = dict()

ticket['MTLR'] = mtl_cl
ticket['VTBR'] = vtb_cl
ticket['GAZP'] = gaz_cl

i = list(ticket.items())

i;

# Первый элемент кортежа имя (ключ),
i[0][0], type( i[0][1] ) # второе сами данные (котировки).

('MTLR', numpy.ndarray)

def doPlt( i, lab ):
    k, t = i
    plt.plot( t/t[0] )
    lab.append( k )

doPlt(i[0], [])

lab = []
list( map( lambda x : doPlt(x, lab), ticket.items() ))
plt.ylabel( 'Процентое изменение')
plt.xlabel( 'День начиная с 2018 г')
plt.legend( lab )

<matplotlib.legend.Legend at 0x7f6d238e3f60>

Упражнение. Как сделать так чтобы подписи в легенде были не сокращенные названия, а полноценные имена (как в предыдущем графике).

Применение

Обратно к обработке строки

translit = str.maketrans({'п':'p', 'р':'r', 'о':'o', 'е':'e', 'к':'k', 'а':'a', 'в':'v'})
translit # Словарь соотетствия: по одному символу дается другой.

{1087: 'p', 1088: 'r', 1086: 'o', 1077: 'e', 1082: 'k', 1072: 'a', 1074: 'v'}

'проверка'.translate( translit ) # Используем для посимвольного преобразования.

'proverka'

# Иногда (когда буква соответсвует букве) можно обойтись и строчкой.
traslit = str.maketrans( 'проверка', 'proverka') # Строится словарь.
traslit

{1087: 112, 1088: 114, 1086: 111, 1074: 118, 1077: 101, 1082: 107, 1072: 97}

# Когда букв нет в словаре трансляции, они не обрабатываются.
'проверь'.translate( translit )

'proverь'

Да и сам список

stud = ['Алексей',"Дима", "Аня", "Саша"]
stud

['Алексей', 'Дима', 'Аня', 'Саша']

stud.sort()
stud

['Алексей', 'Аня', 'Дима', 'Саша']

Как получить табельный номер студента?

stud_num = enumerate( stud ) # Нумирует список.
stud_num # Как обычно пока это просто генератор.

<enumerate at 0x7f6d238b95e8>

stud_num = list( stud_num ) # Формируем из него список.
stud_num # Список состоит из кортежей
# (индекс и, соответствующее, значение элемента списка).

[(0, 'Алексей'), (1, 'Аня'), (2, 'Дима'), (3, 'Саша')]

stud_num[2] # Кортеж из номера и значения списка (имени).

(2, 'Дима')

# Теперь можно сделать аналог списка через словарь.
studd = dict(stud_num)
studd

{0: 'Алексей', 1: 'Аня', 2: 'Дима', 3: 'Саша'}

type(studd), studd[2], type(stud), stud[2],

(dict, 'Дима', list, 'Дима')

stud_name = list( map( lambda x: (x[1], x[0]), stud_num ))
stud_name

[('Алексей', 0), ('Аня', 1), ('Дима', 2), ('Саша', 3)]

# А теперь словарь, который по имени возвращает номер.
studn = dict(stud_name)
studn

{'Алексей': 0, 'Аня': 1, 'Дима': 2, 'Саша': 3}

studn['Дима']

2

Сложный индекс -- объект

На самом деле ранее используемое понятие сложного индекса является объектом питона: slice.

# Как и ранее, указывается начальный индекс,
a = slice( 1, -1, 1) # последний не включительно и шаг.
a, type(a)

(slice(1, -1, 1), slice)

# Имея объект, который работает с понятием сложного индекса,
# можно вместо индекса подать объект срез.
b = [1, 2, 3, 4, 5]
b[ a ] # Применяем как обычно при использовании сложного индекса.

[2, 3, 4]

# Результат совпадает с применением сложного индекса напрямую.
b[ 1: -1: 1]

[2, 3, 4]

# Раз срез -- объект, то его можно, например,
def subsum( a, s): # передавать как значение функции.
    return sum( a[s] )

# Четный и нечетный поддиапазон индексов.
l = [ slice(0, -1, 2), slice(1, -1, 2) ]

subsum( b, l[0]), subsum( b, l[1])

(4, 6)

# Как и объект touple
a.start = 3 # объект срез является константным.

---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
<ipython-input-64-dea125fc95e5> in <module>
      1 # Как и объект touple
----> 2 a.start = 3 # объект срез является константным.

AttributeError: readonly attribute

# Можно использовать его метод indices для получения сложного индекса без отрцательных первых двух чисел.
c = a.indices(10) # Для 10го объекта. Нумерация с 0.
c # Раз индексов бесконечно много (-1), то получим значение.

(1, 9, 1)

slice(-1, -5, -1).indices(10)

(9, 5, -1)

# Если же взять ограниченный срез,
a = slice(1,5,1) # то поведение будет иное.

a.indices(2) # Указываем сколько фактически элементов.

(1, 2, 1)

a.indices(10) # Мы упремся в "последний" элемент.

(1, 5, 1)

# Так как речь идет о настоящем индексе,
a.indices( -2 ) # то отрицательным он быть не может.

---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-70-cc4b23d6c0ef> in <module>
      1 # Так как речь идет о настоящем индексе,
----> 2 a.indices( -2 ) # то отрицательным он быть не может.

ValueError: length should not be negative

a = slice(1, -1, -1)

a.indices(5)

(1, 4, -1)