pyth_10_prob
Заметка 10. Численная теория вероятности.
курса Математический практикум по Питону.
Шокуров Антон В.
shokurov.anton.v@yandex.ru
http://машинноезрение.рф
Версия 0.17

Аннотация

Вводятся базовые элементы питона (Python версии 3.xx) на базе ключевых библиотек относящихся к анализу данных: построение графиков/гистограмм и численной статистике. Последнее, в частности, используется для ввода ключевых понятий из анализа данных: выборка, плотность распределения и подгонка модели под данные.

Это предварительная версия! Любые замечания приветствуются.

Случайные величины и использование компьютера по назначению

Генерация распределения

Непрерывные случайные величины

Нормальное

Существуют специальные (библиотечные) функции для создания случайных чисел. Библиотека Numpy уже загружена и переименована как np. Поэтому возможен код:

np.random является модулем, т.е. он содержит набор функций со схожим смыслом. Равномерное распределение задается просто функцией rand из модуля np.random

Равномерное

Дискретные случайные величины

Известно что по равномерной случайной величине можно сгенерировать произвольную слуайную величину использую обратную функцию.

Гистограмма дискретной случайной величины

Давай посчитаем количество раз которое то или иной число встречается. Это можно сделать по разному.

Подсчет элементов

Можно конечно посчитать и более сложные условия (диапазоны значений).

Для большей статестической правдоподобности.

Вычисление гистограммы

Давай посчитаем количество раз которое кстречается каждое из чисел. По научному это называется гистограммой.

Теперь нужно прогнать все возможные числа.

Его можно по разному выводить. Можно просто списком. Но это не наглядно.

Можно графиком.

Но обычно все-таки использую спецаильный вид графиков -- гистограммы (прямоугольники).

Библиотечная

Сформируем свои границы ячеек.

Построение гистограммы

Видим, что результат совпадает. Скоре всего код функции plt.hist вызывает функцию np.histogram.

Упр. Вычислить гистограмму совсем вручную: использую цикл и список...

Сравнение гистограмм

Возникает вопрос о том как убедится, что у нас результат совпадает.

Визуальное сравнение

Можно сравнить визуально выведя обе гистограммы как график.

Визаульно конечно можно получить некое общее представление, что все вопрядке, но хотелось бы более нажедного способа.

Можно по-элементно сравнить массивы на совпадение.

Численное сравнение

Упр. Как циклом за один найти наиболее часто встречаемый элемент?

Гистограмма непрерывной случайной величины

Рассмотрим непрерывную случайную величину.

Подсчет количеств

В данном случае мы не сможем посчитать количества раз которое та или иная величина встречается. Для адекватного подсчета нужно разбить интервал на равные подинтервалы.

Вычисление гистограммы

Поиск объекта на изображении

Плотность распределения

Возвращаемся к вопросу о формировании произвольного распределения по равномерному.

Выделение объекта определенного цвета

Для того чтоб выяснить как завершить подсчет приходите как мой курс по OpenCV (Введение в цифровую обработку изображений)

Упр. По аналогии выделите бобовые зерна зеленого цвета.

Численная статистика

Нормальное распределение

Формирование случайной величины

Восстановление/оценка параметров случайной величины по выборке

Мат ожидание от произвольной функции

Хм.. Какие же точки используются для интегрирования...

Сравнение с численным

Хи квадрат -- Выражение из случайных величин

Теперь забывае как мы его создали. Считаем, что данные откуда-то взялись.

Упр. Посчитайте гистограмму красных бобовых зерен. Указание: используйте найденную маску.