Визуализация данных в Python - tversu.ruprog.tversu.ru/winter3/matplotlib.pdf ·...

12
Визуализация данных в Python

Transcript of Визуализация данных в Python - tversu.ruprog.tversu.ru/winter3/matplotlib.pdf ·...

Page 1: Визуализация данных в Python - tversu.ruprog.tversu.ru/winter3/matplotlib.pdf · 2017-12-20 · Построение графиков import matplotlib.pyplot as

Визуализация данных в Python

Page 2: Визуализация данных в Python - tversu.ruprog.tversu.ru/winter3/matplotlib.pdf · 2017-12-20 · Построение графиков import matplotlib.pyplot as

Варианты библиотек

make easy things easy and hard things possible

complex statistical visualizations

Page 3: Визуализация данных в Python - tversu.ruprog.tversu.ru/winter3/matplotlib.pdf · 2017-12-20 · Построение графиков import matplotlib.pyplot as

Python Pandas

Page 4: Визуализация данных в Python - tversu.ruprog.tversu.ru/winter3/matplotlib.pdf · 2017-12-20 · Построение графиков import matplotlib.pyplot as

Как прочитать данные?

import pandas as pd

1. Файл .xlsx (MS Excel):

data = pd.read_excel('test1.xlsx')

2. Файл .csv:

data = pd.read_csv('test2.csv', sep = ';')

data = data.sort_values(by='Sales')

data = data.sort_values(by='Sales', ascending=False)[:10]

[:10]

Page 5: Визуализация данных в Python - tversu.ruprog.tversu.ru/winter3/matplotlib.pdf · 2017-12-20 · Построение графиков import matplotlib.pyplot as

Figure – поле, область с графиками

Axes – сами графики

Page 6: Визуализация данных в Python - tversu.ruprog.tversu.ru/winter3/matplotlib.pdf · 2017-12-20 · Построение графиков import matplotlib.pyplot as

Построение графиков

import matplotlib.pyplot as plt

fig, ax = plt.subplots()#1 поле с 1 графиком

data.plot(kind='barh', x="Company", y="Sales“, ax = ax)

line – линияbar – столбчатая диаграммаbarh – горизонтальная столбчатая диаграммаhist - гистограммаbox – ящик с усамиkde – график плотности распределения density – аналогично kdearea – с областямиpie – круговая диаграммаscatter – точечная диаграммаhexbin – гексогональная 2-d гистограмма

Page 7: Визуализация данных в Python - tversu.ruprog.tversu.ru/winter3/matplotlib.pdf · 2017-12-20 · Построение графиков import matplotlib.pyplot as

Название графика и осей. Легендаax.set(title='Продажи за 2017 год',

xlabel = 'Объём продаж, $', ylabel='Компания')

ax.legend().set_visible(False) #скрываем легенду

Page 8: Визуализация данных в Python - tversu.ruprog.tversu.ru/winter3/matplotlib.pdf · 2017-12-20 · Построение графиков import matplotlib.pyplot as

from matplotlib.ticker import FuncFormatterdef changeMoney(x, pos):

#return '${:1.0f}K'.format(x*1e-3)return '{:1.0f}'.format(x*1e-3)

….formatter = FuncFormatter(changeMoney)ax.xaxis.set_major_formatter(formatter)

Page 9: Визуализация данных в Python - tversu.ruprog.tversu.ru/winter3/matplotlib.pdf · 2017-12-20 · Построение графиков import matplotlib.pyplot as

Добавление линийavg = data['Sales'].mean()

competitors = data[data.Sales > avg]

ax.axhline(y=len(competitors)-0.5, color='r', label='Average', linestyle='--', linewidth=2) # добавляем линию, отсекая всех, кто набрал больше среднего

Page 10: Визуализация данных в Python - tversu.ruprog.tversu.ru/winter3/matplotlib.pdf · 2017-12-20 · Построение графиков import matplotlib.pyplot as

fig, ax = plt.subplots(nrows=1, ncols=2, sharey=True, figsize=(7, 4))

Несколько графиков

количество строк

одна подпись для всех осей Yколичество столбцов

размер поля для графиков

data.plot(kind='barh', y="Sales", x="Company", ax=ax[0])ax[0].set(ylabel='Продавец', xlabel = 'Выручка', xlim = [-10000, 140000])….

data.plot(kind='barh', y="Quantity", x="Company", ax=ax[1])ax[1].set(xlabel = 'Количество товаров', xlim = [0, 110])

fig.suptitle('Анализ продаж 2017', fontsize=14, fontweight='bold');

Page 11: Визуализация данных в Python - tversu.ruprog.tversu.ru/winter3/matplotlib.pdf · 2017-12-20 · Построение графиков import matplotlib.pyplot as

Сохранениеfig.savefig('sales.png', transparent=False, dpi=80, bbox_inches="tight")

'eps', 'jpeg', 'jpg', 'pdf','pgf', 'png', 'ps', 'raw', 'rgba', 'svg', 'svgz', 'tif', 'tiff'

Page 12: Визуализация данных в Python - tversu.ruprog.tversu.ru/winter3/matplotlib.pdf · 2017-12-20 · Построение графиков import matplotlib.pyplot as

Возможно полезные ссылкиhttps://pandas.pydata.org/pandas-docs/stable/api.html#api-dataframe-plotting – справочник по графикам в pandas с использованием Matplotlib

https://pandas.pydata.org/pandas-docs/stable/visualization.html -- примеры графиков

Русскоязычные источники:

http://malev.ru/анализ-данных-при-помощи-python-графики-в-pandas/ -- что-то про Matplotlib