PostgreSQL: промышленная разработка баз данных. Лекция 5

PostgreSQL: промышленнаяразработка баз данных

Лекция 5

Механизм выполнения запроса. План запроса, виды операций. Оптимизация запросов. Оператор EXPLAIN. Типы индексов.

Устройство PostgreSQL

Обработка запроса в PostgreSQL

Parser (синтаксический анализатор)

Planner (выбор оптимального пути)

Executor (непосредственное выполнение)

SQL – декларативный язык. СУБД решает, как именно будет выполняться запрос.

EXPLAIN

План запроса – дерево Узлы – действия

− соединения (join)− сортировка− просмотр таблицы

Выполнение происходит от листьев к корню Оценка «ширины» данных, количества строк и стоимости

Это только оценка, реальную стоимость покажет EXPLAIN ANALYZE

Пример EXPLAIN

test=# explain select * from pg_proc order by proname;

QUERY PLAN

Sort (cost=190.00..195.35 rows=2143 width=339)

Sort Key: proname

> Seq Scan on pg_proc (cost=0.00..71.43 rows=2143 width=339)

(3 rows)

EXPLAIN: width

test=# explain select * from pg_proc order by proname; QUERY PLAN Sort (cost=191.67..197.08 rows=2166 width=299) Sort Key: proname > Seq Scan on pg_proc (cost=0.00..71.66 rows=2166 width=299)(3 rows)

Показывает примерное среднее количество байт в одной строке результата

«Ширины» типов данных

int2 2int4 4int8 8boolean 1varchar(n) / char(n) n + 4timestamp / timestamptz 8

EXPLAIN: rows

Показывает примерное количество строк результата (в т.ч., промежуточного)

Большое отклонение от реальности => необходим VACUUM & ANALYZE!

Можно использовать для вывода примерного количества строк результата конечному пользователю

EXPLAIN: cost

Абстрактная величина (вводавывода, CPU) Именно это даёт возможность планнеру выбрать один план из нескольких

2 значения: startup & total Это всего лишь оценка!

EXPLAIN ANALYZE

test=# explain analyze select * from pg_proc order by proname; QUERY PLAN Sort (cost=190.00..195.35 rows=2143 width=339) (actual time=423.508..426.069 rows=2143 loops=1) Sort Key: proname Sort Method: quicksort Memory: 626kB > Seq Scan on pg_proc (cost=0.00..71.43 rows=2143 width=339) (actual time=0.015..418.299 rows=2143 loops=1) Total runtime: 428.757 ms(5 rows)

Фактическая информация Время в миллисекундах Добавляется общее время запроса loops – количество «проходов» (необходимо умножить время на loops, чтобы получить общее время)

Виды операций

Способы просмотра таблицы

− Seq Scan− Index Scan

Способы подготовки данных

− Sort− Hash

Способы соединения (join)

− Nested Loop− Merge Join− Hash Join

Управление планировщиком enable_seqscan

enable_indexscan

enable_sort

enable_nestloop

enable_hashjoin

enable_mergejoin

enable_hashagg

Как правило, помогает при разработке, но вредит на «боевых» серверах (другие объёмы данных => другая статистика)

Индексы в PostgreSQL

Btree Hash Rtree – теперь тоже GiST GiST (обобщенное поисковое дерево) GIN (обратный индекс)

Индексы в PostgreSQL

Btree Hash Rtree – теперь тоже GiST GiST (обобщенное поисковое дерево) GIN (обратный индекс)

Фёдор Сигаев, Олег Бартунов

Cоздание индекса

test=# \h CREATE INDEXCommand: CREATE INDEXDescription: define a new indexSyntax:CREATE [ UNIQUE ] INDEX [ CONCURRENTLY ] name ON table [ USING method ] ( { column | ( expression ) } [ opclass ] [ ASC | DESC ] [ NULLS { FIRST | LAST } ] [, ...] ) [ WITH ( storage_parameter = value [, ... ] ) ] [ TABLESPACE tablespace ] [ WHERE predicate ]

Общие возможности использования индексов в PostgreSQL

Частичные индексы

CREATE INDEX ... WHERE ... Функциональные индексы

CREATE INDEX ... USING btree(myfunc(a))

− уникальные функциональные индексы− индексирование данных “экзотических” типов (XML, array, ...)

Многоколоночные индексы

− следим за правильным порядком столбцов− избегаем ненужных одноколоночных индексов

GINиндексы для массивов CLUSTER table USING indexname

Общие возможности использования индексов в PostgreSQL

● CREATE INDEX CONCURRENTLY ...

● CREATE INDEX ... WITH (fillfactor = ...)

● Необходимость в перестроении индексов (read/fetch ratio):select indexrelname, idx_tup_read, idx_tup_fetch, case when idx_tup_fetch = 0 then 100 else idx_tup_read / idx_tup_fetch end as ratio from pg_stat_user_indexes order by ratio desc;

Оптимизация: общие рекомендации

Сбор статистики, мониторинг, анализ логов (pgFouine) Итерационное выявление медленных запросов Иногда лучше перестроить запрос, а не создать N новых индексов

Следить за кардинальностью и селективностью промежуточных результатов (SELECT * FROM a, b)

Потенциальные источники проблем: LEFT JOIN, count(), UNION вместо UNION ALL, DISTINCT, WHERE ... IN (...), соединение 100 таблиц, неожиданное «выпрямление» запросов с подзапросами, «вязанка» индексов вместо одногодвух

Не забывать об ANALYZE после массивных изменений!

Оптимизация: общие рекомендации

При решении проблемы убедитесь в том, что вам не нужны VACUUM & ANALYZE

Запускайте EXPLAIN ANALYZE не менее двух раз (не забываем про кэш)

Читайте план снизу вверх, ищите, где начинаются замедления и/или ошибки планировщика

При возможности, используйте реальные данные в тестировании (Slony?) и оборудование, приближенное к production

Обращайтесь за помощью: pgsqlperformance, IRC, sql.ru, коммерческая поддержка

Литература: рекомендации для данной лекции

● PostgreSQL Reference Manual

● 11. Indexes● 14. Performance Tips● 43.5. Planner/Optimizer● 55. How the Planner Uses Statistics

● Bruce Momjian, PostgreSQL Hardware Performance Tuning http://www.postgresql.org/files/documentation/books/aw_pgsql/hw_performance/

● Дейт, К.. Введение в системы баз данных — Глава 17.

● Кузнецов, С. Д. Основы современных баз данных — 9.2. Индексы http://citforum.ru/database/osbd/glava_39.shtml#_4_1_2

● ГарсиаМолина, Г., Ульман, Дж., Уидом, Дж. Системы баз данных. Полный курс. — Главы 1316

Контакты

● nikolay@samokhvalov.com

● Blog: http://nikolay.samokhvalov.com

● XMPP/GTalk: samokhvalov@gmail.com

● Skype: samokhvalov & postgresmen

● +7 905 783 9804

PostgreSQL: промышленная разработка баз данных. Лекция 5

Documents

Transcript of PostgreSQL: промышленная разработка баз данных. Лекция 5

Промышленная Группа «Союз»

Уровень баз данных

Разработка баз данных - введение

ПРИМОРСКАЯ ТОРГОВО - ПРОМЫШЛЕННАЯ ПАЛАТА

Разработка Microsoft SQL Server 2005 – Методическое курсу ...window.edu.ru/resource/395/39395/files/sql2005.pdf · Разработка баз данных

Промышленная телефония

Промышленная недвижимость России

Промышленная безопасность

Промышленная разработка ПО. Лекция 1. Общие понятия

ГИПРОСИНТЕЗ - SEMICON Europa · баз данных База данных 2 ... Разработка математических моделей, расчет показателей

Каталог продукции БАЗ

Промышленная разработка ПО. Лекция 4. Особенности работы программиста. Ча…

РАЗРАБОТКА БАЗ ДАННЫХ В MICROSOFT VISUAL FOXPRO · 2011-06-28 · И.И. Семенова РАЗРАБОТКА БАЗ ДАННЫХ В MICROSOFT VISUAL FOXPRO Часть

РАЗРАБОТКА БАЗ ДАННЫХ В MICROSOFT VISUAL FOXPROsemenova.pro/new/vfp_semenova.pdf · MS Visual FoxPro является системой управления реляционными

Масштабирование баз данных

ГОСТ 5762-2002 Арматура трубопроводная промышленная ... · Title: ГОСТ 5762-2002 Арматура трубопроводная промышленная.

Рефакторинг баз данных

Разработка, тестирование и развертывание баз данных в Visual Studio Team System 2010

PostgreSQL: промышленная разработка баз данных. Лекция 3

Промышленная разработка в индийских IT-командах