ГлавнаяНовости › Vertica — Cекрет колонковой СУБД.

Vertica — Cекрет колонковой СУБД.

Vertica — Cекрет колонковой СУБД.

Vertica стала одной из первых, так называемых «аналитических» систем (или колонковых с архитектурой массивно-параллельных вычислений) хранилищ данных, значительно ускорив не только анализ данных, но и обеспечив ряд других важных преимуществ по сравнению с строчными.

Архитектура традиционных хранилищ данных разрабатывалась на основе строчных реляционных СУБД, рассчитанных на обработку транзакций в реальном времени (OLTP). В отличие от задач OLTP, аналитические запросы содержат только ряд атрибутов, а это значит, что для основной части аналитики колонковая архитектура обеспечивает максимальную производительность и эффективность.

Секрет колонковой СУБД — в ее непревзойденной скорости работы. В традиционных реляционных СУБД информация сохраняется в строках, поэтому, даже когда по вашему запросу нужные данные из одной колонки, СУБД сканирует содержимое всех строк — каждого столбца в каждой строке.

Вторая главное преимущество колонкового хранилища состоит в том, что его архитектура позволяет сократить объем операций ввода-вывода данных — а это существенный параметр для аналитической обработки.

Третье преимущество — эффективное сжатие данных, обеспечивает в 4-5 раз более высокую производительность, чем традиционные СУБД.

Колонковое хранилище — это, конечно, не панацея, ведь нет ни одной технологии, которая решила бы все существующие проблемы. Но недостатки колонкового хранилища трансформируются в преимущества, когда речь идет не о транзакционные нагрузки, характерные для учетных систем, а о аналитическое нагрузки. Одна из особенностей колонковой платформы, в частности, заключается в том, что она сохраняет каждый столбец в отдельном множества файлов.

Развертывание колонковой СУБД в ее базовой конфигурации может привести к замедлению операций сложения и обновления данных, а также задержать — или усложнить — их загрузки. Чтобы избежать подобных проблем, в колонковых СУБД, в частности в Vertica, реализуются оптимизированные технологии массивно-параллельной загрузки и используются реляционные подходы OLAP (ROLAP) или комплексные методы OLAP (MOLAP).

Если колонковая архитектура оптимальна для выполнения анализа данных, то массивно-параллельная архитектура — для масштабирования аналитической обработки.

Хотите знать больше? С вопросами обращайтесь на software@erc.ua и пишите в комментариях, о Vertica вас интересует!




Поделиться