ГоловнаНовини › Vertica – cекрет колонкової СУБД.

Vertica – cекрет колонкової СУБД.

Vertica – cекрет колонкової СУБД.

Vertica стала однією з перших, так званих «аналітичних» систем (або колонкових з архітектурою масивно-паралельних обчислювань) сховищ даних, значно прискоривши не тільки аналіз даних, але і забезпечивши ряд інших важливих переваг у порівнянні із рядковими.

Архітектура традиційних сховищ даних розроблялась на основі рядкових реляційних СУБД, розрахованих на обробку транзакцій у реальному часі (OLTP). На відміну від задач OLTP, аналітичні запити містять лише ряд атрибутів, а це означає, що для основної частини аналітики колонкова архітектура забезпечує максимальну продуктивність та ефективність.

Секрет колонкової СУБД — в її неперевершеній швидкості роботи. У традиційних реляційних СУБД інформація зберігається в рядках, тому, навіть коли за вашим запитом потрібні дані з одного стовпчика, СУБД сканує вміст всіх рядків — кожного стовпця в кожному рядку.

Друга головна перевага колонкового сховища полягає у тому, що його архітектура дозволяє скоротити обсяг операцій вводу-виводу даних — а це найістотніший параметр для аналітичної обробки.

Третя перевага — ефективне стиснення даних, що забезпечує в 4-5 разів вищу продуктивність, ніж традиційні СУБД.

Колонкове сховище — це, звісно, не панацея, адже немає жодної технології, яка вирішила б усі існуючі проблеми. Але недоліки колонкового сховища трансформуються у переваги, коли мова йде не про транзакційні навантаження, характерні для облікових систем, а про аналітичне навантаження. Одна з особливостей колонкової платформи, зокрема, полягає в тому, що вона зберігає кожен стовпець в окремому безлічі файлів.

Розгортання колонкової СУБД в її базовій конфігурації може призвести до уповільнення операцій додавання і оновлення даних, а також затримати — або ускладнити — їх завантаження. Щоб уникнути подібних проблем, в колонкових СУБД, зокрема в Vertica, реалізуються оптимізовані технології масивно-паралельного завантаження і використовуються реляційні підходи OLAP (ROLAP) або комплексні методи OLAP (MOLAP).

Якщо колонкова архітектура оптимальна для виконання аналізу даних, то масивно-паралельна архітектура – для масштабування аналітичної обробки.

Хочете знати більше? Із питаннями звертайтесь на software@erc.ua та пишіть у коментарях, що про Vertica вас цікавить!




Поділитися