Терадата використовує алгоритм хешування для розподілу даних на основі основного індексу таблиці. Основний індекс — це стовпець або комбінація стовпців, які однозначно ідентифікують кожен рядок у таблиці. Алгоритм хешування перетворює значення основного індексу в хеш-значення, які потім зіставляються з діапазоном чисел amp.

Розподілена база даних – це база даних, яка запускає та зберігає дані на кількох комп’ютерах, на відміну від того, щоб робити все на одній машині. Як правило, розподілені бази даних працюють на двох або більше взаємопов’язаних серверах комп’ютерної мережі.

Дані розподіляються по amp на основі хеш-значення основних стовпців індексу. Ти можеш використовуйте функції HASH, щоб побачити, до якого AMP буде розподілено рядок. Функція виглядатиме так: HASHAMP(HASHBUCKET(HASHROW())).

Незміщені рядки перерозподіляються шляхом повторного хешування об’єднаних стовпців. Неупереджені рядки з маленької таблиці S повторюються в їх об’єднаних стовпцях, тоді як рядки, які були б перекошені під час перерозподілу, дублюються в усіх AMP.

Візуалізуйте розподіл даних за допомогою графічних методів, таких як гістограми, графіки щільності, прямокутні графіки та графіки квантиль-квантиль (Q-Q).. Гістограми надають візуальне представлення розподілу частот шляхом поділу даних на інтервали або відрізки та відображення кількості спостережень у кожному відрізку.