- більш жорсткі вимоги до сумісності компонентів.
- поява в силу дорожнечі
DAS-"островів" в мережах на базі FC - протоколу, коли на
підприємствах з'являються поодинокі сервери з внутрішнім дисковим простором,
NAS-сервери або DAS-системи в силу браку бюджету.
На даний момент для зберігання даних в дискових масивах використовуються SATA і SAS диски. Які диски вибрати в сховище залежить від конкретних завдань. Варто відзначити декілька фактів.II диски:
- доступні обсяги одного диска до 1 ТБ
- швидкість обертання 5400-7200 RPM
- швидкість введення / виведення до 2,4 Гбіт / с
- час напрацювання на відмову приблизно в два рази менше ніж у SAS дисків.
- менш надійні, ніж SAS диски.
- дешевше приблизно в 1,5 рази, ніж SAS - диски.
SAS диски:
- доступні обсяги одного диска до 450 ГБ
- швидкість обертання 7200 (NearLine), 10000 і 15000 RPM
- швидкість введення/виведення до 3,0 Гбіт/с
- час напрацювання на відмову в два рази більше ніж у SATA II дисків.
- більш надійні диски.
Рисунок 2.3.1 - Жесткий диск
SCSI чимось схожий на всім відомий IDE - це
паралельний інтерфейс, що допускає до 16 пристроїв на одній шині (рис.2.4.1).
На даний момент максимальна швидкість протоколу SCSI - 320 Мбайт/с, часто так і
пишуть - SCSI U320. Недоліки SCSI очевидні - товсті незручні кабелі, що мають
обмеження на максимальну довжину (до 25 м), що не володіють
поміхозахищенніст’ю.
Рисунок 2.4.1 - Інтерфейси SCSI
FibreChannel дуже популярний у середовищі IT-фахівців - які переваги несе ця технологія, майже невідомо "домашнім користувачам" (рис.2.4.2). Причина зрозуміла - дорожнеча обладнання і призначення протоколу FibreChannel (FCP) для розгортання масштабних мереж зберігання даних (SAN), що знаходить застосування тільки у великих компаніях.
На практиці сучасний FibreChannel має швидкість 2
Гбіт (FibreChannel 2 Gb) або 4 Гбіт (FibreChannel 4 Gb), тобто така швидкість
забезпечується одночасно в обидві сторони. У перекладі на швидкість каналу
отримуємо 200 або 400 Мбайт / с по оптичному двожильного кабелю.
Рисунок 2.4.2 - Інтерфейс FibreChannel
Відстані практично не обмежені - від стандартних
300 метрів на самому "звичайному" обладнанні до 2000 км для потужних
комутаторів, так званих "директорів". Головний плюс інтерфейсу
FibreChannel - можливість об'єднання багатьох пристроїв зберігання і хостів
(серверів) в єдину мережу зберігання даних (SAN).(Internet Small Computer
System Interface). За визначенням: "iSCSI це протокол, який базується на
TCP/IP і розроблений для встановлення взаємодії та управління системами
зберігання даних, серверами і клієнтами" (рис.2.4.3). iSCSI посилає SCSI
команди в IP пакетах. Більш докладно - iSCSI створений як протокол для
ініціатора сховищ (зазвичай сервер), з метою посилати SCSI команди виконавцю
через IP.
Рисунок 2.4.3 - Інтерфейс iSCSI
Інакше кажучи, iSCSI - це протокол SCSI через IP,
що зв'язує сервер зі сховищем даних. Інші протоколи забезпечують з'єднання
Fibre Channel - Fibre Channel з різним ступенем інтелектуальності.
Система зберігання даних призначена для організації надійного зберігання даних, а також відмовостійкості, високопродуктивного доступу серверів до пристроїв зберігання. Існуючі в даний час методи щодо забезпечення надійного зберігання даних і відмовостійкого доступу до них можна охарактеризувати одним словом - дублювання.
Так, для захисту від відмов окремих дисків використовуються технології RAID.
В основі роботи RAID лежать кілька принципів організації запису даних на масив дисків. Реалізація цих принципів дозволяє прискорити запис і вилучення даних, а також збільшити ступінь надійності їх зберігання.
Принципи організації запису даних:
- дані в процесі запису розбиваються на кілька потоків, і кожен потік записується на свій диск. В результаті збільшується швидкість запису і швидкість зчитування інформації, однак при цьому кожен диск містить лише частина набору даних, тому втрата будь-який з частин руйнує весь набір.
- весь потік даних одночасно записується на декілька дисків. При цьому кожен диск стає повною копією інших. Вихід з ладу будь-якого з дисків ніяк не позначається на збереження інформації, так як залишаються інші копії. Це підвищує ступінь надійності зберігання, проте призводить до надмірності інформації, що зберігається.
При створенні масивів RAID всі перераховані вище
принципи використовуються в різних комбінаціях, різновиди яких називаються
рівнями RAID (рис.2.5.1).
Рисунок 2.5.1 - RAID рівні
Рівні RAID - спосіб організації дисків всередині
масиву. У 1993 році промисловий консорціум по стандартизації RAID (RAID
Advisory Board - RAB) визначив сім типових рівнів RAID: від 0 до 6. Термін
"рівні RAID" є офіційним і міцно увійшов в лексику комп'ютерних
користувачів, хоча ніякої ієрархії тут немає: це всього лише сім абсолютно
різних незалежних архітектур. Специфікація RAID-2 залишилася чисто теоретично, оскільки
описує масиви з 14 або 39 дисків. Зате вже після прийняття стандарту були
запропоновані специфікації RAID 0 +1 і RAID 1 +0 (RAID - 10), які по суті є
комбінаціями RAID - 0 і RAID - 1.- найпростіший варіант побудови масиву
(рис.2.5.2). Це так зване чергування, або просте розпаралелювання
запису/читання даних між усіма дисками. Потік даних розбивається на рівні блоки
заданого розміру, і перший блок записується на один диск, другий - на
наступний, третій - знову на перший диск і т.д. Масив може будуватися з будь-якого
числа дисків: чим більше їх чергується, тим вище швидкість обміну даними. Запис
проводиться без надмірності, тому такий масив не є RAID в прямому сенсі, хоча
термін RAID-0 широко використовується.
Рисунок 2.5.2 - Масив з рівнем RAID 0
Ступінь надійності такого масиву завжди нижче
ступеня надійності вхідних у нього дисків. При виході з ладу будь-якого з
дисків дані всього масиву будуть втрачені, тому RAID-0 іноді порівнюють з міною
сповільненої дії. Теоретично швидкість обміну даними зростає пропорційно числу
дисків, що утворюють масив, а ємність масиву дорівнює сумі ємностей дисків. На
практиці результат дещо менше. Типове застосування RAID-0 знаходить там, де
важлива швидкість, а не ступінь надійності.є інший найпростішої архітектурою
(рис.2.5.3). У цьому випадку проводиться запис двох дзеркальних копій даних на
двох ідентичних дисках без всяких додаткових перетворень. Вихід з ладу одного
диска не приводить до втрати даних. Це масив з 100% надмірністю. Він забезпечує
граничну ступінь надійності, хоча вартість зберігання даних зростає рівно
вдвічі. Масиви рівня 1 підходять для зберігання критично важливих даних. На
практиці швидкодія такого масиву може трохи перевершувати швидкодію кожного з
дисків. Це пов'язано з апаратною реалізацією читання і запису даних.
Рисунок 2.5.3 - Масив з рівнем RAID 1
відмовостійковий дисковий масив, реалізованний з допомогою коду Хеммінга. Схема резервування даних із використанням коду Хеммінга для корекції помилок.
Потік даних розбивається на свої слова - причому
розмір слова відповідає кількості дисків для записи даних. До кожного слова
обчислюється код корекції помилок, який записується на диски, виділені для
зберігання контрольної інформації. Їх кількість дорівнює кількості біт в слові
контрольної суми.- трьохдисковий масив. Два диска в ньому працюють подібно
RAID-0, дані на них записуються з чергуванням. Однак для кожних двох блоків, що
чергуються контролер обчислює код парності і записує його на третій диск.
Завдяки простому алгоритму дані парності для двох блоків займають стільки ж
місця, скільки кожен з цих блоків. В результаті утворюються набори з трьох
взаємопов'язаних блоків: два, на перших двох дисках, містять дані, а третій, на
третьому диску
- контрольну
суму для двох блоків даних (рис.2.5.4). За даними на одному з перших двох
дисків і контрольних сумах завжди можна відновити вміст іншого диска при його
пошкодженні. Так само коди парності, у разі аварії третього диска, завжди можна
перерахувати за даними на перших двох дисках.
Рисунок 2.5.4 - Масив з рівнем RAID 3
Швидкість роботи такого масиву така ж, як у
RAID-0, а відмовостійкість аналогічна RAID-1. Накладні витрати знижені за
рахунок того, що ємність масиву з трьох однакових дисків приблизно дорівнює
подвоєною ємності одного диска.відрізняється тільки розмірами блоків даних при
чергуванні. Це дещо покращує роботу масиву при випадковому читанні, але через
більшого обсягу буферної пам'яті контролери RAID-4 не отримали широкого
розповсюдження (рис.2.5.5)
Рисунок 2.5.5 - Масив з рівнем RAID 4
- інша реалізація ідеї чергування з контролем
парності. Чергування блоків даних відбувається між усіма трьома дисками. У
масиві рівня 5 всі диски рівноцінні, а блоки парності розподілені між ними
(рис.2.5.6). При цьому блок парності для блоків, які знаходяться на двох
дисках, завжди записується на третій диск і так далі "по колу".
Порядок чергування блоків даних і блоків парності залежить від контролера.
Існує кілька варіантів такого чергування: Forward (пряме), Backward (зворотне)
і Backward symmetric (зворотне симетричне). У більшості сучасних
RAID-контролерів використовується останній варіант.
Рисунок 2.5.6 - Масив з рівнем RAID 5
сьогодні вважається найбільш оптимальною
конфігурацією масиву для високопродуктивних і надійних робочих станцій.
Підтримка цього рівня, поряд з RAID-0 і RAID-1, закладена в багато вбудовані
контролери сучасних материнських плат.. У специфікації RAID-6 контрольна сума
обчислюється два рази і копіюється відразу на два різних диска (рис.2.5.7). У
результаті працездатність масиву зберігається навіть при одночасній поломці
двох дисків з трьох. Це дуже надійне, але дороге рішення, яке так і не знайшло
широкого застосування.
Рисунок 2.5.7 - Масив з рівнем RAID 6
Складові масиви (multi-RAID) являють собою поєднання двох специфікацій. Вони можуть реалізовуватися повністю на рівні контролера або частково на апаратному рівні, а частково на програмному.0 +1 - чергування двох або декількох дводискових масивів RAID-1.1 +0 (RAID-10) - дзеркалювання масиву RAID-0 на інший такий же масив.
Масиви RAID 5+0 (RAID-50) і RAID 6+0 (RAID-60) утворюються чергуванням масивів рівнів 5 і 6 відповідно. Це великі серверні рішення. Для їх реалізації потрібні дорогі багатопортові контролери, а в масив включатимуться від шести до декількох десятків жорстких дисків.
Існує специфікація JBOD (Just a Bunch of Disks - проста група дисків). У цьому випадку кілька вінчестерів представляються одним великим диском. Об'єднання кількох фізичних дисків ще недавно використовувалося в комп'ютерах для відеозахоплення і відеомонтажу, щоб отримати достатньо місця для збереження безперервного файлу розміром в десятки або сотні гігабайтів. З появою терабайтних вінчестерів це втратило актуальність.1Е. Буква "E" в назві означає "Enhanced", тобто "покращений". Принцип цього поліпшення наступний: дані блоками "чергуються" на всі диски масиву, а потім ще раз "чергуються" із зсувом на один диск. У RAID 1E можна об'єднувати від трьох до 16 дисків. Надійність відповідає показникам "десятки", а продуктивність за рахунок більшого "чергування" стає трохи краще.1е0. Цей рівень реалізується так: ми створюємо "нульовий" масив з масивів RAID1E. Отже, загальна кількість дисків має бути кратне трьом: мінімум три і максимум - шістдесят! Перевага у швидкості при цьому ми навряд чи отримаємо, а складність реалізації може несприятливо відбитися на надійності. Головне достоїнство - можливість об'єднати в один масив дуже велике (до 60) кількість дисків.
Подібність всіх рівнів RAID 1X полягає в їх
показниках надмірності: заради реалізації надійності жертвується рівно 50 %
сумарної ємності дисків масиву.
Пошкодження масиву - фізичні або логічні помилки на одному або декількох дисках, що входять до складу масиву. Контролер коректно працює з дисками, що утворюють RAID, хоча зазвичай видає повідомлення про помилки дисків. У цьому випадку RAID-масив продовжує залишатися для операційної системи єдиним диском, але на ньому виникають ті чи інші помилки або він представляється неформатованним.
Фізичні або логічні проблеми з одним з дисків в масиві рівня 1 або 5 можна розглядати як штатна подія: масив і створювався, щоб зберегти дані в такій ситуації. RAID-контролер майже завжди вірно розпізнає таку ситуацію в процесі ініціалізації масиву, виводить відповідне повідомлення і пропонує замінити несправний диск. Після заміни вінчестера і включення комп'ютера контролер пропонує включити новий диск в масив і відтворити дані на ньому з справних дисків масиву. В результаті і фізична, і логічна цілісність масиву майже обов'язково відновлюється.
Руйнування масиву-результат втрати контролером відомостей про конфігурацію масиву. У цьому випадку вінчестери, що входили в масив, бачаться системою як окремі диски, а деякі з них можуть зовсім не розпізнаватися. В оснащенні управління дисками вони найчастіше показуються неформатованними або як диски з невідомою файловою системою.
Вихід з ладу RAID-контролера однозначно веде до руйнування масиву. Підключення дисків, що входили в масив, до іншого ідентичному контролеру і спроба ініціювати його далеко не завжди приводять до успіху. Тим більше знайти точно такий же контролер, випущений кілька років тому, буває проблематично. Тому в більшості випадків розумною тактикою стає вилучення даних із зруйнованого масиву програмними методами (R-Studio, File Scavenger та ін.).
Таким чином, втрата інформації може відбутися лише при руйнуванні будь-якого масиву або при пошкодженні масивів RAID-0 або JBOD. У надлишкових масивах рівнів 1, 3, 5, 1+0 і 0+1 інформація зберігається за визначенням, а цілісність набору відновлюється штатними засобами контролера при заміні несправного диска.
"Гаряча замінна" (hot swape) - це легка процедура заміни диска, просто, виймаєте несправний диск з кошика, вставляєте справний і починається ребілдінг масиву.
"Гаряче резервування" (hot spare) - це
коли у вас в кошику один запасний диск встановлений і відзначений в
конфігурації RAID-масиву як hot spare, в цьому випадку при виході якого не будь
диска в масиві запасний диск автоматично підключиться до масиву, а несправний
відключиться і навпроти нього в кошику загориться червона лампочка. Після чого
можно зробити замінну цього диска.
Треба відразу визнати, що продукція Maxtronic не являє собою щось унікальне або технологічно революційне - вона просто вдало потрапила в магістральний напрям розвитку систем зберігання даних. Як уже зазначалося, в силу уніфікації комп'ютерної техніки в більшості випадків на апаратному рівні подібні пристрої часто відрізняються тільки торговою маркою і ціною. Більш того, деякі відомі європейські виробники насправді постачають все ті ж RAID-масиви від Maxtronic, але вже під своїми торговими марками і, звичайно, за інші гроші.