Програмний метод - відеокарти не з'єднуються, обмін даними йде по шині PCI Express x16, при цьому їх взаємодія реалізується за допомогою драйверів. Недоліком даного способу є втрати в продуктивності на 10-15% в порівнянні з вищеназваним способом. На даний момент практично повністю загубив актуальність, залишившись способом з'єднання низько продуктивних відеокарт, для яких відсутність сполучного містка не є значущою втратою. Високопродуктивні відеокарти можна об'єднати, тільки використовуючи містки, так як без них драйвер не зрозуміє, що таке об'єднання можливе.- обмін між відеокартами виробляється, як і в попередньому випадку, по шині PCI Express, але за допомогою спеціалізованого апаратного блоку XDMA, наявного в GPU починаючи з R9-285, R9-290 або R9-290X.
Завдяки апаратно-керованого обміну даними досягається скорочення втрат продуктивності в порівнянні з програмно-керованим обміном. Тим не менш, втрати продуктивності можуть виникати через особливості побудови системи PCI Express, наприклад, за наявності між відеокартамі декількох мостів [12].
Алгоритми побудови зображень:
Картинка розбивається на квадрати 32x32 пікселі і приймає
вид шахової дошки. Кожен квадрат обробляється однією відеокартою.
Рисунок 7. Схема алгоритму SuperTiling
Схема алгоритму Scissor
Зображення розбивається на кілька частин, кількість яких
відповідає кількості відеокарт у зв'язці. Кожна частина зображення обробляється
однією відеокартою повністю, включаючи геометричну і піксельну складові.
Рисунок 8. Схема алгоритму Scissor
Аналог в nVidia SLI - алгоритм Split Frame RenderingFrame Rendering
Обробка кадрів відбувається по черзі: одна відеокарта
обробляє тільки парні кадри, а друга - тільки непарні. Однак, у цього алгоритму
є недолік. Справа в тому, що один кадр може бути простим, а інший складним для
обробки.
Рисунок 9. Схема алгоритму Alternate Frame Rendering
Цей алгоритм, запатентований ATI ще під час випуску двочіпової відеокарти, використовується також в nVidia SLI.
Даний алгоритм націлений на підвищення якості зображення. Одна і та ж картинка генерується на всіх відеокартах з різними шаблонами згладжування. Відеокарта робить згладжування кадру з деяким кроком щодо зображення іншої відеокарти. Потім отримані зображення змішуються і виводяться. Таким чином досягається максимальна чіткість і деталізованість зображення. Доступні наступні режими згладжування: 8x, 10x, 12x и 14x.
Аналог в nVidia SLI - SLI AA.GraphicsGraphics (раніше Hybrid CrossFireX) - унікальна здатність APU лінійки Fusion A-серії Llano значно (принаймні в теорії) збільшувати загальну продуктивність відеопідсистеми, коли інтегрований GPU працює спільно з підключеною дискретною відеоплатой, доповнюючи її. Ще більш дивною є здатність Llano працювати з GPU, які швидше або повільніше ніж його власне інтегроване відеоядро - для коректної роботи Dual Graphics не вимагає ідентичного GPU і при цьому він не шкодить швидшому GPU, якщо його продуктивність нижче, як відбувається в CrossFire. Фактично, він приводить в рівновагу доступне апаратне забезпечення для більшої продуктивності (наприклад, якщо дискретний GPU вдвічі швидше вбудованого, драйвер бере один кадр від APU на кожні два кадри від дискретної карти).
При всій спокусливості подібної асиметричної реалізації CrossFire, є серйозні недоліки:
По-перше, це працює тільки в додатках, що використовують DirectX 10 або 11. І якщо використовується DirectX 9 або більш ранній ігровий рушій, то продуктивність погіршується до самої повільної з двох встановлених графічних карт (проте, згідно з останніми заявами AMD, при використанні DirectX нижче 10 версії програми повинні звертатися до більш швидкої з двох встановлених графічних карт).
По-друге, щоб Dual Graphics працювала, коефіцієнт графічної продуктивності повинен бути принаймні "два до одного", якщо відеокарта в три рази швидше GPU Llano, то Dual Graphics працювати не буде.
В OpenGL Dual Graphics не підтримується, і він завжди працює на GPU, керуючому основним виходом дисплея.
І хоча ця функція дійсно працює і результати тесту показують вищу частоту кадрів в чистому вигляді.
Приклад: ПЄОМ з відеокартою AMD Radeon R9 380 2 ГБ,
материнською платою MSI A88XM-P33 (процесорний слот Socket FM2 +), процесор AMD
A8-7670K (інтегрований графічний прискорювач AMD Radeon R7).
SLI (англ. Scalable link interface, рос. Масштабований інтерфейс зв'язку) - технологія, що дозволяє використовувати потужності декількох відеокарт для обробки тривимірного зображення.
У 2001 році NVIDIA купує 3dfx за 110 млн доларів. З введенням специфікації PCI-E стає знову можливим використання декількох графічних карт для обробки зображення. У 2004 році, з виходом перших рішень на базі нової шини PCI Express, NVIDIA повідомляє про підтримку у своїх продуктах технології мультичіпової обробки даних SLI, що розшифровується вже по-іншому - Scalable Link Interface (масштабований інтерфейс).
Подальшим розвитком технології став вихід в 2006 році технології Quad SLI дозволяє об'єднати пару двох чіпових відеокарт (тоді для GeForce 7900GX2). А наприкінці 2007 року введена в експлуатацію технологія 3-Way SLI, що дозволяє об'єднувати у зв'язці 3 відеокарти Nvidia.
Для побудови комп'ютера на базі SLI необхідно мати:
материнську плату з двома і більше роз'ємами PCI Express x16, що підтримує технологію SLI;
якісний блок живлення потужністю мінімум 550 ват (рекомендуються блоки SLI-Ready);
відеокарти GeForce 6/7/8/9, GT (S / X) 200/300/400/500/600/700/800/900 або Quadro FX з шиною PCI Express;
міст, що поєднує відеокарти.
Підтримка чипсетів для роботи з SLI здійснюється програмно. Відкрите повинні бути однієї моделі, при цьому версія BIOS плат, їх виробник, частота ядра, частота відео пам'яті і обсяг відео пам'яті значення не мають.систему можна організувати двома способами:
За допомогою спеціального містка SLI;
Програмним шляхом.
В останньому випадку навантаження на шину PCIe зростає, що погано позначається на продуктивності.
Набула поширення система Quad SLI. Вона передбачає об'єднання в SLI-систему двох двочіпових плат (GeForce 7950GX2, GeForce 9800GX2, GeForce GTX295 або GeForce GTX 590) або чотирьох одночіпових (в даному випадку вона іменується 4-Way SLI). Таким чином, виходить, що в побудові зображення беруть участь 4 чіпи. Примітка: Quad SLI поки коректно працює тільки в операційній системі Windows 7 і Windows Vista, в Windows XP її не можна використовувати через обмеження в ОС.
Робоча пам'ять.
Багато виробників "подвійних" відеокарт воліють писати сумарний обсяг локальної пам'яті (наприклад, EVGA або Palit). Насправді ж такі відеоадаптери, фактично будучи SLI-картами, можуть використовувати тільки власну, встановлену на друкованій платі, пам'ять. Тобто в побудові зображенні, наприклад, відеокарта GeForce GTX295 зможе використовувати тільки 896 Мб пам'яті. Кожен її чіп має в своєму розпорядженні тільки половину від заявленої виробником.
Процесорозалежність
Зв'язка з відеокарт SLI спочатку є досить продуктивним рішенням, наприклад, з пари GeForce GTX260. Але тут виникає проблема процесорозалежності, оскільки багато сучасні ігри дуже інтенсивно використовують ЦП, так само, як і сам SLI. Тому, щоб зв'язка SLI повністю розкрила свій потенціал, необхідний відповідний потужний процесор з високою тактовою частотою; в іншому випадку приросту від використання SLI буде набагато менше очікуваного.
Оптимальним (на 2015 рік) для більшості ігор на
систему SLI з двох GeForce GTX275 є процесор рівня Core 2 Duo E8400-E8600,
розігнаний до 4 ГГц. Менша частота процесора призводить до падіння кадрової
частоти, а більш висока частота процесора (порядку 4,5-5 ГГц) кадрову частоту
вже не збільшує.
Серія відеокарт Quadro призначена для вирішення професійних графічних завдань, тому тут виробник передбачив наявність сертифікованих драйверів, оптимізованих під такі програми, як CAD або DCC. Таким чином, продуктивність OpenGL повинна істотно зрости, в порівнянні з серією GeForce.
Що стосується рівня продуктивності Quadro K2100M, то його можна порівняти з GT 750M, але при цьому відеокарта поступається Quadro K3000M. Таким чином, потужності вистачить на програвання вимогливих ігор 2013 року на середніх і високих налаштуваннях.
Розширений набір додаткових функцій дозволяє зробити роботу даного графічного адаптера набагато продуктивніше. З відеокартою NVIDIA Quadro K2100M доступні підтримка дисплеїв з високою роздільною здатністю (3840х2160 пікселів) і одночасне підключення до чотирьох активних моніторів. Це можливо за допомогою DisplayPort 1.2 або HDMI 1.4a. Крім того, через HDMI можна передавати деякі формати аудіокодеків - Dolby TrueHD і DTS-HD. Проте слід врахувати, що в ноутбуках з підтримкою технології Optimus інтегрована графіка отримує повний контроль над портами дисплея, оранічівая, таким чином, доступні можливості дискретної графіки.
Для реалізації функції картинка-в-картинці можуть одночасно розшифровуватися два потоки. Крім того, відеопроцесор п'ятого покоління PureVideo HD (VP5) виконує апаратне декодування відео HD, обробляючи MPEG-1/2, MPEG-4 ASP, H.264 і VC1/WMV9 повністю в дозволі до 4К, а VC1 і MPEG-4 до 1080р. Модуль кодування схожий на Intel QuickSync, і доступний через API NVENC.
Продуктивність роботи в останніх версіях
Autodesk® AutoCAD, Autodesk® Inventor і Autodesk® 3ds Max з використанням
відеокарт Quadro. Це означає, що користувач з легкістю можете збільшити
складність своїх проектів, візуалізувати швидше і виправляти помилки на більш
ранніх етапах проектування.
Рисунок 10. Продуктивність роботи графічної карти
в ПЗ 3ds MAX відносно розрахунків з допомогою процесора Intel Xeon 2.6 GHz, 32
GB RAM [13]
Звернемо увагу на те, що для виконання графічного
проектування у програмних продуктах як то 3ds MAX необхідно використовувати не
тільки спеціалізовані відеокарти, а й спеціалізовані процесори (Intel Xeon 2.6 GHz
- процесор з 6 ядрами та з можливістю роботи з 12 потоками).
Рисунок 11. Відносна продуктивність роботи графічної карти в ПЗ AUTODESK 3ds MAX [13]
Рисунок 12. Продуктивність роботи графічної карти
Quadro K2200 в ПЗ AUTODESK INVENTOR в залежності від важкості моделі [13]
Розглянемо продуктивність роботи відеокарт при відео монтажі в ПЗ Adobe Premiere Pro CS5.5.
Тестування відбувалося на робочих станціях: HP Z600 (2х чотирьохядерних процесора Intel Xeon E5640, 2.66ГГц) і Z400 (чотирьохядерний процесор Intel Xeon W3520, 2.66ГГц), 24Гб оперативної пам'яті. Відеокарти тестувалися класу Quadro: Quadro 2000, Quadro 4000, Quadro 5000, Quadro FX 4800.
В результаті відзначені важливі речі: прискорення
роботи залежить як від використовуваного формату відео, від конфігурації
комп'ютера, так і від прийомів роботи і налаштувань системи.
Таблиця 1 Експорт відео, додано масштабування відео: HD> SD. Використано стандартний пресет: NTSC Widescreen High Quality.
Відзначимо чотирнадцяти кратне зростання продуктивності професійної відеокарти Quadro +5000 на робочій станції HP Z400. [14]
Для рішення від AMD - FirePro ми маємо наступні технічні характеристики:
архітектура GCN: Призначена для рендеринга і використання графічного процесора в обчисленнях;
технологія AMD Eyefinity: Можливість підключення шести дисплеїв з роздільною здатністю 4K1;Express 3.0: Більше продуктивності з більшою пропускною здатністю.
Продуктивність можливо оцінити за допомогою
порівняльних графіків.
Рисунок 13. Продуктивність роботи графічної карти
AMD FirePro W7000 в ПЗ SolidWorks 2013, Siemens PLM Soft, Medical-01, Catia та
ін. в порівнянні з Quatro K4000 [15]
Рисунок 13. Продуктивність роботи графічної карти
AMD FirePro W5000 в ПЗ SolidWorks 2013, Siemens PLM Soft, Medical-01, Catia та
ін. в порівнянні з Quatro K2000 [15]
Результати порівняння продуктивності T-FLEX CAD
12 на професійних відкритих Quadro K620 і Quadro K2200 при різних рівнях
згладжування anti-aliasing. У ході тестування вимірювалося середня кількість
кадрів в секунду.
Таблиця 2 Результат тесту відеокарт Quadro у
програмному пакеті T-FLEX CAD 12 [13]
ВИДЕОКАРТА
QUADRO
K620 <#"871870.files/image020.gif">
Рисунок 14. Зовнішній
вигляд відеокарти AMD FirePro™ W5000
Пам'ять
§ Об'єм/Тип: 2 ГБ
GDDR5
§ Інтерфейс: 256
бит
§ Пропускна
здатність: 102,4 ГБ
Продуктивність
розрахунків
§ 1,3 терафлопс для
чисел с одинарною точністю и 79,2 гігафлопс для чисел з подвійною точністю з
плаваючою комою.
Параметри виводу
§ DisplayPort: Два
стандартних
§ DVI: Один DVI-I
(dual-link)
§ Максимальна
роздільна здатність DisplayPort 1,2: 4096x2160
§ Максимальна
роздільна здатність DisplayPort 1.1: 2560x1600
§ Максимальна
роздільна здатність DVI: 2560x1600
API/Характеристики/Підтримка
ОС
§ DirectX® 11.1
§ OpenGL 4,2
§ OpenCL™ 1,2
§ Шейдерна модель:
5.0
§ Підтримка
технології AMD Eyefinity: Да
§ Підтримка AMD
CrossFire™ Pro: Да
§ Підтримка AMD
HD3D Pro: Да (через стереоскопічний 3-штирьковий роз'єм mini-DIN)
§ Підтримка
операционних систем: Microsoft® Windows 8, Microsoft® Windows® 7, Windows® XP,
Windows Vista® и Linux® (32 - або 64-разрядные) 3
Потужність / Форм-фактор
§ Максимальна
потужність: < 75 Вт
§ Роз'єми: Один
§ Форм-фактор:
Повна висота / зменшена довжина
§ Інтерфейс шини:
PCIe® x16, 3.0 для оптимальної продуктивності
§ Охолодження:
активний вентилятор
Рисунок 15. Зовнішній
вигляд відеокарти QUADRO K2200
Технічні характеристики
ГПУ пам'яті 4 ГБ GDDR5
Інтерфейс пам'яті 128-біт
Пропускна здатність пам'яті 80.0 Гб / сCUDA Cores
640
Інтерфейс системи PCI Express 2.0 x16
Максимальна споживана потужність 68 Вт
Системи охолодження безшумний Активний кулер
Форм-фактор 4,376 "Н × 7,97" L, Одномісний
Роз'єми DVI-I DL + 2 DP 1.2
Макс Одночасне відображення 3 Direct, 4 DP 1.2
Макс DP 1.2 Дозвіл 3840 х 2160 при 60 Гц
Макс DVI-I Дозвіл DL 2560 × 1600 при 60 Гц
Макс DVI-I Дозвіл SL 1920 × 1200 при 60 Гц
Максимальна роздільна здатність VGA 2048 × 1536 при 85 Гц
Графіка інтерфейси Shader Model 5.0, OpenGL
4.53,DirectX 11.24
Обчислити інтерфейси CUDA, DirectCompute,OpenCL ™
На завершення аналізу наведемо тестування роботи
спеціалізованих відеокарт FirePro та QUADRO в режимі одна карта, дві карти SLI
або CrossFire у порівнянні з топовим неспеціалізованим рішенням Geforce GTX
Titan віртістю 1150$ на 19.12.2015 року.
Рисунок 16. Швидкість рендерингу відео сцени для
відеокарт FirePro, QUADRO та Geforce GTX Titan в режимі Single або Dual (більше
- гірше) [16]
Для порівняння ціна Quadro K5000 складає близько
2200$ на 19.12.2015 року. наявність шини PCI-E 16х у кількості рівній
кількості відеокарт які планується об’єднати;
наявність підтримки Bios або EFI BIOS
материнською плати режимів Sli та CrossFire;
наявність конектора Sli або CrossFire (для
топових сучасних відеокарт опціонально);
наявність блока живлення, потрібної потужності.
Доцільність використання режимів NVIDIA SLI та
AMD CrossFireX для ігрових систем для підвищення продуктивності роботи ПЕОМ є в
тому випадку, коли в системі вже встановлена відеокарта середнього або топового
класу. При цьому витрати у 200-400 умовних одиниць нададуть підвищення
кількості кадрів при тестуванні ігрового програмного забезпечення на 50-80% в
залежності від оптимізації ПЗ.
При плануванні придбання сучасного ПЕОМ за
вартість двох відеокарт доцільніше придбати одну, але вищого класу. Це
дозволить зменшити навантаження на блок живлення та у подальшому надасть
можливість апгрейду.
При використанні спеціалізованого ПЗ - рішень для
промисловості, рішень для відеорендерингу та монтажу доцільно використовувати
спеціалізовані відеокарти.
Для NVidia це лінійка Quadro, для AMD це лінійка
FirePro.
У цьому випадку підвищення продуктивності з
використанням режимів NVIDIA SLI та AMD CrossFireX надасть суттєвих переваг при
економії робочого часу, та прискорення виробничого процесу.
Але остаточне рішення необхідно приймати
порівнявши всі варіанти виходячи з суми, яку передбачаються витрати на апаратне
та програмне забезпечення робочих станцій ПЕОМ.
1.
Електронний ресурс. Матеріал з Вікіпедії - вільної енциклопедії. https: // ru.
wikipedia.org/wiki/Видеокарта <https://ru.wikipedia.org/wiki/Видеокарта>
.
Архитектура компьютера - Эндрю Таненбаум, Т. Остин. Издательство: Питер.
2015.816 стр. ил.
.
Електронний ресурс. Архів 3dfx.
http://www.x86-secret.com/articles/divers/v5-6000/v56kgb-2. htm
<http://www.x86-secret.com/articles/divers/v5-6000/v56kgb-2.htm>
.
Електронний ресурс. Зарождение и первые шаги 3D-ускорителей.
<http://www.compbegin.ru/articles/view/_122>
.
Електронний ресурс. Video Electronics Standards Association (VESA) https: //
uk. wikipedia.org/wiki/VLB <https://uk.wikipedia.org/wiki/VLB>
.
Електронний ресурс. PCI https: // uk. wikipedia.org/wiki/PCI
<https://uk.wikipedia.org/wiki/PCI>
.
Електронний ресурс. Матеріал з Вікіпедії - вільної енциклопедії. https: // uk.
wikipedia.org/wiki/PCI_Express
<https://uk.wikipedia.org/wiki/PCI_Express>
.
Електронний ресурс. Порівняння шин. <http://organic-store.com.ua>
. Большая
энциклопедия компьютера - Леонов Василий. Издательство: Эксмо. 2012.592 стр.
ил.
.
Електронний ресурс. AMD CrossFireX™ multi-GPU technology.
http://www.club-3d.com/
.
Електронний ресурс. AMD CrossFireX - bridge connector. wikimedia.org
.
Електронний ресурс. Технлогія AMD CrossFireX. https: // uk. wikipedia.org
<https://uk.wikipedia.org>
.
Електронний ресурс. РАСКРОЙТЕ ПОЛНЫЙ ПОТЕНЦИАЛ AUTODESK PRODUCT DESIGN SUITE С
ГРАФИЧЕСКИМИ ПРОЦЕССОРАМИ NVIDIA. http://www.nvidia.ru/object/autodesk-design-suite-ru.html#myTabListID=0
<http://www.nvidia.ru/object/autodesk-design-suite-ru.html>
.
Електронний ресурс. Тестируем Quadro.
http://www.efxi.ru/more/premiere_cuda6.html
.
Електронний ресурс. AMD-FirePro-specviewperf.
http://www.amd.com/Documents/AMD-FirePro-specviewperf12. pdf
<http://www.amd.com/Documents/AMD-FirePro-specviewperf12.pdf>
.
Електронний ресурс. Adobe Premiere Pro CC Professional GPU Acceleration. https:
// www.pugetsystems.com/labs/articles/Adobe-Premiere-Pro-CC-Professional-GPU-Acceleration-502/
<https://www.pugetsystems.com/labs/articles/Adobe-Premiere-Pro-CC-Professional-GPU-Acceleration-502/>
Висновки
Перелік
посилань