Amd radeon hd 6900 series Технічні характеристики. Установка та драйвери


Вже більше року продукцію AMD у секторі високопродуктивних відеокарт із підтримкою API DirectX 11 представляло сімейство Cypress. Через затримки конкуруючої сторони відеокарти AMD HD 5850 і HD 5870 досить тривалий час монопольно панували в цьому секторі. Анонс архітектури NVIDIA Fermi та подальше зростання популярності продукції конкурентів змусило AMD задуматися про відеокарти наступного покоління.

Як і споживачам, так і AMD, хотілося побачити новинки з графічним процесором, виготовленим за технологіями 28 нм. Всі давно знають, що графічні процесори для AMD виготовляються компанією TSMC. У свою чергу остання затягнула запуск виробничої лінії з більш передовими технормами. У результаті AMD довелося переглянути свої плани на друге покоління відеокарт із підтримкою DX11. У досить стислий термін AMD вдалося створити графічний процесор AMD Barts, дебют якого відбувся 22 жовтня 2010 року. Відеокарти AMD Radeon HD 6850 і HD 6870 вдало вписалися у свій сегмент ринку, справа залишалася за продуктивними рішеннями, які вже давно чекали.

На початку очікувалося, що відеокарти AMD Cayman будуть представлені у листопаді, але в останній момент анонс було відкладено на п'ятдесятий тиждень поточного року. Тепер, коли ви читаєте ці рядки, можна з упевненістю сказати – анонс відбувся.

Відеокарти AMD Cayman представляють дві новинки - Radeon HD 6950 та Radeon HD 6970:





Відеокарти AMD Radeon HD 6800 Series – це серія графічних чіпів від AMD, які свого часу були досить популярними. Сьогодні ці відеокарти можуть використовуватися в застарілих системах і, за сучасними мірками, є низькопродуктивними. Втім, характеристики AMD Radeon HD 6800 Series дозволяють використовувати ці чіпи у звичайних стаціонарних комп'ютерах, перед якими не поставлено завдання запуску сучасних ігрових релізів.

Поява серії

Люди, які стежать за відповідними новинами, знають, що AMD регулярно оновлює серії графічних чіпів. 2010 не став винятком, і тоді з'явилася серія відеокарт AMD Radeon HD 6800 Series, характеристики якої вражали. Моделі в цій серії мали замінити флагманську на той момент відеокарту Radeon HD 5870.

22 жовтня було представлено першу модель із цієї серії. Тоді в ході вистави вона зібрала позитивні відгуки. Зазначимо, що саме на цій лінійці завершився ребрендинг. Починаючи з цієї серії відеокарти виробника носили назву AMD, а не ATI.

Давайте розберемося, які характеристики AMD Radeon HD 6800 Series і що нового отримала ця лінійка? Нагадаємо, що всього в серії представлено 2 відеокарти – це модель HD6850 та HD6870. За словами розробників, цифра 8 у назві перестала позначати флагманські амбіції відеокарт цієї серії з того часу, як з'явилася лінійка 6900.

Характеристики відеокарт AMD Radeon HD 6800 Series

Почнемо з очевидних змін. У лінійці використали новий процесор Barts. Вже з презентації було зрозуміло, що компанія AMD йде іншим шляхом розвитку, який відрізняється від обраного шляху Nvidia. Якщо розробники Nvidia женуться за потужністю і продуктивністю платформ, що випускаються, AMD віддає перевагу балансу між вартістю і продуктивністю.

Якщо раніше компанія ATI задавала тенденції щодо розробки графічних чіпів, то під крилом AMD розробник зробив крок назад. Абсолютно точно графічний процесор Barts є слабшим у порівнянні зі своїм попередником - у характеристиках та на папері. Справа в тому, що розробники обрали шлях спрощення архітектури для забезпечення надійності та створення балансу між продуктивністю, ціною та швидкістю. Завдяки спрощенню архітектури Barts став меншим у розмірах і простіше за структурою, а його продуктивність дозволяє віднести його лише до низького класу відеокарт від AMD. Саме до бюджетників належать відеокарти з об'ємом пам'яті 1 Гб AMD Radeon HD 6800 Series. Характеристики їх такі:

  1. Підтримка DirectX 11 та 5 версії шейдерів.
  2. Об'єм пам'яті на обох моделях серії становить 1 Гб.
  3. Частота ГПУ HD6850 та HD6870: 775 МГц та 900 МГц відповідно.
  4. Частота роботи пам'яті HD6850 та HD6870: 1000 МГц та 1050 МГц відповідно.
  5. Ширина шини пам'яті: 256 Біт у обох моделей.

На момент їх подання вартість карток становили 180 та 240 доларів за моделі 6850 та 6870 відповідно. Сьогодні ці відеокарти не виробляються, тому їхня вартість набагато нижча. Та й купити ці чіпи можна лише з рук.

Відмінності HD6850 від HD6870

У цій лінійці модель AMD Radeon HD6850 є молодшою. Тут характеристики, порівняно зі старшою картою, урізані. Причому найслабше тут все, включаючи навіть систему охолодження. Враховуючи нижчу продуктивність та слабку системуохолодження, температура AMD Radeon HD 6800 Series при навантаженні, зокрема моделі HD6850, залишається такою ж. І це очевидний недолік цієї моделі.

Якщо порівняти результат тестування цього чіпа у програмі 3DMark з чіпом HD6870, то результат останнього буде на 2-3 тисячі балів вищим. Різниця FPS у вимогливих іграх типу Crysis або Far Cry 2 складе 10-15 FPS, а це досить великий розрив. Звідси й різниця у ціні між цими картками, яка становить у середньому 60 доларів.

Старша модель HD6870 є гідним конкурентом того часу - ТОПовій відеокарті HD5870. Плюсом цього рішення є низька ціна порівняно з конкурентом від Nvidia та можливість використовувати функціонал DirectX11 на повну. Втім, про результати тестування цієї карти та її порівняння з конкурентом GTX 460 розповімо нижче.

Конкуренти

Враховуючи вартість на момент виходу та характеристики, як основні конкуренти лінійки можна представити моделі від Nvidia - це відеокарти GTX460 і GTX470. Їх характеристики трохи кращі в порівнянні з моделями AMD. Наприклад, GTX460 і GTX470 мають ядра, які працюють на частоті 675 і 607 МГц відповідно, проте частота роботи пам'яті вище - 1800 МГц GTX460 і 1674 МГц GTX470. Але ключова особливість моделі GTX470 полягає в ширині шини пам'яті - 320-bit GDDR 5, що ставить цю відеокарту на голову вище за конкурентну модель від AMD з шириною шини 256 bit. Проте різниця у продуктивності мінімальна. Побічно це підтверджує відмінну оптимізацію компонентів відеокарти AMD та гарне програмне забезпеченнядля неї.

Тестування відеокарт AMD Radeon HD 6800 Series 1024 Мб

Для тестування використовувалося таке "залізо":

  1. ЦП Core i7 3.3 ГГц.
  2. 6 Гб ОЗП.
  3. 64-бітна ОС Windows 7

У першій грі, що тестується Battlefield Bad Company 2 рішення від AMD виявилося краще. Відеокарта HD 6800 набрала на максимальних налаштуваннях графіки 30 FPS, а карта GeForce 460 показала результат лише у 22 FPS. І якщо 30 FPS можна назвати ще "грабальним" результатом, то при 22 кадрах на секунду комфортно грати вже не вийде.

Утім, у грі Aliens vs. Predator ситуація склалася на користь GeForce. Тут графіка від GeForce показала 30 FPS на максимальній роздільній здатності. А при тестуванні гри на відеокарті AMD HD6800 роздільну здатність довелося знизити до 1600х900 для отримання тих же 30 FPS.

Досить вимоглива гра Crysis Warhead запустилася на обох картах лише за низьких дозволів екрану. Тестування в іграх дає лише опосередковано зрозуміти, яка відеокарта краща. В даному випадку явного переможця немає і обидві моделі є гідними варіантами. Щоправда, рішення від Nvidia обійдеться трохи дорожче. Характеристики AMD Radeon HD 6800 Series у будь-якому випадку дозволяють запускати на високих графічних налаштуваннях гри, що вийшли у 2010-2013 роках. Але сучасні новинки відеокарти цієї лінійки не потягнуть.

Недоліки лінійки

Очевидний мінус обох плат - це шум при роботі, який пов'язаний із недостатньо ефективною системоюохолодження. Адже змусити вентилятор крутитись на повну потужність легко. Це дозволяє зробити висновок, що розробники не приділили гідної уваги системі охолодження, адже при великому навантаженні обох чіпів вентилятор шумить дуже сильно і ледве справляється з відведенням тепла. При цьому навантажувати чіп на повну не хочеться, і коли користувач чує гул із системного блоку, то інтуїтивно намагається скинути налаштування графіки до прийнятного рівня.

Висновок

Нова лінійка HD 6800 Series свого часу вийшла гідною та неоднозначною. Обидві відеокарти успішно увійшли на ринок і зібрали позитивні відгуки, оскільки зайняли ніші між флагманськими чіпами та дешевими відеоплатами. У порівнянні з більш дорогими рішеннями від Nvidia зразки від AMD виглядали краще, ніж можна пояснити зростання їх популярності. Ну і, звичайно ж, річ у ціні. Варто визнати, що в AMD ухвалили найкраще рішення щодо забезпечення відповідності ціни та продуктивності своїх продуктів.

Враховуючи не найкращу систему охолодження, про можливий розгін цих чіпів також краще забути. Адже навіть при пікових навантаженнях вентилятору важко відводити тепло. Втім, для експериментів з розгоном найкраще використовувати чіпи від Nvidia – вони майже завжди виходять тихішими та холоднішими.

AMD Radeon HD 6950/6970:

опис відеокарт та результати синтетичних тестів

Є сенс ще раз нагадати, що карти вимагають додаткового живлення, причому 6950 – двома 6-контактними роз'ємами. А 6970 - 8-контактним та 6-контактним. Сподіваємося, що партнери AMD вкладатимуть у комплект відповідні перехідники-розгалужувачі живлення.

Про систему охолодження.

AMD Radeon HD 6950/6970 2048 МБ 256-бітної GDDR5, PCI-E

Варто зауважити, що CO дуже схожа за принципом на ту, що ми бачили на GTX 580/570, і вона також базується на випарній камері, яка укладена в мідному вузькому відсіку, що стикається з GPU. Над цією камерою вибудовано конструкцію з ребер охолодження, через які проходить повітря, гнане циліндричним вентилятором на кінці всього пристрою. Правда, на відміну від GTX 580, в даному випадку вся конструкція виконана з міді, включаючи ребра радіатора, тому вийшла вельми важкою.

Ми вже писали, що таке рішення є більш ефективним, ніж традиційно використовуване раніше на теплових трубках. Всередині камери випаровування особлива рідина, яка моментально передає тепло від нижньої пластини до верхньої.

Особливо варто відзначити, що СО налаштована на незначні реагування при нагріванні, щоб забезпечити майже безшумну роботу. Тому нагрівання ядра може навіть перевищувати те, що ми бачили у випадку з 5870.

Ми провели дослідження температурного режиму за допомогою утиліти MSI Afterburner (автор А. Ніколайчук AKA Unwinder) та отримали наступні результати:

AMD Radeon HD 6970 2048 МБ 256-бітної GDDR5, PCI-E

AMD Radeon HD 6950 2048 МБ 256-бітної GDDR5, PCI-E

Результати дослідження показали, що, незважаючи на все сказане вище, СО реально ефективна, і навіть при частоті обертання 40% від максимуму нагрівання дорівнює 92 градуси у 6970, а у 6950 - 84. Це після 6-годинного постійного тестування під навантаженням в 3D. Так, комусь 92 градуси видадуться надмірно високими, проте для акселераторів рівня Hi-End це прийнятно.

Максимальне енергоспоживання карток під навантаженням - 250-260 Вт для 6970 і трохи вище 205 Вт для 6950. Ми спеціально не наводимо будь-яких графіків споживання, щоб не ускладнювати прочитання матеріалу. Адже читачів завжди цікавить - скільки воно споживає в максимумі, щоб підібрати потрібний БП, а деталі вже мало кому цікаві.

Комплектація. З огляду на те, що референс-зразки ніколи не мають комплектації, ми це питання опустимо.

Установка та драйвери

Конфігурація тестового стенду:

  • Комп'ютер на базі CPU Intel Core i7-975 (Socket 1366)
    • процесор Intel Core i7-975 (3340 МГц);
    • системна плата Asus P6T Deluxe на чіпсеті Intel X58;
    • оперативна пам'ять 6 ГБ DDR3 SDRAM Corsair 1600 МГц;
    • жорсткий диск WD Caviar SE WD1600JD 160 ГБ SATA;
    • блок живлення Tagan TG900-BZ 900 Вт.
  • операційна система Windows 7 64-бітна; DirectX 11;
  • монітор Dell 3007WFP (30″);
  • драйвери ATI версії Catalyst 10.11; Nvidia версії 263.09/260.99.

VSync вимкнено.

Синтетичні тести

Використовувані нами пакети синтетичних тестів можна завантажити тут:

  • D3D RightMark Beta 4 (1050)з описом на сайті 3d.rightmark.org.
  • D3D RightMark Pixel Shading 2 та D3D RightMark Pixel Shading 3- Тести піксельних шейдерів версій 2.0 і 3.0, посилання .
  • RightMark3D 2.0з коротким описом: під Vista без SP1, під Vista c SP1.

Через відсутність своїх синтетичних тестів DirectX 11 ми ще раз скористалися прикладами з пакетів SDK Microsoft і AMD і демонстраційною програмою Nvidia. По-перше, це HDRToneMappingCS11.exe та NBodyGravityCS11.exe з комплекту DirectX SDK (February 2010).

Також ми взяли додатки обох виробників: Nvidia та AMD. З ATI Radeon SDK були взяті приклади DetailTessellation11 та PNTriangles11 (вони також є і в DirectX SDK). Додатково використовувалася демонстраційна програма компанії Nvidia – Realistic Water Terrain, також відома як Island11 (автор – Тимофій Чеблоков, дуже відомий фахівець у 3D-графіці).

Синтетичні тести проводились на наступних відеокартах:

  • Radeon HD 6970 HD 6970)
  • Radeon HD 6950зі стандартними параметрами(далі HD 6950)
  • Radeon HD 6870зі стандартними параметрами (далі HD 6870)
  • Radeon HD 5870зі стандартними параметрами (далі HD 5870)
  • Geforce GTX 580зі стандартними параметрами (далі GTX 580)
  • Geforce GTX 570зі стандартними параметрами (далі GTX 570)

Для порівняння результатів нових моделей відеокарт серії Radeon HD 6900 було обрано ці моделі, тому що Radeon HD 5870 — попереднє одночіпове рішення компанії для топового цінового діапазону, сильне до виходу нових моделей; Radeon HD 6870 - поточне рішення компанії AMD, що стоїть на сходинку нижче топових і засноване на відеочіпі Barts, що нещодавно вийшов.

Саме ці рішення Nvidia були взяті тому, що Geforce GTX 580 — найшвидша одночіпова модель компанії, заснована на свіжому GPU. Хоча вона не є конкурентом представлених відеокарт за ціною, її результати цікаві як максимальна для рішень Nvidia планка. Ну а GTX 570 взята як прямий конкурент для старшої моделі нової серії HD 6970.

Direct3D 9: тести Pixel Filling

У цьому тесті визначається пікова продуктивність вибірки текстур (texel rate) у режимі FFP для різного числа текстур, що накладаються на один піксель:

У цьому тесті фільтрації 32-бітових (8 біт на колір) текстур більшість відеокарт показують цифри, далекі від можливих теоретично. Ось і результати нашої текстурної синтетики у разі відеоплат серії HD 6900 не дотягують до пікових значень. Далі ми розглянемо швидкість текстурування ще раз, у тесті з пакету 3DMark Vantage, де виходять більш реалістичні цифри.

А тут виходить, що HD 6970 вибирає лише 67 текселів за один такт з 32-бітових текстур при білінійній фільтрації, що майже на третину нижче за теоретичну цифру в 96 відфільтрованих текселів. Для HD 6950 ці цифри відповідають 62 текселям з 88 теоретичних, тобто ефективність молодшої моделі вийшла трохи вище, і це пов'язано з невеликою різницею пропускної здатності відеопам'яті, що також впливає на результати.

Не дивно, що всі карти AMD показують таку високу продуктивність і значно випереджають своїх суперників із стану компанії Nvidia. Адже у них і теоретичні показники швидкості текстурування дуже високі. А ось навіть топова GTX 580 має лише 64 TMU і сильно поступається моделям на Cayman, що мають 88-96 TMU, та ще й працюючих на більш високих частотах.

Дуже цікавою вийшла різниця між HD 6950 та HD 5870 у різних умовах. Якщо у випадках з великою кількістю текстур, де найбільше позначається саме кількість TMU та їх частота, вони йдуть нарівні, то при меншій кількості текстур на піксель вперед виходить модель HD 5870. оптимізації у драйверах.

Розглянемо ці ж результати у тесті філрейту:

Ці цифри показують швидкість заповнення, і в них ми бачимо те саме, хіба що з урахуванням кількості записаних у буфер кадру пікселів. Максимальний результат залишається за новими рішеннями сімейства Radeon HD 6900, що мають просто величезну кількість TMU і більш ефективними в нашому синтетичному тесті. Дивно, але у випадках з 0—4 текстурами, що накладаються, молодша з відеокарт, що розглядаються сьогодні, чомусь сильно поступається попередньому топовому рішенню AMD, хоча в складних умовахпрактично не відстає від нього.

Direct3D 9: тести Pixel Shaders

Перша група піксельних шейдерів, яку ми розглядаємо, дуже проста для сучасних відеочіпів, вона включає в себе різні версіїпіксельних програм порівняно низької складності: 1.1, 1.4 і 2.0, які у старих іграх.

Тести дуже прості для сучасних GPU і дуже впираються у продуктивність текстурування. Тому вони показують далеко не всі можливості сучасних відеочіпів, але все ж таки цікаві для оцінки балансу між текстурними вибірками і математичними обчисленнями. У цьому випадку особливих відмінностей між HD 5870 і HD 6950 немає, результати цих моделей можна порівняти. Хоча один тест виділився - піксельний шейдер освітлення трьома джерелами за Фонгом явно залежить від математичної продуктивності GPU, і тому рівня HD 5870 в ньому досягла тільки старша модель - HD 6970.

Продуктивність інших тестах обмежена здебільшого швидкістю текстурних модулів і филлрейтом, але з урахуванням ефективності блоків і кешування даних. Нові моделі серії Radeon HD 6900 дещо швидше за попередні: HD 6970 швидше за HD 5870, а HD 6950 швидше за HD 6870 (з іншого цінового діапазону). І майже всі вони випереджають обидві топові моделі Geforce - навіть GTX 580 у цих тестах показує результат лише на рівні HD 6870, і в цьому явно винен недолік швидкості текстурування.

Подивимося на результати складніших піксельних програм проміжних версій:

І цього разу вийшло приблизно те саме, знову GTX 580 конкурує швидше з HD 6870, ніж з реальними топовими моделями AMD. Тест Cook-Torrance більш інтенсивний обчислювально, і різниця в ньому приблизно відповідає різниці в кількості ALU та їх частоті. Саме тому цей тест найкраще підходить для архітектури AMD, чіпи якої мають більшу кількість математичних блоків.

І тут знайшлися два цікаві моменти. По-перше, HD 5870 обганяє навіть HD 6970, що складно пояснити одними лише теоретичними характеристиками. Різниця з пікової математичної продуктивності між цими моделями майже відсутня, але є й архітектурні відмінності. Схоже, що саме різна ефективність виконання цього шейдера на тих самих VLIW5- та VLIW4-процесорах і призвела до такої різниці не на користь нового чіпа Cayman. Тому і HD 6950 у цьому тесті виступила лише на рівні HD 6870, а також GTX 580.

У другому тесті процедурної візуалізації води «Water», що сильно залежить від швидкості текстурування, використовується залежна вибірка з текстур великих рівнів вкладеності, і відеокарти в ньому розташовуються за швидкістю текстурування, з поправкою на різну ефективність використання TMU.

Ось у цьому тесті у нових рішень все чудово, HD 6950 забезпечує результат на рівні HD 5870, а HD 6970 лідирує з гарним відривом, що майже відповідає 25-відсотковій різниці в теоретичній швидкості текстурування. Зрозуміло, що відеокарт виробництва Nvidia тут ловити нічого, і вони показують результат на рівні помітно дешевшої моделі конкурента.

Direct3D 9: тести піксельних шейдерів Pixel Shaders 2.0

Ці тести піксельних шейдерів DirectX 9 складніші за попередні, вони близькі до того, що ми зараз бачимо в мультиплатформних іграх, і поділяються на дві категорії. Почнемо з простих шейдерів версії 2.0:

  • Parallax Mapping— знайомий з більшості сучасних ігор метод накладання текстур, докладно описаний у статті.
  • Frozen Glass- Складна процедурна текстура замороженого скла з керованими параметрами.

Існує два варіанти цих шейдерів: з орієнтацією на математичні обчислення та з перевагою вибірки значень текстур. Розглянемо математично інтенсивні варіанти, перспективніші з погляду майбутніх додатків:

Це універсальні тести, що залежать від швидкості блоків ALU, і від швидкості текстурування, в них важливий загальний баланс чіпа. Продуктивність нових відеокарт AMD у тесті «Frozen Glass» дуже хороша, HD 6970 знову виявилася помітно швидше, ніж HD 5870, а HD 6950 майже наздогнала її. На жаль для Nvidia, але через слабке текстурування рішення компанії AMD знову виявилися помітно швидше.

Ось у другому тесті «Parallax Mapping» рішення Nvidia почуваються вже трохи краще, і HD 6870 з HD 6950 близькі до результатів карти GTX 580 з іншого ринкового сегмента, що коштує дорожче. Цікаво, що HD 5870 знову виявилася швидше, ніж HD 6970. Це підтверджує нашу теорію про те, що швидкість тесту обмежена математичною продуктивністю і що тест трохи гірше підходить новій архітектурі компанії AMD.

Є ще одне ймовірне пояснення — синтетичні тести дуже часто вантажать GPU паралельними розрахунками і енергоспоживання нових моделей у синтетиці цілком може виходити за рамки виставленого обмеження. Отже, може знижуватися і тактова частота, а разом з нею і результати виявляються нижчими, ніж очікувалося. Втім, це припущення слід перевіряти. Розглянемо ці ж тести модифікації з перевагою вибірок з текстур математичним обчисленням:

Для рішень Nvidia ситуація стала помітно сумнішою, оскільки зі швидкістю текстурування в останніх чіпів AMD, на відміну від конкурентів, все дуже добре, тому вони лише нарощують свою і без того незаперечну перевагу. Навіть GTX 580 поступається тому ж HD 6870 в обох тестах з упором на текстурування. Ну а наші нові герої з сімейства HD 6900 виявилися найшвидшими, HD 6950 навіть виграв у HD 5870, нехай і копійки. А HD 6970 знову став лідером, що цілком зрозуміло теоретично, якщо подивитися на продуктивність блоків TMU.

Все це були застарілі завдання, здебільшого з упором у текстурування, а рідше у філлрейт. Далі ми розглянемо результати ще двох тестів піксельних шейдерів – але вже версії 3.0, найскладніших наших тестів піксельних шейдерів для Direct3D 9 API. Вони найбільш показові з погляду сучасних ігор на ПК, серед яких багато мультиплатформенних. Тести відрізняються тим, що сильно навантажують і ALU, і текстурні модулі, обидві шейдерні програми складні та довгі, і включають велику кількість розгалужень:

  • Steep Parallax Mapping— значно «важчий» різновид техніки parallax mapping, також описаний у статті «Сучасна термінологія 3D-графіки».
  • Fur- Процедурний шейдер, що візуалізує хутро.

У наших найскладніших DX9-тестах відеокарти виробництва Nvidia завжди виступають сильніше за рішення AMD, на противагу всім попереднім випробуванням. Таке положення пов'язане з тим, що ці тести не обмежені продуктивністю текстурних вибірок, а залежать від ефективності виконання коду піксельних шейдерів.

У тестах складних піксельних шейдерів версії 3.0 нові топові відеокарти AMD все ж таки не змогли наздогнати конкурентів, хоча і помітно наблизилися до них. Швидкість в обох тестах PS 3.0 слабо залежить від ПСП та текстурування, зате код відрізняється складністю, з чим дуже непогано справляється нова архітектура Nvidia і нова архітектура AMD. Мабуть це перший тест, де ми бачимо помітну позитивну різницю між попередньою і новітньою архітектурами компанії AMD.

І остання справляється із завданням явно краще. Хоча навіть HD 6970 важко конкурує з GTX 570, але про таке раніше ми взагалі не думали. Рішення Nvidia завжди були незаперечними лідерами у цій парі тестових завдань, і традиційно показували результат набагато сильніший. А відеокарти на новому графічному чіпі Cayman змогли до них наблизитися впритул.

Direct3D 10: тести піксельних шейдерів PS 4.0 (текстурування, цикли)

У другу версію RightMark3D увійшли два знайомі тести PS 3.0 під Direct3D 9, які були переписані під DirectX 10, а також ще два нові тести. У першу пару додалися можливості включення самозатінення та шейдерного суперсемплінгу, що додатково збільшує навантаження на відеочіпи.

Дані тести вимірюють продуктивність виконання піксельних шейдерів із циклами при великій кількості текстурних вибірок (у найважчому режимі до кількох сотень вибірок на піксель) та порівняно невеликому завантаженні ALU. Іншими словами, у них вимірюється швидкість текстурних вибірок та ефективність розгалужень у піксельному шейдері.

Першим тестом піксельних шейдерів буде Fur. При найнижчих налаштуваннях використовується від 15 до 30 текстурних вибірок з карти висот і дві вибірки з основної текстури. Режим Effect detail - "High" збільшує кількість вибірок до 40-80, включення "шейдерного" суперсемплінга - до 60-120 вибірок, а режим "High" спільно з SSAA відрізняється максимальною "вагою" - від 160 до 320 вибірок з карти висот.

Перевіримо спочатку режими без увімкненого суперсемплінгу, вони відносно прості, і співвідношення результатів у режимах Low і High повинно бути приблизно однаковим.

Продуктивність у цьому тесті залежить від кількості та ефективності блоків TMU, але у різних умовах по-різному. Результати при деталізації рівня "High" виходять приблизно в півтора рази нижче, ніж при "Low", як і має бути за теорією. У D3D10-тестах процедурної візуалізації хутра з великою кількістю текстурних вибірок рішення Nvidia раніше були помітно сильнішими, але останні рішення AMD до них підтяглися, що ми бачили вже й раніше.

У варіанті без суперсемплінгу більший вплив на продуктивність має ефективний філлрейт (продуктивність ROP) та пропускна спроможністьпам'яті. Тому рішення Nvidia виявилися попереду, і тільки представлений сьогодні топовий Radeon HD 6970 майже наздоганяє молодшу GTX 570. Модель нижче за рівень під ім'ям HD 6950 показує результат на рівні HD 5870, але приблизно того ж результату досягла і HD 6870. Це і не дивно, тому що Філрейт у неї навіть більше, ніж у старших рішень серії HD 6900.

Подивимося на результат цього ж тесту, але з увімкненим «шейдерним» суперсемплінгом, що збільшує роботу в чотири рази: можливо, в такій ситуації щось зміниться, і ПСП з філлрейтом впливатимуть менше:

Як завжди, включення суперсемплінга збільшує теоретичне навантаження вчетверо, і результати рішень Nvidia помітно падають порівняно з показниками відеокарт AMD. Тепер трійка моделей з близькими результатами (HD 6870, HD 5870 і HD 6950) випереджає GTX 570, а старше рішення HD 6970 з успіхом конкурує з GTX 580. Різниця між топовими картами лінійок HD 6000 і нова модель 5000 кілька відсотків у попередньої.

Другий шейдерний DX10-тест вимірює продуктивність виконання складних піксельних шейдерів з циклами за великої кількості текстурних вибірок і називається Steep Parallax Mapping. При низьких налаштуваннях він використовує від 10 до 50 текстурних вибірок з карти висот та три вибірки з основних текстур. При включенні важкого режиму з самозатінення число вибірок зростає в два рази, а суперсемплінг збільшує це число в чотири рази. Найбільш складний тестовий режим із суперсемплінгом та самозатіненням вибирає від 80 до 400 текстурних значень, тобто у вісім разів більше у порівнянні з простим режимом. Перевіряємо спочатку прості варіантибез суперсемплінгу:

Другий піксель-шейдерний тест Direct3D 10 дещо цікавіший з практичної точки зору, так як різновиди parallax mapping широко застосовуються в іграх, а важкі варіанти, на зразок нашого steep parallax mapping, використовуються в багатьох проектах, наприклад в іграх Crysis і Lost Planet. Крім того, в нашому тесті, крім суперсемплінгу, можна включити самозатінення, що збільшує навантаження на відеочіп приблизно вдвічі, такий режим називається "High".

Діаграма багато в чому схожа на попередню (без SSAA), тільки позиції Nvidia трохи послабшали. В оновленому D3D10-варіанті тесту без суперсемплінгу HD 6970 стає на один рівень з GTX 570, що нормально для прямих конкурентів, а лідером залишається топова GTX 580. Інші три відеокарти виробництва AMD показують схожі результати і відстають. Подивимося, що змінить включення суперсемплінга, може викликати сильне падіння швидкості на платах Nvidia.

При включенні суперсемплінгу і самозатінення завдання виходить ще важчим, спільне включення відразу двох опцій збільшує навантаження на карти майже у вісім разів, викликаючи велике падіння продуктивності. Різниця між швидкісними показниками протестованих відеокарт змінилася, включення суперсемплінга дається взнаки, як і в попередньому випадку — карти виробництва AMD трохи покращили свої показники щодо рішень Nvidia.

Тепер HD 6970 показує результати на рівні GTX 580, а приблизно рівні за швидкістю HD 6950 і HD 5870 стають на одну сходинку з GTX 570. І лише дешевша HD 6870 трохи відстає від цієї відеокарти Nvidia. Порівняльні цифри в парах HD 6970 і HD 5870 знову повторилися, різниця на користь свіжіших моделей приблизно така сама. За цими тестами можна дійти невтішного висновку — обидві випущені сьогодні карти сімейства HD 6900 впоралися із «шейдерними» завданнями дуже добре, лише на рівні традиційно сильних у цих завданнях конкурентів Nvidia.

Direct3D 10: тести піксельних шейдерів PS 4.0 (обчислення)

Наступна пара тестів піксельних шейдерів містить мінімальну кількість текстурних вибірок зниження впливу продуктивності блоків TMU. У них використовується велика кількість арифметичних операцій, і вони вимірюють саме математичну продуктивність відеочіпів, швидкість виконання арифметичних інструкцій у піксельному шейдері.

Перший математичний тест - Mineral. Це тест складного процедурного текстурування, у якому використовуються лише дві вибірки з текстурних даних та 65 інструкцій типу sin та cos.

Результати граничних математичних тестів звично відповідають різниці в частотах та кількості виконавчих блоків, але з впливом їхньої ефективності. Сучасна архітектура AMD у таких випадках має велику перевагу перед конкуруючими відеокартами Nvidia, і це пояснює результати тестів, в яких рішення AMD явно виявляються значно більш продуктивними, хоча і не настільки, наскільки велика їхня теоретична перевага.

Теоретично, GTX 580 повинен бути чи не вдвічі повільнішим за HD 5870 і HD 6970. На практиці ж різниця не доходить і до півтора раза. Звичайно, це мало що змінює, адже навіть HD 6870 значно швидше за обох карт Nvidia в таких тестах, не кажучи вже про топові моделі. В іншому, рішення розташувалися приблизно відповідно до теорії, за деякими винятками.

Наприклад, результати порівняння нового та старого топових сімейств відеокарт AMD вийшли цікавими. По-перше, HD 6870 показала ідентичний HD 6950 результат у цьому тесті за різниці в теоретичних цифрах на користь моделі на базі Cayman. По-друге, те саме можна сказати і про зв'язку HD 6970 і HD 5870 - при подібних теоретичних цифрах, насправді з невеликою перевагою перемагає більш стара, з потоковими процесорами на основі архітектури VLIW5.

І тут знову є кілька можливих пояснень - або AMD ще не повністю оптимізувала драйвери для нових GPU, або архітектура Cayman менш ефективна в цьому тесті (при цьому цілком можливо, що вона буде більш ефективною в менш прямолінійних тестах), або вплинула технологія PowerTune, або в цьому тесті почало позначатися і обмеження пропускної здатності відеопам'яті.

Розглянемо другий тест шейдерних обчислень, що зветься Fire. Він важчий для ALU, і текстурна вибірка в ньому лише одна, а кількість інструкцій типу sin та cos збільшена вдвічі, до 130. Подивимося, що змінилося зі збільшенням навантаження:

Цього разу всі GPU залишилися приблизно на тих самих позиціях, крім відносної продуктивності Cayman та Cypress/Barts. Тепер у цих парах вже все в суворій відповідності до теоретичних цифр пікової продуктивності, а HD 6970 навіть трохи обганяє HD 5870, тобто в цьому випадку нова архітектура спрацювала ефективніше. І в парі HD 6950 і HD 6870 тепер така різниця на користь топового рішення, яка має бути.

В іншому нічого нового. Так як швидкість рендерингу тут обмежена виключно продуктивністю шейдерних блоків, то HD 6970 і HD 5870 є лідерами, за ними йдуть інші відеокарти AMD, а обидві Geforce поступаються навіть молодшої моделі з іншого цінового діапазону. Хоча перевага рішень AMD все одно залишається дещо нижчою, ніж при порівнянні теоретичних цифр — це свідчить про те, що ККД суперскалярних процесорів VLIW5 і VLIW4 нижче 100%.

Direct3D 10: тести геометричних шейдерів

У пакеті RightMark3D 2.0 є два тести швидкості геометричних шейдерів, перший варіант носить назву Galaxy, техніка аналогічна point sprites з попередніх версій Direct3D. У ньому анімується система частинок на GPU, геометричний шейдер із кожної точки створює чотири вершини, що утворюють частинку. Аналогічні алгоритми мають отримати широке використання у майбутніх іграх під DirectX 10.

Зміна балансування в тестах геометричних шейдерів не впливає на кінцевий результат рендерингу, підсумкова картинка завжди абсолютно однакова, змінюються лише способи обробки сцени. Параметр "GS load" визначає, в якому з шейдерів виробляються обчислення - у вершинному або геометричному. Кількість обчислень завжди однакова.

Розглянемо перший варіант тесту Galaxy, з обчисленнями у вершинному шейдері, для трьох рівнів геометричної складності:

Співвідношення швидкостей при різній геометричній складності сцен приблизно однаково для всіх рішень, продуктивність відповідає кількості точок, з кожним кроком падіння FPS складає близько двох разів. Завдання для сучасних відеокарт не особливо складне, продуктивність загалом обмежена не тільки швидкістю обробки геометрії, а й пропускною здатністю пам'яті або філлрейтом певною мірою (у рамках одного виробника).

На жаль, хоча ми бачили раніше зростання геометричної продуктивності рішень на Barts у цьому тесті, цього разу відеокарти нової родини виявилися приблизно на тому ж рівні, що і Radeon HD 5870 попереднього покоління. Можливо, винне обмеження продуктивності ПСП відеопам'яті, але HD 6870 дуже сильний в цьому тесті і обігнав навіть HD 6950. Так що швидше за все винен ефективний філлрейт, тобто продуктивність ROP.

У будь-якому випадку, всім рішенням AMD дуже далеко до топових відеокарт Nvidia, і хоча виконання геометричних шейдерів може і стало більш ефективним, але цього недостатньо. Засновані на GF110 відеокарти Nvidia справляються з роботою майже вдвічі швидше за всіх відеокарт конкурента. Подивимося, як зміниться ситуація при перенесенні частини обчислень до геометричного шейдера:

При зміні навантаження у цьому тесті цифри майже змінилися ні на рішень Nvidia, ні на AMD. Нові відеокарти сімейства HD 6900 в даному тесті слабо реагують на зміни параметра GS load, що відповідає за перенесення частини обчислень в геометричний шейдер, як і інші рішення, але все ж таки показують результати трохи вище, ніж на попередній діаграмі. Подивимося, що зміниться у наступному тесті, який передбачає велике навантаження саме на геометричні шейдери.

Hyperlight - це другий тест геометричних шейдерів, що демонструє використання відразу декількох технік: instancing, stream output, buffer load. У ньому використовується динамічне створення геометрії за допомогою малювання в два буфери, а також нова можливість Direct3D 10 - stream output. Перший шейдер генерує напрямок променів, швидкість і напрямок їх зростання, ці дані поміщаються в буфер, який використовується другим шейдером для малювання. По кожній точці променя будуються 14 вершин по колу, до мільйона вихідних точок.

Новий тип шейдерних програм використовується для генерації "променів", а з параметром "GS load", виставленим в "Heavy" - ще й для їхнього малювання. Тобто в режимі "Balanced" геометричні шейдери використовуються тільки для створення і "зростання" променів, виведення здійснюється за допомогою "instancing", а в режимі "Heavy" виводом також займається геометричний шейдер. Спочатку розглядаємо легкий режим:

Відносні результати в різних режимахзнову приблизно відповідають зміні навантаження: у всіх випадках продуктивність непогано масштабується і близька до теоретичних параметрів, за якими кожен наступний рівень «Polygon count» має бути меншим, ніж у два рази повільніше.

У цьому тесті швидкість рендерингу має бути обмежена геометричною продуктивністю, але оброблюваних примітивів явно недостатньо, щоб нова архітектура компанії AMD показала значно вищий результат, хоча є невелика різниця, яка пояснюється архітектурними змінами в GPU.

Відеокарти Nvidia так само залишаються лідерами тесту, але той же Radeon HD 6970 вже майже наздогнав молодшу модель GTX 570. А HD 6950 обганяє HD 5870, хай і не дуже сильно. І ці непогані результати виразно свідчать про наявність оптимізації з обробки геометричних даних у нових чіпах.

Цифри повинні змінитись на наступній діаграмі, у тесті з більш активним використанням геометричних шейдерів. Також буде цікаво порівняти один з одним результати, отримані в режимах Balanced і Heavy.

А ось у цьому тесті різниця між чіпами AMD з традиційним графічним конвеєром (в т.ч. і Cayman з його двома розтеризаторами) і чіпами з архітектурою Fermi помітна відразу. Хоча ми знаємо за попередніми дослідженнями, що молодші чіпи Nvidia за швидкістю виконання геометричних шейдерів відстають, показуючи не такі вражаючі результати, оскільки їх можливості з геометричної обробки урізані. Зате результати GTX 570 і GTX 580, що мають в основі чіп GF110, дуже хороші і майже вдвічі вищі, ніж у найкращого рішення компанії AMD.

І це рішення – новенький Radeon HD 6970. Можливості нового топового чіпа з обробки геометрії та швидкості виконання геометричних шейдерів явно зросли порівняно з іншими відеокартами компанії. І нові рішення на Cayman показують у цих тестах результати вищі, ніж рішення на базі Cypress та Barts, хоч і далеко не втричі, і навіть не вдвічі. Ймовірно, інженерам AMD ще доведеться вирішувати завдання розпаралелювання роботи блоків установки трикутників (geometry setup), в яку можуть упиратися ці тести.

Direct3D 10: швидкість вибірки текстур із вершинних шейдерів

У тестах Vertex Texture Fetch вимірюється швидкість великої кількості текстурних вибірок з вершинного шейдера. Тести схожі по суті, тому співвідношення між результатами карт у тестах «Earth» і «Waves» має бути приблизно однаковим. В обох тестах використовується displacement mapping на підставі даних текстурних вибірок, єдина істотна відмінність полягає в тому, що в тесті Waves використовуються умовні переходи, а в Earth - ні.

Розглянемо перший тест Earth, спочатку в режимі Effect detail Low:

Попередні дослідження показали, що на результати цього тесту впливає швидкість текстурування і пропускна здатність пам'яті. Це добре видно за порівняльними результатами Radeon HD 5870 і HD 6950 та інших рішень AMD. Схоже, що саме ПСП і обмежує їхню продуктивність у тесті, тому й різниця між усіма рішеннями не така вже й велика.

Тим не менш, дуже хороші результати показує HD 6970 на новому GPU - він майже дістає GTX 570, з яким і доведеться конкурувати цій моделі в реальному світі. Ну і лідером залишається найдорожча і найпродуктивніша GTX 580. Обидві карти сімейства HD 6900 показали себе непогано, молодша нова модель йде майже нарівні з попередньою топовою. Подивимося на продуктивність цього ж тесті зі збільшеною кількістю текстурних вибірок:

Взаємне розташування карт на діаграмі помітно змінилося, особливо у важкому режимі. Хоча відеокарти Nvidia чомусь втратили у продуктивності саме в найлегших умовах. Саме при малій кількості полігонів швидкість упирається в ПСП і в цьому випадку нові плати AMD майже наздогнали топові рішення конкурента.

А ось у важких режимах різниця на користь Nvidia зросла до півтораразової, там GTX 580 та GTX 570 залишаються недосяжними для суперників. Старша відеокарта сімейства HD 6900 обганяє інші рішення AMD, хоча це знову слабо помітно при порівнянні з HD 5870. Можна було б сказати про вплив ПСП, але конкурента це не зупиняє ...

Розглянемо результати другого тесту текстурних вибірок із вершинних шейдерів. Тест Waves відрізняється меншою кількістю вибірок, зате в ньому використовуються умовні переходи. Кількість білінейних текстурних вибірок у разі до 14 («Effect detail Low») чи до 24 («Effect detail High») на кожну вершину. Складність геометрії змінюється аналогічно до попереднього тесту.

Цікаво, що результати у другому тесті вершинного текстурування "Waves" зовсім не схожі на те, що ми бачили на попередніх діаграмах. У цьому тесті всі відеокарти AMD і Nvidia показують дуже близькі результати, що також можна списати обмеження пропускною здатністю відеопам'яті. Цей показник у всіх представлених відеокарт знаходиться в районі 130-190 ГБ/с, і розкид невеликий. Найкращою серед відеокарт AMD знову стала свіжа модель Radeon HD 6970. Розглянемо другий варіант цього тесту:

І знову відбулися зміни, аналогічні тим, що ми бачили раніше – відеокарти Nvidia «просіли» тільки в легкому режимі, а AMD у всіх трьох. І тому в режимі з малою кількістю полігонів різниця між рішеннями невелика, а ось в середньому і важкому GTX 580 і GTX 570 помітно випереджають усі моделі Radeon, у тому числі і з анонсованого сьогодні сімейства HD 6900. Порівняно з Cypress новий GPU показує результат приблизно на тому ж рівні, і ми робимо висновок, що в тестах вершинних вибірок жодних помітних змін під час переходу від Cypress до Cayman немає.

3DMark Vantage: тести Feature

Синтетичні тести з пакету 3DMark Vantage можуть показати нам те, що ми раніше пропустили. Тести Feature цього тестового пакета мають підтримку DirectX 10 і цікаві вже тим, що відрізняються від наших. При аналізі результатів нових відеокарт у цьому пакеті ми зможемо зробити якісь нові та корисні висновки, що вислизнули від нас у тестах сімейства RightMark. На жаль, ще новий тестовий пакет компанії — 3DMark11 — не містить спеціалізованих синтетичних тестів і нам в даному випадку зовсім нецікавий.

Feature Test 1: Texture Fill

Перший тест – тест швидкості текстурних вибірок. Використовується заповнення прямокутника значеннями, які зчитуються з маленької текстури з використанням численних текстурних координат, які змінюються кожен кадр.

Хоча текстурний тест компанії Futuremark також не показує теоретично можливого рівня швидкості текстурних вибірок, проте ефективність нових відеокарт сімейства Radeon HD 6900 в ньому дещо вища, ніж у нашому. Та й рішення Nvidia також ефективніше використовують наявні текстурні блоки. Тому в даному текстурному тесті виходить дещо інше співвідношення результатів порівняно з нашим.

Відеокарти нового сімейства компанії AMD показують результати, що повністю відповідають теоретичним параметрам. HD 6950 трохи швидше ніж HD 5870, а модель HD 6970 є явним лідером тесту. Наочно видно, що текстурна продуктивність Cayman помітно зросла порівняно із Cypress. А ось HD 6870 на основі чіпа Barts показує найгірший результат, аналогічний цифрам топової відеокарти Nvidia. Ну а GTX 570 програє у текстуруванні взагалі всім, як і в нашому тесті.

Feature Test 2: Color Fill

Це тест швидкості заповнення. Використовується дуже простий піксельний шейдер, що не обмежує продуктивність. Інтерполіроване значення кольору записується у позаекранний буфер (render target) з використанням альфа-блендінгу. Використовується 16-бітний позаекранний буфер формату FP16, що найчастіше використовується в іграх, що застосовують HDR-рендерінг, тому такий тест є цілком своєчасним.

Зовсім інша ситуація у тесті продуктивності блоків ROP. Цифри цього підтесту 3DMark Vantage показують продуктивність блоків ROP майже без впливу величини пропускної здатності відеопам'яті. Модель HD 6970 показує відмінний результат, майже наздоганяючи топову GTX 580 та випереджаючи свого конкурента GTX 570.

У свою чергу, HD 6950 також виявляється не тільки попереду свого конкурента GTX 570, а обігнала ще й попередницю - HD 5870. Відзначаємо дещо більшу ефективність блоків ROP і більшу швидкість заповнення у нових моделей відеокарт компанії AMD порівняно зі старими чіпами.

Feature Test 3: Parallax Occlusion Mapping

Один із найцікавіших feature-тестів, оскільки подібна техніка вже використовується в іграх. У ньому малюється один чотирикутник (точніше, два трикутники) із застосуванням спеціальної техніки Parallax Occlusion Mapping, що імітує складну геометрію. Використовуються досить ресурсомісткі операції з трасування променів та карта глибини великого дозволу. Також ця поверхня затінюється за допомогою важкого алгоритму Strauss. Це тест дуже складного та важкого для відеочіпа піксельного шейдера, що містить численні текстурні вибірки при трасуванні променів, динамічні розгалуження та складні розрахункиосвітлення по Strauss.

Цей тест відрізняється від інших подібних до тих, що результати в ньому залежать не тільки від швидкості математичних обчислень або ефективності виконання розгалужень або швидкості текстурних вибірок, а від усього потроху. І для досягнення високої швидкості важливим є баланс блоків GPU. Впливає на швидкість та ефективність виконання розгалужень у шейдерах.

Порівняльні результати відеокарт AMD на діаграмі дуже схожі на те, що ми бачили у тесті текстурної продуктивності з 3DMark Vantage. А ось плати Nvidia в даному випадку отримали невелике збільшення продуктивності, що говорить про те, що не лише текстурна продуктивність впливає на результати тесту.

Нові моделі AMD знову серйозно заявили про себе, обігнавши свою попередницю в особі HD 5870. А ось HD 6870 з іншого цінового сектора показала помітно слабкіший результат, ставши аутсайдером цього тесту (що цілком згладжується її низькою ціною). Що стосується порівняння Cayman з конкуруючими рішеннями Nvidia, обидві нові відеокарти сімейства HD 6900 випередили навіть топову модель лінійки Geforce GTX 500.

Feature Test 4: GPU Cloth

Тест цікавий тим, що розраховує фізичну взаємодію (імітація тканини) за допомогою відеочіпа. Використовується вершинна симуляція за допомогою комбінованої роботи вершинного та геометричного шейдерів з кількома проходами. Використовується stream out для перенесення вершин з одного симуляції проходу до іншого. Таким чином, тестується продуктивність виконання вершинних та геометричних шейдерів та швидкість stream out.

Швидкість рендерингу у цьому тесті залежить від багатьох параметрів, але основними є продуктивність обробки геометрії та ефективність виконання геометричних шейдерів. Логічно, що відеокарти виробництва Nvidia почуваються в цьому додатку як риба у воді, і значно випереджають конкурентів, у тому числі представлені сьогодні топові моделі.

Це один із небагатьох тестів без тесселяції, в яких видно перевагу у представлених нещодавно відеокарт нової серії Radeon HD 6800 і сьогоднішніх героїв HD 6900. Швидкість рендерингу всіх цих моделей у цьому тесті вища, ніж у топової моделі попередньої лінійки. Це пояснюється тим, що і в Barts, і в Cayman збільшили швидкість обробки геометрії та виконання геометричних шейдерів. І хоча навіть HD 6970 продовжує серйозно відставати від GTX 570, нова модель все ж таки значно покращила позиції компанії AMD у цьому тесті.

Feature Test 5: GPU Particles

Тест фізичної симуляції ефектів з урахуванням систем частинок, розрахованих з допомогою відеочіпа. Також використовується вершинна симуляція, кожна вершина є одиночною частинкою. Stream out використовується з тією ж метою, що у попередньому тесті. Розраховується кілька сотень тисяч частинок, всі анімуються окремо, також розраховуються зіткнення з картою висот.

Аналогічно одному з тестів нашого RightMark3D 2.0, частинки малюються за допомогою геометричного шейдера, який з кожної точки створює чотири вершини, що утворюють частинку. Але тест найбільше завантажує шейдерні блоки вершинними розрахунками, а також тестується stream out.

Результати чергового тесту з пакету 3DMark Vantage схожі на ті, що ми бачили на попередній діаграмі, але в ньому швидкість обробки геометрії ще важливіша. Саме тому минуле покоління у вигляді картки Radeon HD 5870 відстало як від обох моделей Geforce, які є незаперечними лідерами порівняння, так і від усіх нових моделей відеокарт AMD, сімейств HD 6900 та HD 6800. А всі плати, засновані на Cayman та Barts, показали більше високі результати, ніж єдине рішення на Cypress, поступившись лише сильним конкурентам.

Схоже, що в синтетичних тестах імітації тканин та частинок із тестового пакету 3DMark Vantage, в яких активно використовуються геометричні шейдери, знову немає значного впливу розпаралеленої обробки геометрії на Cayman, оскільки Barts показав близький результат. Тому й обидва рішення лінійки HD 6900 продовжують відставати від конкуруючих відеокарт суперника, що мають відмінну швидкість обробки геометрії - до двох разів вищі. Від топового рішення компанії AMD, заснованого на новій архітектурі з двома блоками обробки геометрії, ми все ж таки очікували дещо більшого прогресу.

Feature Test 6: Perlin Noise

Останній feature-тест пакету Vantage є математично-інтенсивним тестом відеочіпа, він розраховує кілька октав алгоритму Perlin noise у піксельному шейдері. Кожен колірний канал використовує власну функцію шуму для більшого навантаження відеочіп. Perlin noise - це стандартний алгоритм, що часто застосовується в процедурному текстуруванні, він використовує дуже багато математичних розрахунків.

У суто математичному тесті з пакету компанії Futuremark, що показує пікову продуктивність відеочіпів у граничних завданнях, ми побачили ще цікавішу картину, ніж в аналогічних тестах з нашого тестового пакету. Показана на діаграмі продуктивність рішень лише приблизно відповідає тому, що має виходити теоретично і дещо розходиться з тим, що ми бачили раніше в математичних тестах з пакету RightMark 2.0.

Навіть по теоретичним характеристикамнових моделей HD 6970 і HD 6950 було зрозуміло, що вони не посилили пікову продуктивність математичних обчислень у порівнянні з HD 5870. Але все ж таки явного відставання ми не чекали. Так, своїх конкурентів з Nvidia обидві плати випередили з величезним запасом, але ми до цього звикли, адже відеокарти Geforce показують не дуже високі результати в таких випадках; Проста та інтенсивна математика виконується на Radeon значно швидше.

Несподівано те, що нова старша модель програла 7% попередньої топової, хоча теоретично має поступатися не більше 1%. Тут знову можна починати гадати про те, що спричинило цей програш своєму ж попереднику. Чи то в цьому винен недолік оптимізації драйверів для нових рішень, чи менша ефективність архітектури VLIW4 у таких тестах, чи надто розумна система управління живленням на нових моделях, що «зарізала» тактову частоту і продуктивність рішень при досягненні встановленого порога енергоспоживання.

Direct3D 11: Обчислювальні шейдери

Щоб протестувати нові рішення компанії AMD у завданнях, що використовують такі нові можливості DirectX 11, як теселяція та обчислювальні шейдери, ми скористалися прикладами з пакетів для розробників (SDK) та демонстраційними програмами компаній Microsoft, Nvidia та AMD.

Спочатку розглянемо випробування, що використовують обчислювальні (Compute) шейдери. Їх поява - одне з найважливіших нововведень в останніх версіях DX API, вони вже використовуються в сучасних іграхдля виконання різних завдань: постобробки, симуляцій і т. п. У першому тесті показаний приклад HDR-рендерингу з tone mapping з DirectX SDK, з постобробкою, що використовує піксельні та обчислювальні шейдери.

Можливо, приклад для обчислювальних шейдерів не найвдаліший, але їх поки що взагалі мало. Всі відеокарти показують близькі результати в цьому тесті, але перемагає все-таки топова модель Geforce GTX 580. Анонсовані плати на новому чіпі Cayman поступаються їй зовсім небагато, і тільки при використанні піксельного шейдера. Прямий конкурент нових рішень компанії AMD - відеокарта GTX 570 - відстає від них в обох режимах: і з використанням піксельного, і з обчислювального шейдерів.

Другий тест обчислювальних шейдерів також взятий з Microsoft DirectX SDK, в ньому показано розрахункове завдання гравітації N-тел (N-body) - симуляція динамічної системи частинок, на яку впливають фізичні сили, такі як гравітація.

А ось більш цікаві результати для рішень AMD чимось схожі на цифри з математичного тесту 3DMark Vantage. Незважаючи на велику теоретичну перевагу в пікових цифрах, найшвидша відеокарта Radeon HD 5870 лише трохи випереджає найкраще рішення Nvidia. Обидві нові моделі сімейства HD 6900 показують результати, близькі до показників свого прямого конкурента — Geforce GTX 570.

Але нас сьогодні більше цікавить різниця між результатами рішень на Cayman та Cypress, і тут ми знову бачимо, як перемагає стара відеокарта, та з якою перевагою! 17% між HD 5870 і HD 6970 на користь першої - черговий разматематичні тести оголюють різницю між гарною теорією та жорстокою практикою. Ну де ті застосування, в яких новий GPU зможе показати свою силу? Можливо, в тестах тесселяції все стане нарешті на свої місця.

Direct3D 11: Продуктивність тесселяції

Обчислювальні шейдери дуже важливі, але головним нововведенням в Direct3D 11 все ж таки вважається апаратна тесселяція. Ми дуже докладно розглядали її у своїй теоретичній статті про Nvidia GF100. Тесселяцію вже давно почали використовувати в DX11-іграх, таких як STALKER: Поклик Прип'яті, DiRT 2, Aliens vs Predator, Metro 2033, Civilization V та інших. У деяких із них тесселяція використовується для моделей персонажів (всі ігри жанру FPS з перерахованих), в інших – для імітації реалістичної водної поверхні (DiRT 2) або ландшафту (Civilization V).

Існує кілька різних схем розбиття графічних примітивів (тесселяції). Наприклад, phong tessellation, PN triangles, Catmull-Clark subdivision. Схема розбиття PN Triangles використовується в STALKER: Поклик Прип'яті, а в Metro 2033 - Phong tessellation. Ці методи порівняно швидко і просто впроваджуються в процес розробки ігор та існуючі двигуни, тому стали популярними.

Першим тестом тесселяції буде приклад Detail Tessellation із ATI Radeon SDK. Він показує не тільки теселяцію, а й дві різні технікипопіксельної обробки: просте накладання карт нормалей та parallax occlusion mapping. Що ж, порівняємо DX11-рішення AMD і Nvidia в різних умовах:

Розглянемо спочатку попіксельну техніку. Parallax occlusion mapping (середні стовпчики на діаграмі) на відеокартах обох виробників виконується набагато менш ефективно, ніж тесселяція (нижні стовпчики), а помірна тесселяція не дає великого падіння продуктивності порівняйте верхні і нижні стовпці. Тобто якісна імітація геометрії за допомогою піксельних розрахунків забезпечує навіть меншу продуктивність, ніж тесселірованна геометрія з displacement mapping.

Що стосується продуктивності відеокарт щодо один одного, то тут найважливіший висновок у тому, що відеокарти AMD трохи швидше за плати Nvidia в найлегшому режимі, але повільніше в складних попіксельних розрахунках (згадуємо тести parallax mapping раніше). А до виходу плат на Cayman карти Geforce були трохи швидше за рішення AMD і при включеній тесселяції.

Але тепер різниця по швидкості обробки геометрії між HD 6900 і HD 5870 добре видно — нові плати на базі Cayman у підтесті з тесселяцією виявилися помітно швидше за Cypress. У цьому тесті з невеликим коефіцієнтом розбиття трикутників HD 6970 навіть випередила свого конкурента GTX 570 з гарним запасом.

Другим тестом продуктивності тесселяції буде ще один приклад для 3D-розробників ATI Radeon SDK - PN Triangles. Власне, обидва приклади входять також і до складу DX SDK, тому ми впевнені, що на їх основі створюють свій код ігрові розробники. Цей приклад ми протестували з різним коефіцієнтомрозбиття (tessellation factor), щоб зрозуміти, як сильно впливає його зміна на загальну продуктивність.

Лише у цьому прикладі ми вперше бачимо по-справжньому повне порівняннягеометричної потужності рішень AMD та Nvidia. Дуже сильно виділяється як графічна архітектура Fermi, так і новий GPU виробництва AMD під назвою Cayman. Відкинемо убік те, що це суто синтетичний тест і такі екстремальні коефіцієнти розбиття не будуть використовуватися в іграх сьогоднішнього дня, нам зараз цікавий потенціал. Адже синтетика і потрібна для того, щоб оцінити перспективність і відмінності різних рішень.

Відразу видно, що з відеокартами Nvidia Geforce на чіпі GF110 конкурувати неможливо, у завданнях екстремальної тесселяції вони в рази швидше за навіть оновлену архітектуру AMD. Але це архітектура, спеціально розроблена з урахуванням можливостей нового API. А що ж із Cayman? Порівняно з Cypress все дуже добре!

Нові моделі компанії AMD у режимах середнього навантаження показують вражаючий приріст у швидкості, і різниця в порівнянні з HD 5870 досягає більш ніж дворазової. Однак такий приріст ми бачимо не завжди, а найчастіше він вкладається у півтораразовий. Обіцяної триразової різниці ми принаймні точно не побачили. Тобто, Cayman хоч і скоротив відставання від конкурента у завданнях обробки геометрії, але до розпаралеленої роботи 16 блоків тесселяції у GF110 все ще дуже далеко.

З іншого боку, найбільша різниця між рішеннями різних компаній досягається в умовах екстремальної тесселяції, яких немає і поки що не очікується в реальних іграх. Тому, швидше за все, Cayman помітно зміцнить позиції компанії AMD у існуючих ігрових бенчмарках із застосуванням тесселяції. Особливо якщо коефіцієнт розбиття буде не надто великим, як у тестах 3DMark11.

Давайте розглянемо ще один тест – демонстраційну програму Nvidia Realistic Water Terrain, також відому як Island. У цій демці використовується тесселяція і карти зміщення (displacement mapping) для рендерингу поверхні океану і ландшафту, що реалістично виглядає. Виглядає вона просто чудово, ось чого не вистачає у нинішніх іграх:

Island не є суто синтетичним тестом для вимірювання геометричної продуктивності, він містить і складні піксельні та обчислювальні шейдери, тому різниця у продуктивності може бути меншою, ніж у попередньому випадку, зате таке навантаження ближче до реальних ігор, в яких використовуються відразу всі блоки GPU.

Ми протестували програму при чотирьох різних коефіцієнтах тесселяції, це налаштування називається Dynamic Tessellation LOD. Якщо за найнижчому коефіцієнті розбиття попереду виявляються відеокарти компанії AMD, то за ускладнення роботи плати з урахуванням GF110 відразу вириваються далеко вперед. При зростанні коефіцієнта розбиття та складності сцени продуктивність всіх Radeon падає дуже сильно, на відміну швидкості конкуруючих рішень.

Причому цього разу HD 5870 навіть випереджає обидві моделі нового сімейства. Тобто є зворотна теорія різниця в задачі зі складною геометрією. І пояснення цьому може бути лише одне — нестача оптимізації драйверів для нової архітектури, адже в попередніх тестах ми бачили її явну перевагу над Radeon HD 5870 на чіпі Cypress. Ну а в цьому тесті ми поки що змушені констатувати розгром Cayman – при максимальному коефіцієнті LOD різниця між швидкістю Geforce та Radeon досягла 4-6 разів!

Висновки із синтетичних тестів

За результатами проведених синтетичних тестів відеокарт з нового сімейства Radeon HD 6900, заснованих на графічному процесорі Cayman, а також результатам інших моделей відеокарт виробництва обох виробників дискретних відеочіпів, можна зробити висновок про те, що новинки - непогана заміна лінійці Radeon HD 5800, хоча і не дуже сильно відрізняється від неї за продуктивністю, принаймні в синтетичних тестах.

Графічний процесор Cayman виконаний на основі нової архітектури та відрізняється від попередніх чіпів апаратно, хоча кількість деяких виконавчих блоків у ньому не зросла. Натомість новий GPU відрізняється архітектурними поліпшеннями, спрямованими на збільшення ефективності обчислень на GPU (таких тестів у нас вважайте, що й немає) і, що ще важливіше, пом'якшення важливого відставання від конкурента у вигляді продуктивності обробки геометрії. Багато синтетичних тестів показують, що швидкість тесселяції та виконання геометричних шейдерів помітно зросла, нехай і не завжди в кілька разів, як нам було обіцяно.

Завдяки архітектурним змінам і своїм частотним характеристикам, результати відеокарт нової серії в багатьох синтетичних тестах є конкурентоспроможними для свого цінового сектора, особливо в порівнянні з прямим конкурентом Geforce GTX 570. Ще добре це видно в обчислювальних тестах з пакетів RightMark і Vantage. Та й в інших додатках рішення сімейства HD 6900 показали непогану швидкість, найчастіше поступається тільки топової відеокарти Nvidia.

На жаль, не обійшлося і без дуже приємних сюрпризів. Незважаючи на більшу складність і площу чіпа в порівнянні з Cypress, результати моделей HD 6900 у деяких математичних тестах були нижчими, ніж у HD 5870, що досить непросто пояснити, і ми поки що не впевнені в причинах такого відставання. Можливо, винний недолік оптимізації драйверів, а можливо ефективність нової архітектури VLIW4 в наших тестах виявилася нижче. Система управління живленням на нових моделях знижувала тактові частоти при досягненні максимального енергоспоживання в вимогливих синтетичних тестах, не дозволяючи їм показати очікувану, виходячи з числа блоків та їх тактової частоти, продуктивність.

Напевно багато хто очікував, що Radeon HD 6970 зможе на рівних змагатися з GTX 580 у всіх тестах, але цього не сталося, хоча результати були показані дуже непогані і цілком відповідні рекомендованим цінам на анонсовані сьогодні моделі. Припускаємо, що результати Radeon HD 6970 та HD 6950 у синтетичних тестах будуть підтверджені й відповідними цифрами у «ігровій» частині нашого матеріалу. В іграх старша HD 6970 повинна буде виступити приблизно на рівні GTX 570, в деяких тестах трохи повільніше, а в інших - швидше, а HD 6950 хоч і виявиться повільніше за цю модель Nvidia, але і ціна на цю відеокарту встановлена ​​нижче. Тож давайте швидше перейдемо до дослідження швидкості в іграх!

AMD представила новий модельний ряд Radeon 6900 для затятих шанувальників ігор. Нові графічні картиможуть похвалитися покращеною та більш удосконаленою архітектурою DX11 та можливістю динамічного налаштування енергоспоживання на ходу.

З особливостей Radeon 6970, старшої відеокарти в модельному ряду, вартість якої становить 370 доларів, слід зазначити 1536 потокових процесорів, тактову частоту ядра 880ГГц і 2ГБ пам'яті GDDR5.

Тим часом, Radeon 6950, яка коштує 300 доларів, пропонує тактову частоту дещо нижчу – 800 МГц, 1408 потокових процесорів та 2 ГБ пам'яті GDDR5.

"Напевно, найцікавіше доповнення до серії карток HD 6900 - це додавання нової технології PowerTune, яка фіксує TDP (тепловиділення) до заздалегідь визначеного рівня», - пояснив Райан Шраут (Ryan Shrout) з PC Perspective.

"Завдяки інтеграції управління процесорів для моніторингу активності в реальному часі, GPU має можливість динамічно змінювати тактову частоту для зміни параметра TDP. Це дозволяє драйверу (і, можливо, кінцевому користувачеві) можливість безпосередньо контролювати живлення GPU за допомогою алгоритмічних підходів, щоб гарантувати стійку продуктивність у різних продуктах".

Як каже Шраут, PowerTune дозволяє AMD розігнати GPU, не турбуючись про некоректну роботу додатків, що призводить до збільшення енергоспоживання до небезпечного рівня.

Тому у попередніх поколіннях AMD була змушена тримати запас частот на досить низькому рівні, щоб уникнути виходу з ладу карти. ризику зашкодити карті" - додав він.

Отже, як серія 6900 може протиставити GTX 570 від Nvidia і 580? Як зазначає Влад Савов з Engadget, фахівці сходяться на думці, що Radeon HD 6970 і HD 6950 мають гарне співвідношення ціни та якості.

"6970 конкурує з набагато дорожчою GTX 580, але враховуючи, що її ціна аналогічна GTX 570 від Nvidia, вона варта похвали за те, що є більш життєздатною альтернативою" - пише Савов. "HD 6950 розглядається як реальна річ, тим більше, що вона займає унікальне місцеу ціновому діапазоні, і більшість оглядачів ставлять її на перше місце у співвідношенні витрат та прибутку, у всіх сенсах, зокрема отриманого задоволення та витрачених грошей”.

Технічні характеристики Radeon 6970

  • Частота графічного процесора – до 880Мгц
  • 2ГБ пам'яті GDDR5
  • Частота пам'яті – 1375МГц (5,5 Гбіт/GDDR5)
  • Максимальна пропускна здатність пам'яті – 176 Гб/с
  • 2,7 ТФЛОП одинарної точності обчислювальної потужності
  • 683 ГФЛОП подвійної точності обчислювальної потужності
  • 96 текстурних блоків
  • 128 Z/Stencil ROP
  • 32 Color ROP
  • Подвійна геометрія та подвійний рендеринг
  • Shader Model 5.0
  • DirectCompute 11
  • Технологія AMD Eyefinity
  • Незалежна роздільна здатність, частота оновлення, колірна схема, та відео оверлей.

Технічні характеристики Radeon 6950

  • Частота графічного процесора – До 800МГц
  • 2ГБ пам'яті GDDR5
  • Частота пам'яті – 1250МГц (5,0 Гбіт/GDDR5)
  • Максимальна пропускна спроможність пам'яті 160 Гб/с
  • 2,25 ТФЛОП одинарної точності обчислювальної потужності
  • 562,5 ГФЛОП подвійної точності обчислювальної потужності
  • Єдина архітектура обробки TeraScale 3
  • 1408 потокових процесорів
  • 88 текстурних блоків
  • 128 Z/Stencil ROP
  • 32 Color ROP
  • Технологія обробки геометрії, що масштабується.
  • Shader Model 5.0
  • DirectCompute 11
  • Подвійні блоки апаратної тесселяції
  • Прискорення багатопоточності
  • Технологія кількох моніторів AMD Eyefinity
  • Вбудована підтримка до 4 дисплеїв одночасно
  • Підтримка до 6 дисплеїв з DisplayPort 1.2 Multi-Stream Transport
  • Незалежна роздільна здатність, частота оновлення, колірна схема, та відео оверлей