Понедельник, 29.04.2024, 14:41
Приветствую Вас Гость

Kadavr PRO

Меню сайта
Чат
Опрос
AMD или ATI лидер рынка 2012?
Всего ответов: 4
Статистика

Онлайн всего: 1
Гостей: 1
Пользователей: 0
Форма входа
Главная » 2012 » Май » 24 » В чем отличие архитектур GCN (Graphics Core Next) и VLIW (Very Long Instruction Word).
00:48
В чем отличие архитектур GCN (Graphics Core Next) и VLIW (Very Long Instruction Word).
В последнее время в среде графических ускорителей произошло сразу две революции.Это новая архитектура GCN (Graphics Core Next) от AMD и Kepler от Nvidia. Обе основаны на современном 28нм техпроцессе с поддержкой DirectX 11.1.
Со временем техпроцесс стает меньше,а это влечет за собой либо революционные изменения либо просто модернизацию уже существующей базы.В 2011года с анонсом графических ускорителей Radeon HD 7000 и Geforce 600 ознаменовало новую эру - эпохи 28нм.
Благодаря 28нм инженерам удалось продвинутся в плане производительности чуть ли не на 100% и больше.Одновременно была создана совсем новая архитектура GCN у AMD Radeon и Kepler у Nvidia Geforce.Благодаря уменьшенному техпроцессу получилось реализовать многие нововведения как API DirectX 11.1 и OpenGL 4.2,увеличить пиковую производительность втрое при этом не пожертвовав энергопотреблением.Впервые Radeon использовала более дорогую шину шириной в 384bit на однопроцессорной видеокарте класса HD 7970 и HD 7950.Nvidia же смогла впервые увеличить число потоковых процессоров до 1536 штук!!! на топовом флагмане - однопроцессорной видеокарте Geforce GTX 680,а такое внушительное число потоковых процессоров означает революцию в картах Geforce.

До 600 серии карты Geforce никогда не имели потоковых процессоров больше чем у их конкурентов - графических решений от Radeon,пи чем не просто не имели,а имели намного меньше чем у конкурирующих карт в соответствующих сегментах.Например Geforce GTX 580 имели всего 512 потоковых процессоров,пока его конкурент Radeon HD 6970 в High-End сегменте имел уже 1536 штук.Но меньшее количество потоковых процессоров не делало продукты от Geforce слишком слабыми.Благодаря архитектуре Fermi конечно.Ведь именно ей на смену пришел Kepler.И вот,GTX 680 имеет 1536 потоковых процессоров,ровно столько же сколько и предыдущий флагман Radeon HD 6970.
Но до уровня карт Radeon HD 7970 и 7950 по прежнему далеко.7970 имеет 2048 потоковых процессоров,а 7950 чуть меньше - 1792 штуки.
Но как я уже говорил,это не делает их противника - карт Geforce слабым конкурентом.

Ну давайте рассмотрим архитектуру поближе.
Так как архитектура революционная,то AMD продемонстрировала  ее новые особенности на конференции AMD Fusion’11 Developer Summit (с 13 по 16 июня в американском городе Белвью) для того,что дать разработчикам программного обеспечения была возможность поближе познакомиться с GCN.До GCN использовалась VLIW архитектура (самые последние карты базируются на VLIW4 и VLIW5).
Новая архитектура умеет экономно распределять ресурсы графического процессора при обработке графики.
GCN
Давайте рассмотрим последнего представителя VLIW архитектуры на GPU Cayman-Radeon HD 6950,6970 и 6990.HD 6000 серия имеет кодовое наименования Northern Island и использует 40нм GPU с поддержкой API DirectX 11 и OpenGL 4.1 .



Главной частью шейдерного домена у VLIW является блок SIMD Engine (single instruction, multiple data,потому что все эти блоков одновременно выполняют одну инструкцию VLIW,но способны принимать и другие данные) который состоит из шестнадцати потоковых процессоров.В одной VLIW-инструкции упаковано сразу до четырех скалярных операций то есть четырем ALU внутри лишь единого потокового процессора.Помимо возросшей производительности в графических приложениях,новые GPU с архитектурой GCN ориентированы и на работу в вычислительных задачах.Именно для этого в GPU на Southern Islands был специально интегрирован собственный вычислительный блок «Compute Unit».Выполненный в этот раз не по старому VLIW-дизайну,новый блок объединяет в себе сразу векторные вместе с скалярными блоками,где каждый из вычислительных блоков новой GCN оснащен собственным планировщиком,а значит способен одновременно выполнять инструкции из нескольких программ.Приоритет новых GPU наверно на многопоточности если можно так сказать.В будущем,возможно это и станет станет «изюминкой» архитектуры GCN.Блок у GCN называется Compute Unit и устроен иначе.Те же 64 ALU,но которые поделены на четыре векторных SIMD-модуля в количестве 16 штук. Если раньше параллельная обработка была реализован за счет сразу пары операций в одной лишь инструкции,то в новой GCN это происходит за счет пары отдельных SIMD-блоков.Вот так и выходит,что производительность старой архитектуры VLIW зависела именно от того, сколько скалярных операций компилятор способен закодировать сразу в одной VLIW-инструкции,а в Compute Unit (GCN) возможно динамически распределять нагрузку между SIMD-блоками.Главной особенностью GCN можно назвать отдельный скалярный модуль в каждом блоке Compute Unit который выполняет одну операцию за один цикл.
У каждого блока Compute Unit есть лично отдельный кэш объемом в 16KB L1 уровня,а так же еще хранилище для инструкций и данных с 16 и 32KB плюс 768KB общего кэша L2.Шины кэшей L1 и L2 уровней имеют разрядность 64 байта.У Cayman(на VLIW),например, каждый SIMD-модуль имел кэш L1 уровня,объемом 8KB с разрядностью шины 16 байт.Скорость кэш памяти взросла до 2Tb/сек для L1 уровня и 700GB/сек для L2 уровня.

Схема ядра Tahity (HD7970,7950)

Схема ядра Cayman (HD6970,6950)

Схема ядра GF100 (GTX 580,GTX 570,GTX 560 Ti 448 Cores)
Но помимо архитектуры давайте рассмотрим и улучшения новых видеокарт на базе GCN.
Вот например ,внедренную шину PCI-E 3.0 .PCI-E 3.0 это шина нового поколения  у которой пропускная способность в 2 раза больше.Вряд ли прирост производительности удастся заметить,но если взять неграфические расчеты,то тут спорный вопрос.
Помимо новой интегрированной шины PCI-E 3.0,AMD поработало над улучшением анизотропной фильтрации.Главной целью было устранить едва заметное мерцание на текстурах в случае установки высокого разрешения.
Помимо улучшения анизотропной фильтрации ,в GCN появился новый алгоритм Ptex (Per-face texture mapping).В чем особенность?В 3D изображении текстура накладывается на модель целиком при этом вершины нужно аккуратно совмещать с нужными участками двухмерного полотна.Ptex упрощает задачу,накладывая на каждый полигон отдельную текстуру.Итог - никаких видимых стыков.В добавок с помощью Ptex,можно упаковывать текстуры с разным разрешением в один файл.

А теперь перейдем к энергопотреблению где рассмотрим PowerTune и ZeroCore.
PowerTune была еще в старших моделях предыдущего поколения Radeon.GPU может динамически настраивать частоты таким образом, чтобы карта использовала энергию в пределах допустимого TDP, которое определяет пользователь.Технология ZeroCore,предполагает существенно снизить энергопотребления в режиме ожидания. ZeroCore включает режим глубокого сна для снижения энергопотребления GPU,режим отключения DRAM для снижения расхода энергии памятью.Как утверждает AMD,новая видеокарта HD 7970 потребляет около 15 W при простое(при выключенном мониторе при простое и вовсе потребление падает до 3W),а то и вовсе не расходует энергию если когда монитор отключен.Одновременно в данном режиме  вентилятор системы охлаждения отключается,а это означает что видеокарта сильно не нагревается.
Ядро GCN способно полностью отключаться при условии если на экране долго ничего не происходит,а так же полностью останавливать куллер благодаря технологии  ZeroCore.Особенно эту технологию оценят пользователи систем в режиме CrossFire.,там где приходится следить за  значительном тепловыделении видеокарт.ZeroCore, позволяет отключать вторую, третью или четвёртую карту,в режиме CrossFire,при условии если в их использовании вовсе нет необходимости.
Как видно на изображении новые карты утроились в производительности.Этим изображением можно даже подвести итог или описать всю характеристику новых видеокарт .
Единственное что не изменилось это количество блоков растеризации ROP,так как у обоих флагманов их по 32 штуки.Самое большее их  количество у одночиповой карты было у Gefore GTX 580 - 48штук.Растровые блоки отвечают за загрузку и выгрузку пикселов если говорить вкратце.Значит чем больше число ROP,тем меньше будет падать производительность при игре на высоком разрешении со сглаживанием.
Но в последнее время растровые блоки (ROP) не так стают важны как потоковые процессоры и текстурные блоки,так что решение компаний вполне разумное.Вместо того что бы тратить силу на увеличение растровых блоков,компании стараются грамотно увеличивать потоковые процессоры в своих видеоускорителях.
В новом Geforce GTX 680 установлено 1536 потоковых процессора!Это как у Radeon HD 6970 и лишь на 512 штук меньше чем у HD 7970!
Как видно при частоте 925MHz скорость заполнения текстур у 7970 равно 118.4Gt/сек,а у "младшего" вариант HD 7950 это число равно 89.6Gt/сек при частоте ядра в 800MHz.Дело в том,что на скорость заполнения текстур влияет количество текстурных блоков (TNU) и тактовая частота ядра.Аналогично и на скорость Fillrate когда на показатель влияет количество блоков растеризации (ROP) и тактовая частота ядра.Кстати пропускная способность у HD 7970 равна 264GB/сек что впечатляюще выглядит.К примеру у Geforce GTX 680 пропускная способность составляет 192GB/сек.
Энергопотребление при этом у HD 7970 остается на том же уровне что и у HD 6970 то есть 250W.Очень впечатляющий результат,а еще это ощущение подчеркивает энергопотрбление 175W у HD 7870 и 130W у HD 7850.У Geforce GTX 680 энергопотребления составляет 195W.
Как видно GCN несомненно революция и хорошая база для будущих видеокарт.Новая архитектура продемонстрировала себя впечатляюще.В связи с прошедшим месяцем цены на продукты от Radeon начали падать в связи с конкуренцией от Nvidia.Решения 7750,7770 подойдут для тех кому не нужна высокая производительность,7850 и 7870 подойдут большинству,а 7950 и 7970 разберут с магазинов энтузиасты.
Большинство новых карт имеют стандартно 2GB видеопамяти.Учитывая производительность современных графических ускорителей такой внушительный объем видеопамяти разумен.Этого хватит не только на больших разрешениях с "тяжелым" сглаживанием например как FXAA или CSAA,но и с гарантией на будущее.
Вне всяких сомнений AMD Radeon HD 7970 на GPU «Tahiti» с новой архитектурой GCN есть практически одной из самых быстрых однопроцессорной видеокарт на данный момент,конкурируя мощью лишь с картой High-End сегмента Geforce GTX 680 на так же новой архитектуре Kepler.Новые карты обладают отличным разгонными потенциалом,причем поднятие тактовых частот приводит к практически сильному  росту производительности.
Просмотров: 5259 | Добавил: Madness | Рейтинг: 5.0/1
Всего комментариев: 0
Имя *:
Email *:
Код *:
Поиск
Календарь
«  Май 2012  »
ПнВтСрЧтПтСбВс
 123456
78910111213
14151617181920
21222324252627
28293031
Архив записей
Друзья сайта