Ліза Су презентує першу лінійку RyzenЛіза Су презентує першу лінійку Ryzen, презентація AMD 2017 рік

Шлях до успіху компанії AMD пролягав через повне фіаско. Після того як Intel створила свою успішну архітектуру Core (яка теж, між іншим, з’явилась не від хорошого життя, а від повільних і дуже гарячих Pentium 4), AMD довго не могла її наздогнати. Але архітектура Bulldozer вийшла максимально невдалою. AMD майже повністю покинула ринок ноутбуків і серверних процесорів, та і на ринку настільних комп’ютерів її частка була невеликою і сконцентрованою переважно в бюджетному сегменті. Ситуацію трохи рятувало те, що графічне ядро Vega було на голову вище вбудованої графіки Intel, що дозволяло збирати гарні недорогі комп’ютери без дискретної відеокарти.

Стан справ AMD був настільки скрутний, що ще у 2009 році довелось продати власні заводи, але аналітики все одно прогнозували банкрутство компанії до 2020 року. Фактично, лише наявність додаткового джерела доходу з виробництва відеокарт і пам’яті дозволило AMD пережити скрутні часи і знайти ресурси на перезавантаження. Треба було радикально змінювати архітектуру процесорів і починати все з чистого аркуша.

Треба віддати належне CEO Лізі Су, яка дала повний карт-бланш не маркетологам (як це заведено в сучасних великих корпораціях), а інженерам. Також AMD знову найняла легендарного розробника процесорів Джима Келлера. Келлер колись вже займався в AMD розробкою процесора K8, після чого відзначився розробкою процесорів A4 і A5 для Apple.

Zen (2017 рік, Ryzen 1xxx)

Кристал Ryzen 3 1200 монолітний і витягнутий (Зображення Wikipedia)

Результат перевершив усі очікування. Архітектура Zen, показана у лютому 2017 року, стала не просто рятівником компанії AMD, ця архітектура за сім років поставила тотального монополіста Intel на межу банкрутства.

В першому поколінні Zen AMD нарешті стала на рівних конкурувати з Intel, показуючи місцями вищу продуктивність, та ще й маючи при цьому набагато адекватніший цінник.

Уже в цьому поколінні народилися також величезні «багатоголові» процесори для ентузіастів Threadripper і серверні Epyc, з яких почалося повернення AMD на серверний ринок. Але сам кристал процесора в першому поколінні монолітний.

Перше покоління серверних Epic мало кілька повноцінних кристалів Zen (Зображення Wikipedia)

Тож, чому архітектура Zen виявилася настільки успішною? Основна причина, це внутрішні архітектурні покращення.

Технічні особливості архітектури Zen
  • Повноцінне розділення ядер і нормальна багатопотоковість. Якщо в архітектурі Bulldozer два ядра мали ряд спільних елементів, а багатопотоковість була кластерною (CMT), то Zen використав підхід, ближчий до Intel – кожне ядро має власну незалежну архітектуру і може виконувати два потоки.
  • Кеш L1 тепер записував дані за потребою. Є два варіанти роботи кешу в процесорі: наскрізний запис (Write-through) – коли процесор автоматично записує дані і в кеш першого рівня, і в пам’ять, а також запис за потребою (Write-back). Запис за потребою дублює дані в пам’ять лише коли треба замінити дані в кеші і записати туди іншу інформацію. Реалізувати такий підхід складніше, тому що процесор має слідкувати за тим, яка інформація записана в кожній чарунці кешу, але це підвищує швидкість процесора, адже не треба в кожному такті передавати інформацію на запис.
  • Доступ до кешу L1 та L2 збільшився в 2 рази в порівнянні з попередньою архітектурою, а до кешу L3 в цілих 5 разів
  • 4 ядра об’єднуються в логічний обчислювальний блок Core Complex (CCX) із спільним кешем L Процесори, що мають понад 4 ядра складаються з 2 і більше блоків CCX, поєднаних шиною Infinity Fabric. Процесори, що мають не кратну 4 кількість ядер, просто мають вимкнені ядра. Починаючи з покоління Zen 3, кожен блок CCX містив вже не 4, а 8 ядер (якраз один чиплет).
  • Infinity Fabric — нова шина, що поєднує між собою окремі блоки або чиплети (окремі кристали) процесора, в тому числі і графічне ядро. Infinity Fabric дозволила збільшити пропускну здатність з 30 до 512 Гбіт/сек. Шина з’єднує різні блоки процесора, але дані на обробку надходять і повертаються в оперативну пам’ять, тож інженери AMD вирішили синхронізувати її з частотою оперативної пам’яті в поколінні Zen і Zen+. Це призвело до цікавої ситуації, коли продуктивність процесорів AMD сильно покращувалась при підвищенні частоти ОЗУ. Надалі інженери помітили, що не обов’язково чекати більш повільну ОЗУ, тактовий генератор процесора цілком може забезпечити стабільну роботу на частотах, що вдвічі вищі, і покоління Zen 2 і Zen 3 могли працювати як з коефіцієнтом 1:1, так і 2:1, що робило залежність від частоти ОЗУ ще більш вражаючою. Підвищуючи частоту ОЗУ на 200 МГц, передача даних по внутрішній шині процесора зростала на 400 МГц. Треба віддати належне, AMD також отримали чудові контроллери пам’яті, завдяки чому зазвичай могли стабільно працювати з більш швидкою пам’яттю, ніж Intel. Але при високому навантаженні це могло призводити до того, що частота пам’яті знижувалася через сповільнення Infinity Fabric. Зрештою, починаючи з покоління Zen 4 AMD повернулася до архітектури асинхронної роботи внутрішньої шини процесора IF та оперативної пам’яті, щоб зменшити взаємні затримки. З цього часу процесори AMD не мають настільки критичної залежності продуктивності від частоти ОЗУ.
  • Додано новий кеш мікрооперацій, завдяки якому збільшено продуктивність складних обчислень
  • Збільшено в декілька разів кількість датчиків температури і навантажень, що дозволило більш гнучко контролювати стан процесора і працювати на вищих частотах
  • Покращено прогнозування розгалуджень, збільшені черги операцій, реалізовано інструкції Intel Skylake, що зробило ці процесори бінарно сумісними

Загалом нова архітектура продемонструвала 52% приріст IPC (інструкцій за цикл) і, як видно, містила як ряд технологій, характерних для Intel, так і низку власних інновацій.

Цікаво, що для цієї лінійки використовувався техпроцес 14 нм, що було великим стрибком після 32 нм і 28 нм попередників. Intel в цей час випускала свої Skylake та Kaby Lake теж на 14 нм техпроцесі, але планувалося, що наприкінці того ж 2017 року відбудеться перехід на 10 нм. Втім, цього не сталося аж до 2021 року. Натомість AMD у 2018 році випустить оновлену лінійку Zen+ (Ryzen 2000), виготовлену вже на 12 нм техпроцесі.

Zen 2 (2019 рік, Ryzen 3000)

Ryzen 5 3600 має лише один чип CCD, на якому 8 процесорних ядер (2 з них вимкнено). Видно контактний майданчик для розпайки другого кристалу для 12-16-ядерних процесорів. З процесора знята теплорозподільна кришка і знято на інфрачервону камеру, щоб можна було побачити окремі структурні блоки в кристалі.
Ryzen 5 3600 має лише один чип CCD (правіше), на якому 8 процесорних ядер (2 з них вимкнено). Видно контактний майданчик для розпайки другого кристалу для 12-16-ядерних процесорів. З процесора знята теплорозподільна кришка і знято на інфрачервону камеру, щоб можна було побачити окремі структурні блоки в кристалі. (Зображення Wikipedia)

У другому поколінні Zen змінилась зовнішнє компонування процесора. Відтепер це не один кристал, а багато, AMD називає їх «чиплети». Процесор для настільних комп’ютерів відтепер складається з чиплету I/O (вводу-виводу) та “ядерних” чиплетів CCD.

I/O займається взаємодією з ОЗУ, USB, PCIEx, Wi-Fi та іншими комунікаціями, містить блок відеокарти, а також загальну логіку управління процесором. Люди, які не слідкували за тим, скільки вузлів комп’ютера за останні 15 років «переїхало» в процесор, можуть здивуватися, що цей чиплет в процесорі найбільший.

Чиплет CCD містить 2 блоки CCX по 4 ядра і вихід на Infinity Fabric. 8-ядерні процесори зазвичай мають лише один такий чиплет, Threadripper може мати до 12 таких блоків. Процесори, що мають не кратну 8 кількість ядер, просто мають відключені ядра.

Цікаво, що компонування чиплетів на підкладці рознесена, на відміну від підходу Intel, яка починаючи з Meteor Lake компонує плитки впритул, зберігаючи загальне компонування своїх попередніх однокристальних процесорів. Такий підхід дозволяє AMD краще розсіювати тепло, адже процесорні ядра рознесені по краям, а також продовжити формувати квадратні кришки процесорів, адже більшість радіаторів охолодження мають квадратний чи круглий контактний п’ятак.

AMD Epyc 7702 має один чиплет I/O і вже 8 CCD чиплетів по 8 ядер

Zen 3 (2020 рік, Ryzen 5000)

Третє покоління принесло перегляд архітектури процесорного блоку. Тепер повноцінний CCX обчислювальний блок складався не з чотирьох ядер зі спільним кешем 16 Мбайт, а з восьми ядер зі спільним кешем 32 Мбайт. Фактично тепер CCD чиплет містив рівно один логічний CCX блок.

Також в цьому поколінні вбудована графіка перейшла на покоління RDNA 2. Відтепер саме процесори AMD стали показувати найкращу продуктивність для ігор. Це забезпечила технологія 3D V-Cache.

3D V-Cache

Ідея трюку вкрай проста. Чим більший кеш має процесор – тим рідше йому буде потрібно звертатися до повільнішої оперативної пам’яті. Але є ряд причин, чому виробники не розмістили гігабайти пам’яті прямо в процесорі. Перш за все розміщувати пам’ять в кристалі процесора дорого. По-друге, вона теж споживає енергію і виділяє тепло. І зрештою, чим більше пам’яті, тим довший шлях до конкретної чарунки, тим складніше адресація, тим повільніший доступ. Завжди треба шукати золоту середину.

Загалом AMD працює над тим, щоб в першу чергу пришвидшити і розширити доступ до кеш-пам’яті. Зазвичай, результати процесорної роботи займають небагато місця і після певного об’єму збільшення розміру кешу вже не дає великих переваг. Але нелінійні задачі потребують багато пам’яті. В першу чергу побудова зображення і мовні моделі штучного інтелекту дуже вимогливі до пам’яті.

Але AMD вирішила ризикнути – драматично збільшити розмір L3-кешу, але зробити це опційним варіантом для геймерів. Залишається питання як засунути в маленький кристал багато пам’яті?

Інженери придумали от яку річ: розмістити додаткову пам’ять ЗВЕРХУ процесорного кристалу. Якщо вивести контактні майданчики на верх CCD чипа, то зверху можна приєднати ще один чип з пам’яттю. Він буде займати площу кешу L3 і контролера пам’яті, а отже зможе вмістити багато додаткової пам’яті.

У TSMC є технологія полірування, яка дозволяє створювати настільки рівні поверхні, що можна накладати один кристал на інший контактними майданчиками так, щоб забезпечувати передачу сигналу без використання металевих з’єднань і пайки. Тож вирішили зменшити товщину підкладки CCD-чиплета, щоб накласти по периметру додатковий чип у вигляді літери «П». Щоб центральна частина дістала до металевої теплорозподільної кришки, на середню частину чипа просто наклали пасивну кремнієву болванку, тому що кремній чудово проводить тепло.

Технологія все одно має недоліки. По-перше, обчислювальний блок процесорних ядер отримав проміжну прокладку, яка хоч і добре проводить тепло, але не настільки добре, як безпосередній контакт. По-друге, така «піраміда» не дозволяє використати рідкий метал в якості термоінтерфейсу між кристалом і металом. По-третє, таке виготовлення складніше, а отже здорожчує процесор. По-четверте, хоч пам’ять виділяє менше тепла, ніж процесорні ядра, але все ж виділяє, і двоповерховий «бутерброд» не найкращим чином впливає на відведення тепла. І по-п’яте, ці процесори неможливо розігнати, тому що живлення модуля CCX не резинове, і запас, який мали ядра без другого поверху, використовується на живлення пам’яті.

Як бачимо, купа недоліків. То чи варта гра свічок? Авжеж, варта!

Справа в тому, що нелінійні задачі (наприклад побудова графіки, чи моделі штучного інтелекту) дуже чутливі до об’єму і швидкості кешу. Відповідно, прибравши вузьке місце можна суттєво підвищити продуктивність і для цього не треба створювати складні ядра чи підвищувати тактову частоту, а разом з нею споживання і тепловиділення. В іграх експеримент виявився дуже вдалим, Ryzen 7 5800X3D маючи 8 ядер і 16 потоків, показував себе краще, ніж Core i9-12900KS з 16 ядрами і 24 потоками. І це при тому, що Ryzen був холодніший (TDP 105 Вт проти неймовірних 150 у Intel) і мав цінник на 50% менший. Додаючи до 32 Мбайт L3 пам’яті в CCD чиплеті 64 Мбайт доволі простого (як для сучасних процесорів) кристалу, ігри показували в середньому на 15% кращі результати. Це в порівнянні з таким же процесором, з тією ж відеокартою, різниця лише за рахунок кешу. Єдине, ця технологія показує приріст лише в іграх.

Zen 4 (2022 рік, Ryzen 7000)

У поколінні Zen 4 AMD перейшла на роз’єм AM5, що по будові схожий на Intel-івський LGA – відтепер ніжки розташовані не на процесорі, а на сокеті.

Кілька слів про AM5

Після 6 років AM4 почав дещо обмежувати подальший розвиток процесорів, треба було збільшити кількість ліній (контактів). Новий роз’єм було зроблено з заділом на майбутнє – кількість ліній зросла з 1331 до 1718. Так як чиплети компонуються доволі компактно, інженери AMD вирішили не розтягувати просто так підкладку, тому вона займає лише площу, необхідну для цих 1718 контактів. Але в такому разі постала проблема де розташувати стабілізаційні конденсатори.

В процесорах Intel вони розташовуються в центрі підкладки, для них там залишена прямокутна ділянка без контактів. В сокеті AM4 теж була невелика вільна ділянка в центрі, але конденсатори були не на процесорі, а на сокеті. А AM5 геть не має вільного простору, кожен квадратний міліметр зайнятий контактами, за рахунок цього площа підкладки майже не змінилася, а отже усе компонування материнських плат, включаючи охолодження і розміщення модулів ОЗУ, може лишатися сумісною з AM4. А конденсатори вирішили розпаяти з верхньої сторони підкладки.

Порівняння контактних майданчиків AM5 і LGA1700)
Вільного місця в AM5 немає (Зображення videocardz.com)

Але в настільних процесорах з цієї сторони приклеєна теплорозподільна кришка, яка захищає тендітний кристал від кривих рук встановлювача охолодження. І якщо в старих процесорах під AM3 це не було проблемою, то тепер все стало складніше. Процесори для AM3 мали ніжки. Сокет затискав ці ніжки, чим забезпечував надійний контакт. А кришка могла йти по самісінькому периметру підкладки, ховаючи під собою конденсатори разом з кристалом.

Процесори без ніжок кріпляться інакше. Спеціальна металева рамка притискає процесор по периметру. При цьому рамка не має виступати вище кришки, щоб не заважати процесорному радіатору. На формування цієї сходинки потрібно більше місця по периметру.

Довелось робити кришку впізнаваної фігурної форми, щоб вона одночасно і мала виступаючі ділянки, за які скоба сокету притискатиме процесор до контактного майданчика, і простір для конденсаторів. Їх пошкодження чи замикання не смертельне, але може створити перешкоди в сигналах, що видає процесор.

Форма теплорозподільної кришки процесорів на сокеті AM5 стала дуже впізнаваною. (Зображення Wikipedia)

В Zen 4 зазнала змін технологія 3D V-Cache. Тепер додатковий шматочок кремнію з 64 Мб пам’яті L3 розташований не над, а під ядрами. Це дозволило підвищити напругу і покращити тепловідведення, тож процесори з приставкою X3D вперше можна розганяти. А ще в цьому поколінні AMD перестали підтримувати пам’ять DDR4.

З’явилась лінійка Zen 4c (від Cloud), з меншим кешем і частотою, орієнтована на побудову хмарних обчислень.

У 2023 році AMD придбала компанію Xilinx, яка розробляла архітектуру для обчислень операцій штучного інтелекту. У 2024 році AMD включила їх технологію XNDA як обчислювальний блок в свої процесори Ryzen під брендом Ryzen AI. Перший чип з цим блоком, Ryzen 7040 мав продуктивність 10 трильйонів операцій за секунду (ТОЗС). «Рефреш» лінійка 8040 уже могла похвалитися 16 ТОЗС обчисленнь ШІ. А от уже в поколінні Zen 5 було закладено Ryzen AI 2, який забезпечує 50 ТОЗС для ШІ. Це суттєво краще, ніж у Intel, їх настільні процесори Arrow Lake мають продуктивність лише 13 ТОЗС, а в Lunar Lake для ноутбуків NPU модуль має обчислювальну здатність 45 ТОЗС. Поки що локальні інструменти з використанням ШІ рідкість, але в майбутньому це напевно зміниться.

Розробки AMD та Xilix, уніфіковані в останніх процесорах (з документації AMD)

Zen 5 (2024 рік, Ryzen 9000)

Zen 5 стала першою у світі процесорною архітектурою, яка має прогнозувальник розгалуджень, що обчислює не один, а два кроки наперед. Тобто процесор обчислює на два кроки можливий розвиток подій і потім, якщо дії операційної системи підтверджуються, вже має варіанти готових результатів. В академічних колах збільшення прогнозування розгалуджень не на один, а на два кроки, обговорювалися ще у 1996 році і через 28 років AMD Ryzen 9xxx стали першими комерційними процесорами, що реалізували цю концепцію на практиці. Наскільки вона себе виправдає, покаже час.

Висновок

Станом на 2025 рік, AMD сповідує суттєво інший підхід, ніж Intel в компонуванні своїх процесорів. Якщо Intel почала будувати максимально складні по структурі процесори, які складаються з чотирьох частин, складених впритул, а самі частини присутні у великій кількості варіантів, то AMD має максимально уніфіковані чиплети всього двох видів у кожному поколінні. З кількох видів I/O-блоку і різної кількості однакових «ядерних» чиплетів збираються як бюджетні 8-ядерні процесори, так і 96-ядерні Threadripper-и. Це дозволяє будувати дуже гнучку продуктову лінійку, при цьому витрачаючи мало коштів на розробку і перерозподіл залишків. Останні 5 років показують, що це стала стратегія розвитку і не видно ознак, що компанію щось не влаштовує.

Самі ядра хоч і стали більш схожими на Intel, теж мають суттєві особливості. В них постійно збільшується ємність кешу і швидкість доступу до нього, що призводить до росту продуктивності без підвищення енергоспоживання і тепловиділення. Використовуючи передові техпроцеси TSMC AMD може собі дозволити час від часу дещо піднімати частоти, додаючи продуктивності і все одно залишаючись далеко попереду Intel в плані енергоефективності.

Наразі AMD не робить спроб будувати гетерогенну архітектуру, усі процесорні ядра принципово однакові. Єдиний інший тип, що з’явився в четвертому поколінні, це “c”-ядра, вони мають менший L3-кеш, розмір кристала і нижчі частоти, але архітектурно вони ідентичні Zen 4 і Zen 5. В той час, як Intel вводить третій тип ядер, AMD тримається свого курсу навіть в ноутбучному сегменті, комбінуючи в ультрабуках CCD Zen 4/5 із CCD Zen 4c/5c.

Це призводить до цікавої ситуації, коли Intel все ще показує найкращу чисту однопотокову продуктивність, споживаючи при цьому енергії в півтора рази більше, ніж не сильно відстаючі AMD, а також кращу автономність при низькому навантаженні. А AMD ж тримає золоту середину, маючи не саму вражаючу автономність в ультрабуках, але і не потребуючи півтора кіловатний блок живлення. Але в сегменті ультрабуків з’явився новий сильний гравець — ARM, і чи справдиться ставка Intel на LPE-ядра буде залежати лише від того, наскільки гарно Windows навчиться працювати з ARM.

Попри те, що AMD зробила титанічні кроки по впровадженню інструкцій, споконвічно підтримуваних Intel, професійний софт все ще краще працює на останніх. Десь це зумовлено жорстким блокуванням обладнання навіть попри абстракцію віртуальної машини, а десь фірмовою технологією QuickSync, за допомогою якої відеоядро допомагає з нелінійними обчисленнями. Поточна перевага AMD в NPU поки що не дає переваг кінцевому користувачу, тому що для інтелектуального розмиття фону на відеоконференції вистачає і потуг Intel, а коли ШІ-інструменти масово запровадять в професійний софт, може даватися в знаки краща його оптимізованість під блакитного гіганта.

Тож, якщо підсумовувати, для ігор однозначно кращі процесори AMD з приставкою X3D. Окрім бусту від великого кешу, до сих пір багато ігор гублять продуктивність, використовуючи інтелівські E-ядра. В поодиноких процесах, де важлива чиста процесорна продуктивність (пакування архівів, компіляція коду), AMD теж показує кращі або співставні результати при набагато меншому споживанні енергії. Якщо вам потрібен специфічний професійний софт, швидше за все він краще працюватиме з Intel, але треба перевіряти конкретний софт. Також Intel все ж може показати найкращу однопотокову продуктивність в своїх найдорожчих моделях. Але для цих кількох відсотків переваги вам потрібно буде пожертвувати 50% переплатою і таким же додатковим споживанням енергії, тож воно того не варте. Зрештою просто розженіть Ryzen. Ультрабуки в простої чи простих навантаженнях, типу тексту чи відео, краще тримаються Intel Ultra або Qualcomm X Elite. Але в навантаженні AMD знову буде триматися краще.

Єдине, що є наразі принципово відрізняється (і це насправді важливий фактор), так це ціна. AMD об’єктивно дешевші у виробництві і треба віддати їм належне, що у роздрібному продажі вони теж дешевші. Тож, якщо у вас немає потреби працювати з специфічними програмами, AMD буде однозначно кращим вибором.

Від Youstas

Техно-ентузіаст, захоплений дослідженням технологій. Мене зачаровує, як усе працює: хід інженерної думки, приховані інновації та технічні рішення, які залишаються непомітними для більшості.

Залишити відповідь