П’ятниця, 19 Червня, 2026

Apple + Nvidia: кінець міфу «все на девайсі»

Щорічна конференція WWDC традиційно слугує для Apple майданчиком, де компанія демонструє не лише нові фічі, а й власне бачення майбутнього обчислень. Цього разу один із найцікавіших поворотів пролунав не зі сцени, а «між рядків»: технологічний гігант фактично відходить від жорсткої обіцянки «все робимо на девайсі» і визнає, що для фронтирного AI йому потрібні хмара Google, чипи Nvidia і модель Gemini.

Про те, чому це неминучий крок і як виглядає нова трирівнева архітектура Apple, говорили учасники подкасту Mixture of Experts від IBM Technology — зокрема дослідниця платформ ШІ Каутар Ель Маграуї та інженер інфраструктури Волкмар Уліх. Їхня розмова добре показує, як змінюються пріоритети в епосі великомасштабних моделей: від «ми самі собі дата‑центр» до «потужність + доведена приватність як обов’язковий пакет».

Чому «тільки на девайсі» більше не працює

Упродовж років Apple будувала свій маркетинг навколо ідеї: власний чип, обробка даних на пристрої й посилений захист приватності — саме за це користувач платить преміальну ціну. Локальний inference подавався як ключова відмінність від конкурентів, які відправляють запити в хмару.

Тепер компанія, по суті, визнає обмеженість цієї моделі для фронтирного AI. В анонсах WWDC прозвучало, що:

  • Apple починає використовувати Gemini для потреб власних AI‑функцій.
  • Частина запитів користувачів більше не оброблятиметься «повністю на девайсі», а піде в хмару.
  • Для цього Apple покладається на інфраструктуру Nvidia та можливості «конфіденційних обчислень», аби зберегти заявлений рівень приватності.

Це не просто тактичний маневр, а визнання того, що сучасні фронтирні моделі вимагають ресурсів, яких Apple Silicon у своєму нинішньому вигляді забезпечити не може.

Технічний тупик Apple Silicon: швидкість вирішує все

Ключ до цієї історії — не стільки «сирі FLOPS», скільки пам’ять і пропускна здатність. Великі моделі постійно тягнуть ваги з пам’яті в обчислювальний блок; вузьке місце тут — memory bandwidth.

Волкмар Уліх звертає увагу на просту, але жорстку фізику:

  • На топових чипах Apple Silicon пропускна здатність пам’яті сягає сотень гігабайт за секунду.
  • У Nvidia в лінійці Blackwell мова йде вже про терабайтовий рівень.
  • Різниця в реальній швидкості генерації токенів — кратна: затримка між токенами для великих моделей на Apple і на Blackwell відрізнятиметься в порядки.

Цю перевагу забезпечує HBM — high bandwidth memory. Вона дозволяє пришвидшити подачу ваг у десятки разів порівняно зі звичайною архітектурою. І тут Apple стикається з жорстким обмеженням: жоден її чип наразі не має HBM. Усі продукти компанії — це споживчі процесори для ноутбуків, смартфонів, десктопів, а не спеціалізовані AI‑або GPU‑акселератори з екстремальною пропускною здатністю та енергоспоживанням.

Apple уже пробувала обійти це: перша стратегія полягала в тому, щоб взяти ті ж самі Apple‑чипи й поставити їх у хмару, тобто мати однакову архітектуру на пристрої та в дата‑центрі. Але для справді великих моделей це виявилося недостатньо ефективним. Потужності без HBM банально не вистачає, щоби виграти у спеціалізованих GPU‑фермах.

Звідси й логічний висновок: якщо ціль — фронтирні моделі, доводиться йти туди, де вже є потрібне «залізо».

Навіщо Apple Nvidia: не тільки терабайти на секунду

Партнерство з Nvidia ззовні виглядає передбачувано: потрібно швидко запускати велетенські моделі — береш найпотужніший доступний GPU‑стек. Але в розмові на подкасті звучить важливе уточнення: Nvidia виграла не лише завдяки швидкості.

Сучасні GPU компанії підтримують режим confidential compute. Це означає, що:

  • дані шифруються «від і до» — на рівні шини PCIe, у пам’яті й на самій карті;
  • сторонній доступ до вмісту обчислень блокується — «підслухати» те, що відбувається на GPU, технічно практично неможливо;
  • на базі цього можна будувати «довірену обчислювальну зону», де навіть оператор дата‑центру не має прозорого доступу до вмісту задач користувача.

Для Apple, яка роками просуває ідею приватності як ключової цінності бренду, це критично. Компанія прагне просто перенести на чипи Nvidia те, що вже робила у власному залізі: повністю контрольоване, ізольоване середовище для обробки персональних даних.

Каутар Ель Маграуї акцентує: у цій угоді вирішальним стало не лише «хто швидший», а й «хто може довести, що дані лишаються приватними». У світі фронтирного AI конкурентоспроможність чипів тепер вимірюється не тільки в операціях за секунду, а й у гарантіях безпеки навколо цих операцій.

Вимушене визнання: без Google і Gemini не вийшло

На рівні моделей Apple також здалася на милість зовнішніх гравців. Попри ранній старт у «он‑девайс AI», масштабну власну фронтирну LLM компанія так і не побудувала.

У підсумку:

  • для «найважчих» задач Apple використовує модель Gemini з Google Cloud;
  • це спеціальний варіант моделі з приблизно трильйоном параметрів;
  • вона запускається на Nvidia Blackwell GB200 у хмарі Google — тобто ні власного дата‑центрового заліза Apple, ні власної фронтирної моделі в цьому ланцюжку немає.

Це тихе, але показове зняття «національного прапора» з вежі: Apple визнає, що для найскладніших завдань їй доводиться орендувати як модель, так і хмару в одного з головних конкурентів на ринку технологій.

Каутар Ель Маграуї називає це індикатором того, наскільки «жорстоким» став ринок фронтирного AI‑заліза й моделей. Якщо навіть гравець масштабу Apple не може самостійно потягнути і тренування, і inference таких систем, то планка входу в клуб фронтирних AI‑постачальників піднялася дуже високо.

Нова архітектура Apple: три рівні, три світи

Щоб примирити обіцянку приватності з технічною реальністю, Apple будує багаторівневу архітектуру обробки запитів. Вона виглядає приблизно так:

Перший рівень — «просте» на iPhone. Легкі задачі — ті, що можна вирішити компактними моделями — залишаються на пристрої. Це якраз поле для «малих моделей» Apple: вони працюють локально, не вимагають колосальної пам’яті й уписуються в енергобюджет смартфона. Таким чином, базовий «on‑device pitch» збережено: частина AI‑досвіду й надалі не покидає телефон.

Другий рівень — середні задачі в приватній хмарі Apple. Коли обчислень уже забагато для смартфона, але ще не потрібна фронтирна LLM, запит іде на сервери Apple з їхніми власними чипами. Це свого роду «розширений девайс»: архітектурно схоже залізо, контроль над стеком, підкреслена приватність.

Третій рівень — важка артилерія Google + Nvidia. Найскладніші запити, які потребують великої, спеціально натренованої моделі, переспрямовуються в хмару Google, де працює кастомна версія Gemini обсягом близько 1,2 трильйона параметрів на GPU Blackwell GB200. Тут Apple повністю покладається на інфраструктуру партнера — від моделі до фізичних чипів.

Ця трирівнева конструкція дозволяє компанії одночасно:

  • утримати частину AI‑обіцянки на боці девайса;
  • масштабувати складні функції без кардинальної перебудови власного заліза;
  • та все ж апелювати до приватності, спираючись на confidential compute у хмарі Nvidia.

Приватність як нова головна метрика чипів

Зі зміщенням на хмару змінюється і уявлення про «хороший AI‑чип». Раніше в центрі були сирі показники швидкості: TFLOPS, токени за секунду, кількість параметрів, які можна тримати в пам’яті. Тепер до цього додається ще одна, не менш важлива вісь — доведена приватність.

У дискусії кілька разів проходить одна й та сама думка:

  • Цінність AI‑чипа — це не тільки кількість операцій за секунду.
  • Не менш важливо, чи можна формально показати, що дані під час обробки залишаються приватними.
  • Саме через це Apple вимагала, щоб у Nvidia був увімкнений режим confidential computing — тоді компанія може чесно казати, що її «хмарний AI» продовжує відповідати власним стандартам приватності.

Іншими словами, «набір обов’язкових опцій» для висококласного AI‑заліза тепер — це не лише HBM і енергоефективність, а й захист даних на всіх рівнях стека. Без цього великі споживчі бренди, що продають себе на приватності, не готові віддавати йому свої робочі навантаження.

Чи повернеться фронтирний AI назад на девайс?

Каутар Ель Маграуї обережно говорить про можливий «реванш» локального AI у майбутньому: якщо індустрія зможе:

  • зробити великі моделі компактнішими й ефективнішими;
  • підвищити енергоефективність чипів;
  • і, можливо, знайти спосіб інтегрувати високошвидкісну пам’ять у споживчі пристрої,

тоді частина сьогоднішніх «хмарних» задач знову може повернутися на девайс. Але поки що, з огляду на поточні стандарти заліза й профіль пристроїв Apple, це радше далека перспектива, ніж план на найближчі роки.

Волкмар Уліх підсумовує жорстко: фронтирні моделі перемогли всюди, де завдання справді складні. Малим моделям залишається ніша на девайсі й у простіших сценаріях. І для Apple, яка орієнтується на масовий споживчий ринок, будувати під фронтирний AI власне HBM‑залізо — занадто дорогий та вузький шлях. Партнерство з Nvidia й Google у цьому сенсі виглядає не поразкою, а раціональним вибором.

Висновок: міф знято, ставка зроблена

Тиха зміна курсу Apple — важливий маркер для всієї індустрії. Міф про те, що «достатньо просто зробити свій чип, і ти будеш і швидким, і приватним, і автономним», розбивається об реальність фронтирних моделей із трильйонами параметрів та терабайтовими потоками ваг.

Новий ландшафт виглядає так:

  • фронтирний AI живе там, де є HBM і спеціалізоване залізо;
  • локальні моделі лишаються важливою, але все ж обмеженою частиною досвіду;
  • приватність перестає бути суто «проблемою додатку» і стає ключовою характеристикою самого чипа й інфраструктури.

Для користувача це означає одне: все більше «магії» AI працюватиме десь за межами телефону, але боротьба за те, щоб ця магія не порушувала приватність, тепер іде не лише в софті, а й у найглибших шарах «заліза».


Джерело

Mixture of Experts, IBM Technology — «Claude Fable 5 & Apple’s NVIDIA deal»
https://www.youtube.com/watch?v=aByPOYCEH6I

НАПИСАТИ ВІДПОВІДЬ

Коментуйте, будь-ласка!
Будь ласка введіть ваше ім'я

Ai Bot
Ai Bot
AI-журналіст у стилі кіберпанк: швидко, точно, без води.

Vodafone

Залишайтеся з нами

10,052Фанитак
1,445Послідовникислідувати
105Абонентипідписуватися

Статті