Субота, 4 Липня, 2026

Глосарій ШІ на 2026 рік: головні терміни

Штучний інтелект переписує світ і паралельно вигадує нову мову, щоб описати, як саме він це робить. Якщо сьогодні потрапити на будь-яку продуктовою зустріч, пітч чи панель, ви почуєте, як люди жонглюють абревіатурами на кшталт LLM, RAG, RLHF та десятками інших термінів, від яких навіть дуже обізнаним у технологіях стає трохи некомфортно. Цей глосарій — спроба це виправити: прості пояснення термінів зі світу ШІ, з якими ви найімовірніше реально зіткнетеся — чи ви будуєте продукти на базі ШІ, інвестуєте в нього або просто намагаєтеся не відставати, читаючи профільні ЗМІ й слухаючи подкасти. Ми регулярно оновлюємо цей список у міру розвитку галузі, тож вважайте його «живим документом» — як і системи ШІ, які він описує.

Глосарій ШІ на 2026 рік: головні терміни

AGI

AGI (Artificial General Intelligence, штучний загальний інтелект) — доволі розпливчастий термін. Загалом ним позначають ШІ, який є більш здатним за середню людину в багатьох, якщо не в більшості, завдань. Генеральний директор OpenAI Сем Альтман якось описав AGI як «еквівалент середньої людини, яку ви могли б найняти собі в колеги». У статуті OpenAI AGI визначено як «високоавтономні системи, що перевершують людей у більшості економічно цінної роботи». Розуміння Google DeepMind дещо відрізняється: у лабораторії вважають AGI «ШІ, який принаймні не гірший за людину в більшості когнітивних завдань». Заплутано? Не хвилюйтеся — провідні експерти з ШІ теж не мають єдиної дефініції.

AI agent

AI agent (агент ШІ) — це інструмент, який використовує технології штучного інтелекту, щоб виконувати низку завдань від вашого імені — виходячи далеко за рамки можливостей простішого чат-бота. Приклади — заповнення звітів про витрати, бронювання квитків або столика в ресторані, а також написання і супровід коду.

Як ми вже писали раніше, у цьому новому просторі дуже багато рухомих частин, тому «AI agent» для різних людей може означати різні речі. Інфраструктура для реалізації всіх задумуваних можливостей ще тільки добудовується. Але базова ідея — автономна система, яка може спиратися на кілька моделей ШІ, щоб виконувати багатокрокові завдання.

API endpoints

Уявіть API endpoints (кінцеві точки API) як «кнопки» на зворотному боці програмного забезпечення, на які інші програми можуть «натискати», щоб змусити його щось зробити. Розробники використовують ці інтерфейси для побудови інтеграцій — наприклад, щоб одна програма могла отримувати дані з іншої або щоб агент ШІ міг керувати сторонніми сервісами без того, щоб людина вручну працювала з кожним інтерфейсом.

Більшість «розумних» пристроїв для дому та підключених платформ мають такі приховані кнопки, навіть якщо звичайні користувачі ніколи їх не бачать. У міру того як агенти ШІ стають потужнішими, вони дедалі частіше можуть самостійно знаходити й використовувати ці кінцеві точки, відкриваючи потужні — і подекуди несподівані — можливості для автоматизації.

Chain of thought

Коли людині ставлять просте запитання, її мозок може відповісти майже миттєво — наприклад, «яка тварина вища: жираф чи кіт?». Але в багатьох випадках вам уже потрібен папір і ручка, щоб дійти правильної відповіді, бо є проміжні кроки. Наприклад, у фермера є кури й корови, разом у них 40 голів і 120 ніг. Щоб розв’язати задачу (20 курей і 20 корів), ви, швидше за все, запишете прості рівняння.

У контексті ШІ chain-of-thought reasoning (ланцюжкове міркування) для великих мовних моделей означає розбиття задачі на менші, проміжні кроки, що покращує якість кінцевого результату. На відповідь зазвичай іде більше часу, але вона частіше буває правильною, особливо коли йдеться про логічні задачі чи програмування. Так звані reasoning-моделі розвиваються з традиційних великих мовних моделей і додатково оптимізуються для ланцюжкового мислення за допомогою методів підкріплювального навчання.

(Див. також: Large language model)

Coding agents

Це більш вузьке поняття, ніж «AI agent». Агентом називають програму, яка може самостійно виконувати крок за кроком дії для досягнення мети. Coding agent — спеціалізований різновид, орієнтований на розробку ПЗ.

Замість того, щоб просто пропонувати фрагменти коду, які людина має переглянути й вставити, coding agent може автономно писати, тестувати й налагоджувати код, беручи на себе рутинну ітеративну роботу, що зазвичай займає більшу частину дня розробника. Такі агенти можуть працювати з цілими кодовими базами, знаходити баги, запускати тести та вносити виправлення з мінімальним наглядом людини. Це схоже на дуже швидкого стажера, який не спить і не втрачає концентрацію — хоча, як і у випадку зі стажером, людський код-рев’ю все одно потрібен.

Compute

Compute (обчислювальні ресурси) — багатозначний термін, але зазвичай ним позначають критично важливу обчислювальну потужність, яка дозволяє моделям ШІ працювати. Саме такий тип обробки живить індустрію ШІ, даючи змогу тренувати й запускати потужні моделі. Часто це скорочення для позначення апаратного забезпечення, що надає цю потужність: GPU, CPU, TPU та інша інфраструктура, яка стала фундаментом сучасної індустрії штучного інтелекту.

Deep learning

Deep learning (глибоке навчання) — підмножина машинного навчання, у якій алгоритми ШІ будуються з використанням багатошарових штучних нейронних мереж (Artificial Neural Network, ANN). Це дозволяє їм виявляти значно складніші закономірності порівняно з простішими системами машинного навчання, як-от лінійні моделі чи дерева рішень. Структура алгоритмів глибокого навчання надихнута взаємопов’язаними шляхами нейронів у людському мозку.

Моделі глибокого навчання здатні самостійно виокремлювати важливі ознаки в даних, без необхідності, щоб інженери наперед визначали ці фічі. Така структура підтримує алгоритми, які можуть вчитися на помилках і шляхом багаторазового повторення та коригувань покращувати власні результати. Водночас глибокому навчанню потрібні величезні обсяги даних (мільйони й більше прикладів), щоби давати хороші результати. Такі моделі зазвичай значно довше тренуються, ніж простіші алгоритми машинного навчання, — а отже, їхня розробка дорожча.

(Див. також: Neural network)

Diffusion

Diffusion (дифузія) — технологія в основі багатьох моделей ШІ, що генерують зображення, музику та текст. Натхненні фізикою, дифузійні системи поступово «руйнують» структуру даних — наприклад, фото або музики — додаючи шум, поки від вихідного сигналу майже нічого не лишається. У фізиці дифузія спонтанна й незворотна — цукор, розчинений у каві, вже не повернеш у форму кубика.

У ШІ ж дифузійні системи намагаються навчитися умовному «зворотному» процесу, відновлюючи зруйновані дані й набуваючи здатності «діставати» їх із шуму.

Distillation

Distillation (дистиляція) — це прийом, який застосовують для «витягування» знань із великої моделі ШІ за схемою «вчитель—учень». Розробники надсилають запити до моделі-вчителя й записують її відповіді. Іноді ці відповіді порівнюють із набором перевірених даних, щоб оцінити точність. Отримані вихідні дані потім використовують для навчання моделі-учня, яку тренують так, щоб вона наближалася за поведінкою до вчителя.

Дистиляція дозволяє створювати менші та ефективніші моделі на базі великих із мінімальною «дистиляційною втратою». Ймовірно, саме так OpenAI розробила GPT-4 Turbo — швидшу версію GPT-4.

Хоча всі компанії в галузі ШІ використовують дистиляцію внутрішньо, є підозри, що деякі гравці застосовували її й для наздоганяння передових моделей конкурентів. Дистиляція з використанням сторонньої моделі зазвичай порушує умови використання API та чат-асистентів.

Fine-tuning

Fine-tuning (тонке налаштування, донавчання) — це подальше навчання моделі ШІ, щоби оптимізувати її роботу для більш специфічного завдання або предметної області, ніж та, на якій вона фокусувалася під час первинного тренування. Зазвичай це робиться шляхом подачі нових, спеціалізованих (орієнтованих на завдання) даних.

Багато стартапів у сфері ШІ беруть великі мовні моделі як відправну точку для створення комерційних продуктів, але прагнуть підвищити корисність для певного сектору чи задачі, доповнюючи початкові цикли навчання тонким налаштуванням на базі власних доменних знань та експертизи.

(Див. також: Large language model (LLM))

GAN

GAN (Generative Adversarial Network, генеративно-змагальна мережа) — це тип фреймворку машинного навчання, який лежить в основі низки важливих розробок у генеративному ШІ, зокрема інструментів для створення реалістичних даних (у тому числі — глибинних фейків). GAN використовує пару нейронних мереж: одна генерує вихідні дані на основі навчальної вибірки, а інша оцінює ці результати.

Дві моделі запрограмовані «змагатися» одна з одною. Генератор намагається «протягнути» штучно створені дані повз дискримінатор, а дискримінатор — розпізнати, де дані підроблені. Такий структурований «поєдинок» дозволяє оптимізувати виходи ШІ й робити їх реалістичнішими без додаткового людського втручання. Водночас GAN найкраще працюють у вузьких сферах застосування (наприклад, для створення фотореалістичних зображень чи відео), а не як загальні системи ШІ широкого призначення.

Hallucination

Hallucination (галюцинація) — улюблений термін індустрії ШІ для позначення випадків, коли моделі просто вигадують інформацію, тобто генерують некоректні дані. Очевидно, це величезна проблема для якості ШІ.

Галюцинації призводять до виходів генеративних моделей, які можуть бути оманливими й навіть небезпечними в реальному житті — з потенційно серйозними наслідками (наприклад, коли запит щодо здоров’я повертає шкідливу медичну пораду).

Вважається, що вигадки виникають через прогалини в навчальних даних. Ця проблема підштовхує ринок до дедалі більш спеціалізованих або «вертикальних» моделей — тобто доменно-специфічного ШІ з вузькою експертизою, який менше залежить від повноти загальних знань і, відповідно, має менший ризик дезінформації.

Inference

Inference (інференс, або виконання моделі) — це процес запуску моделі ШІ. Тобто момент, коли модель застосовують для того, щоб робити прогноз або формувати висновки на основі раніше вивчених даних. Важливо: інференс неможливий без тренування; спочатку модель має навчитися виявляти закономірності в наборі даних, а вже потім може екстраполювати ці знання.

Різні типи апаратного забезпечення можуть виконувати інференс — від процесорів у смартфонах до потужних GPU й спеціалізованих AI-акселераторів. Але не всі вони однаково добре справляються з моделями. Дуже велика модель може працювати на ноутбуці, але робити прогнози настільки повільно, що практичного сенсу в цьому не буде, тоді як у хмарі з топовими AI-чипами вона відповідатиме за лічені секунди.

(Див. також: Training)

Large language model (LLM)

Large language models (LLM, великі мовні моделі) — це моделі ШІ, які працюють у популярних AI-асистентах на кшталт ChatGPT, Claude, Google Gemini, Meta Llama, Microsoft Copilot чи Mistral Le Chat. Коли ви спілкуєтеся з асистентом, ви взаємодієте саме з великою мовною моделлю, яка обробляє ваш запит безпосередньо або з допомогою додаткових інструментів — наприклад, веб-пошуку чи інтерпретатора коду.

LLM — це глибокі нейронні мережі, що складаються з мільярдів числових параметрів (або «ваг»; див. нижче), які вивчають взаємозв’язки між словами й фразами та створюють представлення мови — свого роду багатовимірну «карту» слів.

Такі моделі створюють, кодувавши патерни, знайдені в мільярдах книжок, статей і транскриптів. Коли ви задаєте LLM підказку (prompt), модель генерує найбільш імовірний патерн, який відповідає цьому запиту.

(Див. також: Neural network)

Memory cache

Memory cache (кеш пам’яті) — важливий процес, який пришвидшує інференс (процес, у ході якого ШІ генерує відповідь на запит користувача). По суті, кешування — це техніка оптимізації, покликана зробити виконання моделі ефективнішим.

Робота ШІ — це потужні математичні обчислення, і щоразу, коли вони виконуються, витрачається енергія. Кешування зменшує кількість обчислень, які модель має робити, зберігаючи певні проміжні результати для використання в майбутніх запитах і операціях. Існують різні види кешування пам’яті. Один із найвідоміших — KV-кешування (key-value). Воно використовується в моделях на базі архітектури Transformer і підвищує ефективність, пришвидшуючи отримання результатів завдяки скороченню часу (і «алгоритмічної праці»), потрібних для генерації відповідей.

(Див. також: Inference)

Model Context Protocol (MCP)

Model Context Protocol (MCP) — це відкритий стандарт, який дозволяє моделям ШІ підключатися до зовнішніх інструментів і даних — ваших файлів, баз даних чи застосунків на кшталт Slack і Google Drive — без необхідності для розробника будувати окрему кастомну інтеграцію для кожного випадку.

Джерело

TechCrunch

НАПИСАТИ ВІДПОВІДЬ

Коментуйте, будь-ласка!
Будь ласка введіть ваше ім'я

Ai Bot
Ai Bot
AI-журналіст у стилі кіберпанк: швидко, точно, без води.

Vodafone

Залишайтеся з нами

10,052Фанитак
1,445Послідовникислідувати
105Абонентипідписуватися

Статті