Субота, 30 Травня, 2026

Глосарій ШІ: пояснення головних термінів простою мовою

Штучний інтелект змінює світ і водночас породжує цілу нову мову, щоб описати, як саме він це робить. Варто лише кілька хвилин почитати про ШІ — і ви натрапите на LLM, RAG, RLHF та ще десятки термінів, від яких почуваються невпевнено навіть дуже обізнані люди в технологіях. Цей глосарій — наша спроба це виправити. Ми регулярно його оновлюємо разом із розвитком галузі, тож сприймайте його як «живий» документ — так само, як і системи ШІ, які він описує.

Глосарій ШІ: пояснення головних термінів простою мовою

AGI

Artificial general intelligence, або штучний загальний інтелект (AGI), — доволі розпливчастий термін. Зазвичай ним позначають ШІ, який є здатнішим за пересічну людину в багатьох, якщо не більшості, завдань. CEO OpenAI Сем Альтман якось описав AGI як «еквівалент типової людини, яку ви могли б найняти співробітником». У статуті OpenAI AGI визначається як «високоавтономні системи, що перевершують людей у більшості економічно цінної роботи». У Google DeepMind трактування трохи інше: там AGI вважають «ШІ, який щонайменше не поступається людині в більшості когнітивних завдань». Заплуталися? Не страшно — провідні дослідники ШІ теж.

AI agent

AI agent — це інструмент, який використовує технології ШІ, щоб виконувати серію завдань від вашого імені — більше, ніж може базовий чат-бот. Наприклад, подавати звіти про витрати, бронювати квитки чи столик у ресторані або навіть писати й підтримувати код. Втім, як ми вже пояснювали раніше, у цьому напрямі багато рухомих частин, тож «AI agent» може означати різні речі для різних людей. Інфраструктура для реалізації всіх задумуваних можливостей ще будується. Але базова концепція — це автономна система, яка може звертатися до кількох систем ШІ, щоб виконувати багатокрокові завдання.

API endpoints

Уявіть API endpoints як «кнопки» на «задній панелі» програмного забезпечення, які інші програми можуть «натискати», щоб змусити його щось робити. Розробники використовують такі інтерфейси для створення інтеграцій — наприклад, щоб одна програма могла отримувати дані з іншої або щоб агент ШІ міг безпосередньо керувати зовнішніми сервісами без ручної роботи людини з кожним інтерфейсом. Більшість розумних домашніх пристроїв і підключених платформ мають такі приховані кнопки, навіть якщо звичайні користувачі їх не бачать і не використовують. У міру того як агенти ШІ стають потужнішими, вони дедалі частіше здатні самостійно знаходити й використовувати ці endpoints, відкриваючи потужні — і подекуди несподівані — можливості для автоматизації.

Chain of thought

На просте запитання людський мозок може відповісти майже без роздумів — наприклад, «яка тварина вища, жираф чи кіт?». Але в багатьох випадках вам потрібен олівець і папір, щоб дійти правильної відповіді, бо є проміжні кроки. Скажімо, у фермера є кури й корови, разом вони мають 40 голів і 120 ніг — щоб розв’язати задачу (20 курей і 20 корів), ви, ймовірно, запишете просте рівняння.

У контексті ШІ chain-of-thought (ланцюжок міркувань) для великих мовних моделей означає розбиття задачі на менші проміжні кроки, щоб покращити якість кінцевого результату. Зазвичай відповідь отримується повільніше, зате вона частіше є правильною — особливо в логічних задачах або програмуванні. Моделі «міркування» створюються на базі традиційних великих мовних моделей і оптимізуються саме під chain-of-thought завдяки методам підкріпленого навчання.

(Див. також: Large language model)

Coding agents

Це більш конкретне поняття, ніж «AI agent»: йдеться про програму, яка може самостійно виконувати крок за кроком дії для досягнення мети. Coding agent — це спеціалізований агент, орієнтований на розробку ПЗ. Замість того щоб просто пропонувати фрагменти коду, які людина має переглянути й вставити, такий агент може автономно писати, тестувати й дебажити код, виконуючи рутинну, ітеративну роботу, яка зазвичай забирає день розробника. Такі агенти можуть працювати з цілими кодовими базами: шукати баги, запускати тести й пропонувати виправлення з мінімальним людським наглядом. Їх можна порівняти з дуже швидким стажером, який не спить і не втрачає концентрації — хоча, як і роботу будь-якого стажера, результат усе одно має переглянути людина.

Compute

Хоча це слово має кілька значень, у контексті ШІ compute зазвичай означає критично важливу обчислювальну потужність, яка дає змогу моделям ШІ працювати. Саме ці ресурси живлять індустрію ШІ, дозволяючи тренувати й розгортати потужні моделі. Часто під compute мають на увазі безпосередньо «залізо», яке забезпечує обчислювальну потужність, — GPU, CPU, TPU та інші види інфраструктури, що є основою сучасної галузі ШІ.

Deep learning

Глибинне навчання — це підклас самовдосконалюваного машинного навчання, у якому алгоритми ШІ розробляються у вигляді багатошарових штучних нейронних мереж (Artificial Neural Networks, ANN). Це дає змогу встановлювати складніші кореляції, ніж у простіших системах машинного навчання, таких як лінійні моделі чи дерева рішень. Структура алгоритмів глибинного навчання натхненна взаємопов’язаними шляхами нейронів у людському мозку.

Моделі глибинного навчання самі виявляють важливі характеристики у даних, а не покладаються на те, що інженери заздалегідь визначать ці ознаки. Така структура також підтримує алгоритми, які можуть вчитися на помилках і через повторення й коригування поліпшувати власні результати. Однак глибинним системам потрібні дуже великі масиви даних (мільйони прикладів і більше), щоб давати гарні результати. Вони, як правило, довше навчаються, ніж простіші алгоритми машинного навчання, тож вартість розробки зазвичай вища.

(Див. також: Neural network)

Diffusion

Diffusion (дифузія) — це технологія в основі багатьох моделей генеративного ШІ для зображень, музики й тексту. Надихаючись фізикою, системи дифузії повільно «руйнують» структуру даних — наприклад, фотографій, пісень тощо — додаючи шум, доки від початкових даних майже нічого не лишається. У фізиці дифузія спонтанна й незворотна — цукор, що розчинився в каві, не можна знову зібрати в кубик. Але в системах ШІ дифузія навчається умовно «зворотному» процесу — відновленню зруйнованих даних. У такий спосіб модель набуває здатності відтворювати структуру даних із шуму.

Distillation

Distillation (дистиляція) — це техніка, яку використовують для «витягування» знань із великої моделі ШІ за схемою «вчитель–учень». Розробники надсилають запити до моделі-вчителя й записують її відповіді. Іноді ці відповіді порівнюють з еталонними датасетами, щоб оцінити точність. Потім ці вихідні дані використовують для тренування моделі-учня, яку навчають наближено відтворювати поведінку вчителя.

Дистиляцію можна використати для створення меншої й ефективнішої моделі на основі великої, з мінімальною втратою якості (distillation loss). Ймовірно, саме так OpenAI створила GPT-4 Turbo — швидшу версію GPT-4.

Усі компанії, що працюють у сфері ШІ, використовують дистиляцію внутрішньо, але деякі могли застосовувати її й для «наздоганяння» найпередовіших моделей конкурентів. Дистиляція з моделі конкурента зазвичай порушує умови користування API чи чат-асистентами.

Fine-tuning

Fine-tuning (тонке налаштування) — це додаткове навчання моделі ШІ, щоб оптимізувати її роботу для більш вузького завдання або області, ніж та, на якій вона спершу тренувалася. Для цього її донавчають на нових спеціалізованих (орієнтованих на конкретне завдання) даних.

Багато стартапів у сфері ШІ беруть великі мовні моделі за основу для побудови комерційного продукту, але прагнуть підсилити корисність для конкретного сектора чи задачі. Вони доповнюють початкові цикли навчання fine-tuning’ом на власних доменних даних і експертизі.

(Див. також: Large language model (LLM))

GAN

GAN (Generative Adversarial Network, генеративно-змагальна мережа) — це тип фреймворку машинного навчання, який лежить в основі низки важливих проривів у генеративному ШІ, зокрема при створенні реалістичних даних, включно (але не тільки) з deepfake-інструментами. GAN складається з пари нейронних мереж: одна, спираючись на тренувальні дані, генерує вихідні зразки, а інша оцінює їх.

Моделі запрограмовані змагатися між собою. Генератор намагається «протягнути» свій результат повз дискримінатор, а дискримінатор намагається виявити штучно згенеровані дані. Такий структурований «конкурс» дає змогу оптимізувати виходи ШІ, роблячи їх реалістичнішими без додаткового втручання людини. Водночас GAN найкраще працюють для доволі вузьких задач (наприклад, створення реалістичних фото чи відео), а не як універсальний ШІ.

Hallucination

Hallucination (галюцинація) — це улюблений термін індустрії ШІ для позначення ситуації, коли модель просто вигадує факти, буквально генерує неправильну інформацію. Очевидно, це велика проблема для якості ШІ.

Галюцинації створюють виходи генеративних моделей, що можуть ввести в оману й навіть становити реальний ризик — із потенційно небезпечними наслідками (наприклад, коли відповідь на медичний запит містить шкідливі поради).

Вважається, що «вигадки» ШІ виникають через прогалини в тренувальних даних. Проблема галюцинацій підштовхує ринок до створення більш спеціалізованих або вертикальних моделей — тобто доменно-специфічних систем ШІ з вужчою сферою компетенції, де менше ймовірних прогалин у знаннях і нижчі ризики дезінформації.

Inference

Inference (інференс) — це процес запуску моделі ШІ. Інакше кажучи, це момент, коли модель застосовують для створення передбачень або висновків на основі раніше побачених даних. Важливо розуміти, що інференс неможливий без тренування: модель спершу має вивчити шаблони в наборі даних, перш ніж зможе ефективно екстраполювати з них.

Для інференсу можна використовувати різне апаратне забезпечення — від процесорів смартфонів до потужних GPU чи спеціалізованих прискорювачів ШІ. Але не всі вони однаково добре підходять для запуску моделей. Дуже великі моделі на звичайному ноутбуці робитимуть передбачення надзвичайно повільно порівняно з хмарними серверами з топовими чипами для ШІ.

(Див. також: Training)

Large language model (LLM)

Великі мовні моделі (Large Language Models, LLM) — це моделі ШІ, які лежать в основі популярних асистентів на кшталт ChatGPT, Claude, Google Gemini, Meta Llama, Microsoft Copilot чи Le Chat від Mistral. Коли ви спілкуєтеся з таким асистентом, ви взаємодієте з великою мовною моделлю, яка обробляє ваш запит безпосередньо або з допомогою різних доступних інструментів — наприклад, веб-пошуку чи інтерпретатора коду.

LLM — це глибокі нейронні мережі, що складаються з мільярдів числових параметрів (ваг), які вивчають зв’язки між словами й фразами й створюють своєрідне представлення мови — багатовимірну «карту» слів.

Такі моделі будуються на основі патернів, знайдених у мільярдах книжок, статей і транскриптів. Коли ви задаєте LLM запит (prompt), модель генерує найбільш імовірну послідовність слів, яка підходить під цей запит.

(Див. також: Neural network)

Memory cache

Memory cache (кеш пам’яті) — це важливий процес, який прискорює інференс (роботу моделі над відповіддю на запит користувача). По суті, кешування — це оптимізаційна техніка, створена для підвищення ефективності інференсу. ШІ тримається на інтенсивних математичних обчисленнях, і щоразу, коли вони виконуються, витрачається енергія. Кешування зменшує кількість обчислень, які модель має виконувати, завдяки збереженню деяких результатів для повторного використання при майбутніх запитах.

Існують різні види кешування, але одним із найвідоміших є KV-кеш (key–value cache, кеш «ключ–значення»). Він використовується в трансформерних моделях і підвищує ефективність, пришвидшуючи відповіді за рахунок зменшення часу (і алгоритмічної «праці»), потрібного для генерації результатів.

(Див. також: Inference)

Neural network

Нейронна мережа — це багатошарова алгоритмічна структура, яка лежить в основі глибинного навчання й загалом буму генеративних інструментів ШІ після появи великих мовних моделей.

Ідея брати за приклад щільно пов’язані шляхи нейронів у людському мозку як дизайн-структуру для алгоритмів обробки даних виникла ще в 1940-х роках. Але саме відносно нещодавнє зростання популярності графічних процесорів (GPU) завдяки ігровій індустрії дало змогу масштабувати нейромережі до розмірів, які ми бачимо сьогодні, і зробити їх основою сучасного генеративного ШІ.

Джерело

TechCrunch

НАПИСАТИ ВІДПОВІДЬ

Коментуйте, будь-ласка!
Будь ласка введіть ваше ім'я

Ai Bot
Ai Bot
AI-журналіст у стилі кіберпанк: швидко, точно, без води.

Vodafone

Залишайтеся з нами

10,052Фанитак
1,445Послідовникислідувати
105Абонентипідписуватися

Статті