Понеділок, 22 Червня, 2026

AI пише й запускає код: класифікатор зображень у Lemma

У новому відео на каналі Tech With Tim автор показує, як платформа Lemma від Analemma AI виходить за межі звичного “чат-бот відповів на запит”. Один із найяскравіших прикладів — повністю автономний експеримент у режимі Code: система сама досліджує задачу, проєктує пайплайн, генерує код, запускає навчання моделі та візуалізує результати для класифікатора, що відрізняє AI‑зображення від реальних фото.

Цей кейс дає рідкісну можливість подивитись крупним планом, як виглядає на практиці “vibe coding” для машинного навчання, коли людині достатньо сформулювати ідею експерименту — а все інше бере на себе багатoагентна система.

Від однієї фрази до повного ML-проєкту

Початковий запит був навмисно простим і високорівневим: побудувати класифікатор зображень, здатний розрізняти AI‑згенеровані картинки та реальні фотографії. До нього додали дві важливі умови: використовувати невеликий датасет і візуалізувати ознаки, на які модель спирається під час класифікації.

Тобто завдання відразу містило кілька шарів: вибір архітектури моделі, побудова або підготовка датасету, написання тренувального скрипта, реалізація візуалізацій та організація всього цього в робочий пайплайн. Зазвичай це означало б ручне планування експерименту, підбір репозиторіїв, пошук прикладів коду та багато ітерацій правок.

У Lemma підхід інший. Система орієнтується не на покрокові інструкції, а на кінцеву ціль. Користувач формулює, чого хоче досягти, на рівні “побудуй класифікатор і покажи, що він бачить”, і віддає ініціативу системі.

Спочатку ресерч, потім — код

Ключова деталь, яка вирізняє Lemma серед інструментів “згенерувати мені скрипт”: вона не кидається одразу писати код. Перед генерацією будь-яких файлів платформа запускає повноцінний етап дослідження.

Система самостійно читає релевантні матеріали, вивчає різні методології та вибудовує стратегію, як саме досягти поставленої цілі. І тільки після цього переходить до створення коду. Це ближче до роботи реального дослідника, ніж до класичного “код‑асистента”, що просто дописує фрагмент за підказкою.

У результаті формується помітний за обсягом кодовий базис: окремі модулі для роботи з датасетом, для його генерації або підготовки, для навчання моделі, для побудови візуалізацій. Усе це — не розрізнені снипети, а цілісний експериментальний пайплайн, який можна прогортати, відкрити будь-який файл та зрозуміти, як він вбудований у загальний проєкт.

Така структура важлива не лише для зручності, а й для довіри: видно, які саме рішення прийняла система, як організувала дані, які метрики збирала.

Віртуальне середовище замість локального стенду

Ще одна суттєва риса: усі обчислення виконуються не на машині користувача, а у віддаленому віртуальному середовищі, до якого Lemma під’єднується автоматично. Інтерфейс при цьому нагадує знайоме IDE, на кшталт VS Code, але працює всередині самої платформи.

Користувач бачить структуру проєкту, файли, виведені зображення та логи, але не налаштовує окруження вручну — немає потреби встановлювати бібліотеки, готувати GPU чи слідкувати за версіями фреймворків. Усе це бере на себе система.

У віртуальному середовищі Lemma не лише зберігає код, а й формує артефакти експерименту: сітки зображень, результати класифікації з підписами “AI generated” / “real”, тренувальні криві втрат і точності. Це дає можливість одразу оцінити, як працює модель, без додаткового доопрацювання.

Для цього експерименту використовувався невеликий датасет, щоб не розтягувати час виконання. Втім, навіть у такому легкому режимі система формує зрозумілу картину: видно, що класифікатор правильно розпізнає більшість прикладів, а візуалізації дають уявлення, на яких патернах зображень він “навчився” відрізняти синтетичні кадри від реальних фото.

Від MobileNet до логів виконання: що саме зібрала Lemma

Після завершення завдання можна переглянути весь список “to-do”, які система поставила сама собі і послідовно виконала. Це не просто “згенеруй модель” і “натисни train”, а багатокроковий план з проміжними задачами.

У звіті фіксується, яку архітектуру в підсумку було обрано та як саме організовано навчання. У цьому випадку Lemma використала MobileNet v3 small 0.5, донавчивши її на 300 зображеннях: 150 реальних і 150 AI‑згенерованих. Також платформа вказує, скільки часу тривало тренування на CPU, наголошуючи, що модель невелика і ресурсів потребувала небагато.

Крім підсумкових метрик, доступні детальні логи: bash‑команди, відкриті термінали, поступове виконання кроків тренування. Це важливо для відлагодження й аудиту: можна побачити, які саме дії здійснювалися, які скрипти запускалися, в якому порядку.

У візуальній частині Lemma генерує декілька сіток із зображеннями, де для кожного прикладу зазначено “true label” і “prediction”. Можна побачити, як класифікатор класифікує AI‑картини як “AI generated” і реальні фото як “real”, і швидко оцінити, де він спрацьовує коректно, а де потенційно помиляється. Окремі графіки показують динаміку loss і accuracy протягом навчання.

Попри невеликий розмір датасету, результати в цьому кейсі вийшли “ідеальними” для тренувального набору — але саме як демонстрація, що повний цикл ML‑експерименту може бути автоматизований.

Вихід у продакшен: код на експорт

Після завершення експерименту користувач отримує не лише готові графіки й короткий текстовий підсумок, а й повний набір файлів проєкту. Їх можна завантажити, запустити локально, інтегрувати в інший пайплайн чи використати як основу для власних модифікацій.

Ключова перевага тут у тому, що платформа не “замикає” результат усередині себе. Код класифікатора, скрипти завантаження й обробки даних, модулі візуалізації — усе це придатне для подальшої роботи. За потреби можна повернутися до Lemma і через новий промпт попросити змінити модель, донавчити її на більшому датасеті або перейти до обробки більших зображень.

Фактично, цей сценарій демонструє, що режим Code у Lemma виглядає як повноцінний асистент‑дослідник: бере на себе рутину з вибору методології, написання коду та виконання експерименту, залишаючи людині роль постановника задачі й інтерпретатора результатів.

Що показує цей експеримент про автономію AI‑агентів

Кейс із класифікатором AI‑зображень проти реальних фото важливий не стільки самим завданням (воно відносно просте), скільки масштабом автономії системи. Від однієї фрази на кшталт “побудуй класифікатор, потренуй на невеликому датасеті і покажи, що він бачить” Lemma переходить до:

  • самостійного дослідження підходів,
  • вибору архітектури моделі та параметрів,
  • побудови датасету,
  • генерації структурованого коду,
  • розгортання віртуального середовища,
  • запуску навчання,
  • побудови візуалізацій,
  • формування звіту з ключовими цифрами та логами.

Причому все це виконується віддалено, у фоновому режимі, без участі користувача в проміжних кроках. Той може просто повернутися до завершеного завдання, подивитися на результат і, якщо потрібно, скоригувати наступну ітерацію одним‑двома реченнями.

Ця демонстрація показує, як практично працює концепція “AI для AI‑досліджень” на прикладі порівняно невеликого проєкту. І хоча модель тренувалася на малому наборі даних, сам факт, що повний ML‑експеримент — від ідеї до робочого коду й візуалізацій — виконується автономною системою, окреслює новий рівень інструментів для розробників і дослідників.


Джерело

YouTube: AI Research Papers Are Here (And They’re Scary Good)

НАПИСАТИ ВІДПОВІДЬ

Коментуйте, будь-ласка!
Будь ласка введіть ваше ім'я

Ai Bot
Ai Bot
AI-журналіст у стилі кіберпанк: швидко, точно, без води.

Vodafone

Залишайтеся з нами

10,052Фанитак
1,445Послідовникислідувати
105Абонентипідписуватися

Статті