Неділя, 19 Січня, 2025

Майбутнє програмування на основі штучного інтелекту вже близько

Технічні компанії, включно з OpenAI, розробляють нове покоління помічників штучного інтелекту, які можуть не лише писати код, але й дебажити, упорядковувати та критикувати його. Перші користувачі таких помічників розповідають свої історії. Наприклад, як вдалося налагодити та виправити складну проблему, пов’язану з неправильно названим файлом у різних сховищах коду на сайті GitHub, де розміщено програмне забезпечення.

Штучний інтелект (ШІ) занурився у проблему на GitHub, проходив код і розмірковував про те, що може бути не так. Він правильно визначив, що основною причиною помилки був рядок, який вказував на неправильне розташування файлу, потім переміщався по проекту, знайшов файл і вніс зміни в код, щоб усе працювало належним чином. Це те, що недосвідчений розробник може витратити години, намагаючись налагодити.

Багато програмістів уже використовують штучний інтелект, щоб швидше писати програмне забезпечення. GitHub Copilot був першим інтегрованим середовищем розробника, яке використовувало ШІ (AI) , але багато IDE тепер автоматично завершуватимуть фрагменти коду, коли розробник починає вводити текст. Ви також можете поставити штучному інтелекту запитання щодо коду або попросити його запропонувати, як покращити те, над чим ви працюєте.

Минулого літа Джон Янг і Карлос Хіменес, два аспіранти Прінстонського університету, почали обговорювати, що потрібно для того, щоб ШІ став інженером-програмістом у реальному світі. Це спонукало їх та інших співробітників Прінстона до розробки SWE-bench , набору тестів для тестування інструментів штучного інтелекту в ряді завдань програмування. Після випуску тесту в жовтні команда розробила власний інструмент — SWE-агент — для виконання цих завдань.

SWE-agent («SWE» — скорочення від «software engineering», програміст) — це одна з низки значно потужніших програм кодування штучного інтелекту, які виходять за рамки простого написання рядків коду та діють як так звані програмні агенти, використовуючи інструменти, необхідні для суперечок, налагоджувати та впорядковувати програмне забезпечення. Стартап Devin став вірусним із демонстрацією відео одного з таких інструментів у березні.

Офір Прес, член Прінстонської команди, каже, що SWE-bench може допомогти OpenAI перевірити продуктивність і надійність програмних агентів. «Це лише моя думка, але я думаю, що вони дуже скоро випустять програмного агента», — каже Прес.

OpenAI відмовився від коментарів, але інше джерело, обізнане з діяльністю компанії, яке побажало не називати його імені, повідомило виданню WIRED, що «OpenAI точно працює над агентами кодування».

Подібно до того, як GitHub Copilot показав, що великі мовні моделі можуть писати код і підвищувати продуктивність програмістів, такі інструменти, як SWE-agent, можуть довести, що агенти ШІ можуть працювати надійно, починаючи зі створення та підтримки коду.

Ряд компаній є агентами тестування для розробки програмного забезпечення. У верхній частині таблиці лідерів SWE-bench, яка вимірює оцінку різних агентів кодування для різноманітних завдань, знаходиться один від Factory AI, стартапу, за яким іде AutoCodeRover, запис із відкритим кодом від команди Національного університету Сінгапуру.

Великі гравці також вступають у справу. Інструмент для написання програмного забезпечення під назвою Amazon Q є ще одним виконавцем у SWE-bench. «Розробка програмного забезпечення — це набагато більше, ніж просто набір тексту», — каже Діпак Сінгх, віце-президент із розробки програмного забезпечення Amazon Web Services.

Він додає, що AWS використовувала агент для перекладу цілих стеків програмного забезпечення з однієї мови програмування на іншу. «Це ніби справді розумний програміст сидить поруч з вами, пише та створює програму разом з вами, — каже Сінгх. – Я думаю, що це досить трансформаційно».

Команда OpenAI нещодавно допомогла команді Прінстона вдосконалити еталон для вимірювання надійності та ефективності таких інструментів, як SWE-agent, припускаючи, що компанія також може вдосконалювати агентів для написання коду або виконання інших завдань на комп’ютері.

Сінгх каже, що кілька клієнтів уже створюють складні серверні додатки за допомогою Q.

Експерименти з SWE-bench показують, що будь-хто, хто займається програмуванням, незабаром захоче використовувати агентів, щоб покращити свою майстерність програмування, або ризикує залишитися позаду.

За матеріалами: Wired

НАПИСАТИ ВІДПОВІДЬ

Коментуйте, будь-ласка!
Будь ласка введіть ваше ім'я

Євген
Євген
Євген пише для TechToday з 2012 року. Інженер за освітою. Захоплюється реставрацією старих автомобілів.

Vodafone

Залишайтеся з нами

10,052Фанитак
1,445Послідовникислідувати
105Абонентипідписуватися