Розробник і ютубер Tech With Tim у великому гіді показує, як зібрати повністю локальний стек для AI‑кодингу: мовні моделі в LM Studio, редактор Visual Studio Code і жодних хмарних API. Одна з ключових частин цієї схеми — підключення локальної моделі як повноцінного агента у вбудований VS Code Chat через custom endpoint, з підтримкою tool use і детальними логами в LM Studio.

Йдеться не про ще одне розширення, а про використання нової офіційної функції VS Code для керування мовними моделями, яка працює офлайн і без акаунта. У поєднанні з LM Studio це перетворює звичайний редактор на повноцінний agentic‑код‑середовище, яке живе виключно на вашому комп’ютері.
Нова функція VS Code: локальні моделі без акаунта і інтернету
Оновлені версії VS Code отримали вбудований менеджер мовних моделей. У ньому з’явився окремий пункт, який дозволяє додавати власні AI‑движки — зокрема, ті, що працюють локально.
У VS Code це заховано в Command Palette. Потрібно відкрити будь‑яку теку як проєкт, а далі викликати палету клавішами. На Windows це комбінація Ctrl+Shift+P, на macOS — Command+Shift+P. У пошуку команд достатньо ввести «manage», і з’явиться пункт «Manage Language Models».
Саме там можна під’єднати локальний inference‑сервер як повноцінне джерело відповідей для вбудованого чату. За задумом Microsoft, ця функція має працювати «без логіну і без інтернету», якщо джерелом моделі є локальний сервер на кшталт LM Studio. Жодних токенів до великих хмарних API тут не потрібно — лише локальна мережна адреса.
LM Studio як локальний сервер для VS Code Chat
LM Studio в цій зв’язці грає роль не тільки менеджера моделей, а й API‑сервера. У застосунку є окрема вкладка Developer, де вмикається локальний HTTP‑сервер і завантажуються моделі, якими потім може користуватися VS Code.
Спочатку потрібно запустити сервер у Developer‑вікні LM Studio. Після цього туди ж додаються потрібні моделі: одна — основна «велика» для чату, редагування й agentic‑режимів, інша — менша і швидша для автодоповнення. Завантажені моделі з’являються у списку й готові приймати запити через API.
URL до цього API — це локальний сервер, який запускається саме у Developer‑вікні. Цю адресу LM Studio показує безпосередньо в інтерфейсі, а в конфігурації VS Code її треба просто вставити у поле URL для custom endpoint. Таким чином редактор «бачить» локальний сервер як звичайний chat completions API й починає працювати з ним так само, як із будь‑яким хмарним постачальником.
Конфігурація custom endpoint у VS Code: три поля, які мають значення
Коли в VS Code у вікні Manage Language Models обирається варіант «Add Models», далі пропонується кілька джерел. Щоб під’єднати LM Studio, обирається «Custom endpoint». Після цього VS Code просить вказати базову інформацію.
Назву endpoint можна задати довільно — наприклад, «LM Studio». Поле API‑key VS Code вимагає формально, але в локальному сценарії воно не використовується, тож достатньо ввести будь‑який рядок. Головне — вибрати тип «chat completions», щоби конфігурація відповідала інтерфейсу LM Studio.
У цей момент редактор відкриває JSON‑конфіг, де потрібно заповнити лише три параметри: ID, name і URL. URL — це якраз адреса локального сервера LM Studio. Її або копіюють із Developer‑вікна, або вводять у тому ж форматі, який показує сам застосунок.
З ID ще простіше: в LM Studio біля кожної моделі є кнопка копіювання ідентифікатора. Достатньо натиснути цю кнопку, а потім вставити значення одночасно в поля ID та name у VS Code config. У результаті редактор чітко знає, яку саме модель з LM Studio потрібно викликати, і відображає її в інтерфейсі під зрозумілою назвою.
У тій же конфігурації можна вказати, чи вміє модель викликати інструменти (tool calling) і працювати із зображеннями (vision). Для моделей на кшталт Gwen 3.6 у прикладі vision залишили увімкненим, а підтримку tool calling — активною, що критично для agentic‑сценаріїв. Максимальну кількість вхідних токенів логічно синхронізувати з тим контекстом, який показує LM Studio для цієї моделі, а вихідних — збільшити до великого значення, аби не обривати довгі відповіді.
Після збереження JSON‑файлу зміни застосовуються миттєво. Для зручності вікно конфігурації можна викликати знову з Manage Language Models, натиснувши на кнопку відкриття language models JSON — так простіше додавати кілька моделей поспіль, наприклад окремо чат‑модель і окремо модель для автодоповнення.
Як VS Code бачить локальні моделі: «Other models» і вибір Gwen
Коли конфігурація збережена, час перевірити, чи бачить VS Code нову локальну модель. Для цього відкривається вбудований чат редактора. Його можна викликати по‑різному: через гарячі клавіші, через меню View або через пункт Chat у налаштуваннях вигляду. Головне — дістатися до вікна, де відображається діалог і селектор моделі.
У випадаючому списку моделей з’являється розділ «Other models». Саме там і відображаються всі custom endpoints, додані через Manage Language Models. Якщо все зроблено правильно, у списку з’являється, наприклад, «Gwen 3.6 35B A3B» — це саме та модель, ID якої було скопійовано з LM Studio.
Після вибору цієї моделі будь‑який запит у чаті піде не в хмару, а на локальний сервер LM Studio. VS Code при цьому поводиться так само, як із власними інтегрованими моделями: можна просити створити застосунок, переписати файл, згенерувати структуру проєкту тощо. Різниця в тому, що всі обчислення виконує ваша відеокарта чи CPU, а мережний трафік залишається в межах локального хоста.
Developer logs у LM Studio: повний контроль над запитами
Одна з переваг такої інтеграції — прозорість. Коли VS Code надсилає запити до моделі, LM Studio фіксує все це у вкладці developer logs. У ній видно кожен звернений prompt, усі відповіді, службову інформацію та помилки.
У логах відображається, як саме VS Code формує запит, який режим використовує, які параметри температури чи довжини відповіді передаються. Там же в реальному часі показується швидкість генерації в токенах за секунду. У прикладі модель видавала десятки й понад сотню токенів за секунду, що робило роботу в чаті цілком комфортною навіть для довших відповідей.
Якщо щось іде не так — наприклад, модель не встигає завантажитися, бракує пам’яті чи endpoint налаштований некоректно — помилки також потрапляють до developer logs. Це спрощує налагодження локальної конфігурації: замість сліпо шукати, чому VS Code «мовчить», можна подивитися, що саме отримує й повертає LM Studio.
Agentic‑кодинг у VS Code: режими, файли й локальний інтелект
Після підключення локальної моделі через custom endpoint вбудований VS Code Chat перетворюється на повноцінне агентне середовище, але без жодної хмарної залежності. Редактор дає змогу перемикати режими: «ask», «agent», «plan» та інші. Це не просто зміна тону відповідей, а різні поведінкові профілі, де агент може планувати кроки, вносити правки у файли, генерувати нові й працювати поетапно.
У такій конфігурації AI отримує доступ до файлової системи проєкту через інструменти VS Code, а модель із підтримкою tool use може викликати ці інструменти для створення, редагування й рефакторингу файлів. Користувач може тегати окремі файли, фокусуючи агента на конкретних ділянках коду, й очікувати, що всі операції будуть виконані локально — від аналізу до запису на диск.
На практиці це означає, що VS Code із підключеним LM Studio поводиться як будь‑який сучасний agentic‑код‑редактор: приймає завдання високого рівня, планує зміни, вносить правки в декілька файлів, генерує нові модулі. Різниця лише в тому, що обчислення відбуваються на вашому залізі, без вартості за токен і без необхідності розкривати вихідний код зовнішнім сервісам.
Висновок: локальний агент як реальна альтернатива хмарі
Завдяки поєднанню нової функції VS Code для керування мовними моделями та локального API‑сервера в LM Studio стало можливим підняти повноцінного AI‑агента для кодування повністю офлайн. Налаштування зводиться до кількох кроків: запуск developer‑сервера в LM Studio, копіювання URL і ID моделі, заповнення полів ID, name і URL у JSON‑конфігу VS Code та вибір моделі в розділі «Other models» у вбудованому чаті.
Результат — agentic‑код‑workflow, де можна ставити великі завдання, перемикати режими «ask», «agent», «plan», тегати файли, бачити всі запити й відповіді в developer logs LM Studio й водночас повністю контролювати свій стек. Для тих, хто готовий інвестувати трохи часу в налаштування, це відкриває шлях до AI‑асистента, який працює прямо в редакторі — без логіну, без інтернету і без рахунків за API.


