Середа, 1 Липня, 2026
Додому Блог

Blue Origin досі не знає причини вибуху New Glenn

0

Космічна компанія Джеффа Безоса Blue Origin налаштована повторно використати свою надважку ракету New Glenn вже цього року після минуломісячного вибуху. Водночас компанія досі не знає, чому саме стався цей інцидент.

Blue Origin досі не знає причини вибуху New Glenn

У своїй найдетальнішій на сьогодні публічній заяві щодо вибуху гендиректор Blue Origin Дейв Лімп написав на сайті компанії у вівторок, що команда все ще намагається «визначити та усунути першопричину» аварії. «Попередній аналіз вказує на кормову частину першого ступеня ракети», — зазначив Лімп, додавши, що компанія використовує «великі масиви даних із численних камер та датчиків».

Після більш ніж десятирічної повільної та виваженої розробки New Glenn, останнім часом Blue Origin значно прискорила роботи над новою ракетою. Її перший запуск відбувся у січні 2025 року, а New Glenn готували до четвертого польоту, коли вона вибухнула під час випробувань 28 травня цього року. Внаслідок вибуху ніхто не постраждав.

Blue Origin прагне якнайшвидше повернути ракету до польотів, адже компанія стала одним із ключових гравців у програмі NASA з повернення людей на Місяць до завершення каденції президента Трампа.

Щоб це стало можливим, Blue Origin потрібно не лише з’ясувати та усунути причину минуломісячного вибуху, а й відновити свій стартовий майданчик у Кейп-Канаверал, штат Флорида. Наразі це єдиний майданчик компанії, здатний підтримувати запуски масивної ракети.

У своєму дописі Лімп похвалив співробітників Blue Origin за швидкий прогрес у відновлювальних роботах.

Під час вибуху компанія втратила блискавковідвідну вежу, а також велику установку, яка транспортує New Glenn до стартового майданчика та ставить її у вертикальне положення (так званий транспортер-еректор). Вибухом були пошкоджені й навколишні будівлі на об’єкті. Водночас Лімп написав, що «нам і пощастило в багатьох аспектах, і ми маємо максимально цим скористатися».

Серед таких «щасливих випадків» — те, що розташована на майданчику водонапірна вежа, газові резервуари та будівля інтеграції ракет перебувають «у доброму стані».

Лімп також поділився подробицями щодо того, як Blue Origin змінить свій поточний стартовий комплекс у Кейп-Канаверал. Компанія відмовляється від концепції транспортер-еректора і натомість використовуватиме гігантський кран, щоб підіймати New Glenn на стартовому майданчику перед польотом.

За словами Лімпа, це рішення не лише дасть можливість повернутися до запусків раніше, ніж очікувалося, але й дозволить збільшити частоту польотів New Glenn. До вибуху в травні Blue Origin планувала здійснити цього року до 12 запусків.

Джерело

TechCrunch

Anthropic запускає Claude Science для науковців

0

Anthropic у вівторок представила Claude Science — робоче середовище з ШІ, яке дає науковцям єдину платформу для проведення обчислювальних досліджень, позбавляючи потреби постійно перемикатися між базами даних, пайплайнами та інструментами.

Anthropic запускає Claude Science для науковців

Компанія одразу уточнює: Claude Science — це «не нова модель ШІ й не більш потужна модель для біології. Вона працює на тих самих моделях Claude, які вже доступні всім сьогодні (зокрема Claude Opus 4.8), без жодного спеціального доступу чи обмежень».

Нове середовище базується на запуску Claude for Life Sciences, який відбувся в жовтні 2025 року. Тоді Anthropic розширила можливості чат-бота Claude для задач у сфері наук про життя. Claude Science — це вже окремий майданчик для такої роботи.

Запуск, оголошений у вівторок на брифінгу AI for Science, вписується у ширшу стратегію Anthropic бути не лише постачальником моделей, а й контролювати операційний шар для окремих індустрій — подібно до того, як Claude Code став операційним шаром для розробки ПЗ. Anthropic дедалі більше робить ставку на вертикальні продукти, орієнтовані на робочі процеси, а не лише на «сиру» потужність моделей (що може вплинути на конкуренцію й ціноутворення порівняно з іншими гравцями).

Як це працює: головний ШІ-асистент виступає своєрідним менеджером проєкту для науковців. Він підключається до більш ніж 60 наукових баз даних і має готові набори інструментів для конкретних галузей, як-от геноміка, структура білків і хімія. Цей асистент може створювати субасистентів, щоб розподілити роботу, як керівник проєкту, що делегує задачі фахівцям, або передавати роботу спеціальному «експертному» асистенту, якого користувач сам налаштував під свої дослідження. Окремий ШІ для фактчекінгу перевіряє цитати та розрахунки перед тим, як матеріали підуть у публікацію.

Етап перевірки фактів важливий, адже зі зростанням обсягу текстів, створених за допомогою ШІ, у наукові роботи дедалі частіше прослизають вигадані посилання й неперевірена статистика. Водночас це все ще та сама базова модель, яка перевіряє сама себе, а не незалежне джерело істини.

Anthropic стверджує, що Claude Science має й інші механізми забезпечення відтворюваності результатів. Наприклад, середовище може генерувати фігури — такі як 3D-структури білків і хімічні схеми — разом із кодом, що їх створив. Кожна фігура містить «точний код і середовище, у якому вона була згенерована, опис простою мовою того, як її створено, а також повну історію повідомлень», зазначає компанія. Це не лише підвищує прозорість, а й економить час, адже науковці можуть редагувати фігури звичайними текстовими запитами, змушуючи агента змінювати власний код.

Ще один спосіб заощадити час — можливість запускати Claude Science на власній інфраструктурі лабораторії, без відправлення даних на сервери Anthropic.

Перші користувачі вже застосовують інструмент у роботі. Нейробіолог Інституту Аллена Жером Леко (Jérôme Lecoq) використав Claude Science для побудови мультиагентного пайплайна рецензування обчислювальних досліджень. Група Стівена Френсіса в Центрі дослідження пухлин мозку UCSF застосувала Claude Science для прискорення комплексного аналізу зародкових мутацій при гліомі до невеликої частки попереднього часу, причому результати були незалежно валідувані.

Запуск Claude Science відбувається через кілька місяців після того, як OpenAI підійшла до тієї ж проблеми з іншого боку. У квітні OpenAI представила GPT-Rosalind — спеціалізовану модель, оптимізовану для біологічного міркування.

Різниця між підходами не лише в тому, чи потрібна спеціалізована модель, а й у тому, хто і як швидко отримує доступ. Rosalind вийшла як дослідницький прев’ю, обмежений кваліфікованими корпоративними клієнтами у США, із попередньою кваліфікацією та перевіркою безпеки. Першими доступ одержали такі партнери, як Amgen, Allen Institute, Moderna, Thermo Fisher та Novo Nordisk.

Окремо стоїть Google DeepMind, яка грає в іншу гру. DeepMind володіє фундаментальними науковими моделями AlphaFold і AlphaGenome, до яких інші компанії можуть звертатися лише як до інструментів. Платформа Gemini for Science поєднує ці моделі й понад 30 баз даних у сфері наук про життя в єдиному наборі можливостей.

У підсумку на один і той самий ринок наукових досліджень зараз претендують три дуже різні стратегії дистрибуції: Anthropic робить ставку на широкий доступ за підпискою, OpenAI дотримується вузького, корпоративного й обмеженого доступу, а Google спирається на власні пропрієтарні моделі, яких більше ні в кого немає. Те, як це розгорнеться, може стати раннім індикатором того, як постачальники ШІ конкуруватимуть в інших спеціалізованих вертикалях — таких як право, фінанси та інженерія.

Claude Science доступний у бета-версії всім користувачам тарифів Pro, Max, Team та Enterprise. Anthropic також згадала Novo Nordisk і Allen Institute як приклади клієнтів, що свідчить: фармкомпанії вже співпрацюють відразу з кількома постачальниками ШІ.

Anthropic також профінансує до 50 проєктів із Claude Science, надавши до 30 000 доларів у вигляді кредитів: «Ми шукаємо проєкти постдокторантів і аспірантів, які охоплюють різні домени та досліджують межі науки, з початковим фокусом на напрямах біомедичних досліджень. Подання заявок відкрите до 15 липня 2026 року, про результати відбору повідомлять до 31 липня. Проєкти триватимуть з 1 вересня до 1 грудня 2026 року».

Джерело

TechCrunch

Threads розширює Live Chats і додає нові функції

0

Meta оновлює свій сервіс Threads, розширюючи можливості нещодавно запущеної функції Live Chats і відкриваючи до неї доступ більшій кількості користувачів. Компанія повідомила у вівторок, що додає підтримку перекладів, нові інструменти для ведучих чатів та інші покращення.

Threads розширює Live Chats і додає нові функції

Завдяки підтримці перекладів розмови у чатах стають доступнішими для користувачів з різних країн. Threads також розширює можливість запускати Live Chats для всіх так званих Community Champions — це користувачі, які мають велику аудиторію у своїх спільнотах, регулярно публікують у них контент та підтримують активність обговорень.

Ведучі тепер можуть запрошувати до трьох співведучих у свій Live Chat, щоб легше модерувати та керувати розмовою. У Threads кажуть, що ця можливість схожа на запрошення гостя у власне шоу або додаткового модератора дискусії. Крім того, ведучі тепер можуть видаляти повідомлення для всіх учасників чату, а платформа тестує способи зробити повідомлення від ведучих більш помітними в інтерфейсі.

Коли Threads тільки запустився, сервісу було складно конкурувати з X як майданчику для розмов у реальному часі, оскільки йому бракувало важливих функцій на кшталт повноцінного пошуку, хештегів та хронологічної стрічки. Відтоді Threads додав ці можливості й тепер намагається додатково відрізнитися за рахунок Live Chats — функції для залучення в реальному часі, якої навіть X не має.

Ідея Live Chats полягає в тому, щоб зробити Threads більш оперативною та актуальною платформою. З моменту запуску цієї функції в Threads, за даними компанії, щодня проводяться сотні чатів, до яких приєднуються тисячі користувачів. Нові можливості, представлені сьогодні, — це відповідь на запити від креаторів, зазначають у Threads.

У Live Chats користувачі можуть надсилати текстові повідомлення, фото, відео, посилання та реагувати емодзі. До 150 учасників можуть активно писати у чаті. Коли ліміт досягається, інші користувачі все одно можуть переглядати розмову, реагувати на повідомлення та брати участь в опитуваннях у «режимі глядача».

Threads також анонсувала, що незабаром з’явиться підтримка десктоп-версії, а також функція закріплених повідомлень — обидві можливості креатори давно просять додати.

Джерело

TechCrunch

Acti вбудовує AI-агентів прямо в клавіатуру смартфона

0

Сінгапурський стартап Acti хоче принести штучний інтелект у програму, якою ви користуєтесь чи не найчастіше, — клавіатуру смартфона.

Acti вбудовує AI-агентів прямо в клавіатуру смартфона

У вівторок компанія запустила агентну клавіатуру для iOS та Android. Вона не лише підказує наступне слово, а й уміє виконувати дії від вашого імені, вбудовуючи AI-інструменти безпосередньо в уже звичні застосунки — пошту, месенджери, соцмережі тощо.

За словами засновника та CEO Acti Янга Вана (Young Wang, назва розшифровується як «action»), це вирішує знайому всім проблему постійного перемикання між додатками, коли потрібна допомога ШІ.

«Сьогоднішні AI-агенти фундаментально обмежені, тому що контекст користувача залишається роздробленим між різними застосунками», — пояснив Ван у листуванні з TechCrunch. Acti «працює поверх усіх них, тому ми можемо будувати контекстний шар, який справді належить користувачеві, а не платформі», — каже він. «На цьому фундаменті буде побудована вся ера AI-агентів».

Запуск відображає інший підхід до того, як користувачі врешті прийматимуть ШІ. Замість того, щоб просити людей відкривати окремі AI-чатботи, Acti демонструє, як штучний інтелект можна вбудувати безпосередньо в інтерфейси, якими ми вже користуємося.

Наприклад, якщо друг просить поради, де поруч можна поїсти, Acti може одразу підкинути локальну рекомендацію просто в чат. Або якщо у розмові хтось згадає акцію певної компанії, Acti дасть актуальну ціну цієї акції прямо у переписці. Сьогодні для цього зазвичай доводиться переходити в пошуковик чи інший AI-додаток, шукати інформацію, а потім повертатися до початкового застосунку, що забирає час.

У «начинці» Acti працює на базі моделей Gemini від Google. За словами Вана, їх обрали через баланс інтелектуальних можливостей, швидкості, надійності, багатомовності та вартості. Gemini також добре підходить для однієї з ключових функцій Acti — Skills («Навички»). Вони працюють як кастомні шорткати: користувач може «повісити» на одну клавішу багатокрокове завдання — наприклад, переклад повідомлення чи миттєву відправку посилання на зустріч.

Важливий момент: Acti побудований за принципом local-first, тобто особистий контекст користувача за замовчуванням зберігається на пристрої для захисту приватності. Компанія стверджує, що додаток не має доступу до приватних повідомлень, розмов чи персонального контексту й не зберігає їх, якщо тільки користувач прямо не ввімкне функцію, яка потребує зовнішньої обробки.

Ван каже, що на ідею створити нову клавіатуру для епохи ШІ його підштовхнув попередній десятирічний досвід у Baidu, де він розвивав Facemoji Keyboard до понад 300 млн активних користувачів на день.

«Коли з’явилися LLM, я зрозумів, що сталося щось фундаментальне, — каже він. — Текст перестав бути просто тим, що люди набирають; він перетворився на носій намірів. І в багатьох повсякденних контекстах ці наміри тепер можуть безпосередньо перетворюватися на дії».

«Це змусило мене повірити, що настав час переосмислити один із найбазовіших і найуніверсальніших продуктів, яким люди користуються щодня, — клавіатуру. Для мене можливість перебудувати таку фундаментальну поверхню для ери ШІ — неймовірно захоплива», — додає він.

Бізнес-модель Acti ще формується. Команда планує заробляти на підписках, які надаватимуть доступ до потужніших AI-моделей, вищих денних лімітів використання та інших преміум-функцій.

Додаток уже постачається з кількома вбудованими Skills. Наприклад, «T» дозволяє перекладати повідомлення іншою мовою — для цього достатньо зробити довге натискання на цю літеру на клавіатурі. Інша навичка, «C», автоматично надсилає посилання на зустріч.

Як підкреслюють в Acti, вміти програмувати для створення Skills не потрібно. Достатньо описати бажану дію звичайною мовою — і Acti згенерує її. До публічного запуску ранні тестувальники створили понад 1000 навичок менш ніж за два тижні.

Ці Skills можуть бути приватними — лише для власника, або ж загальнодоступними в маркетплейсі Skills Marketplace. Там можна знайти вже готові рішення, наприклад, для доступу до даних Чемпіонату світу в реальному часі чи посилань Polymarket та інші. У майбутньому цей Skill Hub може стати ще й додатковим каналом монетизації.

Компанія також ексклюзивно повідомила TechCrunch, що щойно залучила $5,3 млн посівних інвестицій у раунді на чолі з BITKRAFT Ventures.

«Ми підтримали Acti, тому що в цієї команди є реальний шанс задати тон наступній фазі взаємодії людини й комп’ютера», — прокоментував вкладення партнер BITKRAFT Ventures Джонатан Хуан.

До команди Acti входить CTO Майк Сан, який був першим технічним лідером Yike Album — хмарного фотосервісу Baidu, що зріс до понад 10 млн активних користувачів на день. CSO компанії — Джунбо Ян, який перейшов із HashKey Capital, де очолював десятки інвестицій у споживчі сервіси.

Джерело

TechCrunch

Anthropic представила Claude Sonnet 5 для дешевших агентів

0

У той час як агентні можливості стають стандартом для компаній, що розробляють великі мовні моделі, Anthropic випускає Claude Sonnet 5 — потужнішу та більш «агентну» версію свого середнього за розміром моделя.

Anthropic представила Claude Sonnet 5 для дешевших агентів

«Він може складати плани, користуватися інструментами на кшталт браузерів і терміналів та працювати автономно на рівні, який ще кілька місяців тому вимагав більших і дорожчих моделей», — заявили в Anthropic у блозі.

Такий підхід віддзеркалює те, що про свої останні релізи говорять OpenAI та Google. Минулого тижня у превʼю вийшов OpenAI GPT-5.6 Sol — найагентніша модель компанії на сьогодні, що дозволяє розподіляти роботу між субагентами для довгих автономних завдань. Google у травні запустила Gemini 3.5 Flash і позиціонувала її як перехід від розмовного чат-бота до агентного інструмента, який планує, створює та ітерує реальні задачі з мінімальним втручанням людини.

Запуск Sonnet 5 підтверджує, що агентні можливості стали новою базовою вимогою в усіх цінових сегментах. Тепер головна різниця буде не в тому, хто краще виконує агентну роботу, а в тому, хто робить це дешевше й надійніше без нагляду людини.

Sonnet 5 обіцяє продуктивність, близьку до Opus 4.8, але за значно нижчою ціною. Починаючи з вівторка, Claude Sonnet 5 стає моделлю за замовчуванням для безкоштовних та Pro-тарифів і доступний у всіх підписках.

На старті Sonnet 5 коштує $2 за мільйон вхідних токенів і $10 за мільйон вихідних токенів до 31 серпня. Після цього ціна зросте до $3 за мільйон вхідних токенів і $15 за мільйон вихідних токенів. Це робить Sonnet 5 дешевшим за Opus 4.8, а також за GPT-5.5 від OpenAI і Gemini 3.1 Pro від Google (хоча все ще дорожчим за Gemini 3.5 Flash).

За даними Anthropic, нова модель демонструє помітні покращення порівняно з попередником Sonnet 4.6, випущеним у лютому, у сфері агентних завдань — міркування, використання інструментів, програмування та офісної/аналітичної роботи.

Наприклад, в одному з бенчмарків Sonnet 5 набирає 63,2% в агентному кодуванні проти 69,2% у Opus 4.8 і 58,1% у Sonnet 4.6. У бенчмарку «знаннєвої» роботи Sonnet 5 навіть дещо випереджає Opus 4.8, який відомий вмінням розвʼязувати найскладніші задачі — від тонких оціночних суджень до глибинних досліджень.

«Opus 4.8 все ще є моделлю вибору для вищої точності в цих завданнях, але Sonnet 5 дає розробникам бюджетніші опції значно вищої якості, ніж були доступні раніше», — зазначають в Anthropic. «Між Sonnet 5 та Opus 4.8 користувачі можуть налаштовувати рівень зусиль, знаходячи потрібний баланс між вартістю та продуктивністю».

За словами тестувальників, на яких посилається блог, Sonnet 5 також краще завершує складні завдання, на яких попередні моделі зупинялися раніше, і «перевіряє власний результат, навіть якщо її про це прямо не просили».

«Ми доручили Claude Sonnet 5 двоетапне завдання — оновити рівні акаунтів у Salesforce і надіслати оголошення про запуск корпоративним контактам — і вона виконала його від початку до кінця», — сказав у заяві старший інженер Zapier Деніел Шепард. «Раніше процес зупинявся десь посередині. Для щоденної автоматизації це беззаперечний вибір».

У сфері безпеки Sonnet 5 також демонструє нижчий рівень «небажаної поведінки», такої як співпраця у зловживаннях і дезінформації, ніж її попередниця, що робить модель безпечнішою для агентних сценаріїв. Вона краще відхиляє шкідливі запити та уникає захоплення підказок у prompt-injection-атаках. Також Sonnet 5 рідше галюцинує й виявляє підлабузницьку поведінку порівняно з Sonnet 4.6.

Водночас за рівнем протидії «розбалансованій» поведінці Sonnet 5 все ще поступається Opus 4.8 та попередній версії Claude Mythos Preview. «Оцінки також показують, що ця модель має значно нижчу здатність виконувати небезпечні кібербезпекові завдання, ніж наші поточні моделі Opus», — йдеться в блозі.

Співзасновник сервісу Lovable Фабіан Хедін заявив, що Claude Sonnet 5 «послідовно й чітко відхиляє небезпечні запити».

«У Lovable ми даємо потужні інструменти в руки мільйонів розробників, — сказав Хедін. — Модель, яка знає, коли сказати „ні“, настільки ж важлива, як і та, що знає, як будувати».

Оновлено: уточнено, що ціна вихідних токенів становитиме $15 за мільйон після 31 серпня.

Джерело

TechCrunch

Etched оцінено у $5 млрд, замовлення на чипи — $1 млрд

0

Стартап Etched, який розробляє AI-чипи й конкурує з Nvidia, оприлюднив прогрес-репорт після того, як TSMC на початку року успішно виготовила його перший чип. Компанія заявляє, що вже забронювала контрактні замовлення на $1 млрд на свій продукт — повні системи на базі цих чипів.

Etched оцінено у $5 млрд, замовлення на чипи — $1 млрд

Наразі Etched тестує цей перший продукт разом із клієнтами. У компанії називають ці системи «frontier inference clusters» — комплекти, що включають чипи, спеціально спроєктовані стійки та програмне забезпечення. Усе це створено для того, щоб передові AI-моделі могли виконувати інференс швидше, дешевше й енергоефективніше, ніж у конкурентів, стверджують в Etched. (Інференс — це процес, який відбувається після того, як користувач надсилає запит; зараз це найбільше «вузьке місце» та ключова стаття витрат для AI-компаній, що намагаються працювати у великому масштабі, саме тому інвестори уважно стежать за тими, хто обіцяє це вирішити.)

Etched, заснована у 2022 році, також повідомила, що загалом залучила вже $800 млн інвестицій. Останній раунд на $500 млн був закритий у грудні без публічного анонсу за пост-мані оцінкою $5 млрд, кажуть у компанії.

Стартап привернув увагу помітних інвесторів, серед яких VentureTech Alliance, Jane Street, Hudson River Trading, Two Sigma, Ribbit Capital та Stripes, що очолив раунд на $500 млн. Також Etched отримала ангельські інвестиції від зірок AI-галузі — Андрея Карпатого, Джеффрі Хінтона, Фей-Фей Лі, Артюра Менша та Скотта Ву. У списку інвесторів фігурують також мільярдери Стенлі Драккенміллер і Пітер Тіль.

Попри те, що у пресрелізі вівторкове оголошення подано як «вихід Etched зі стелсу», співзасновники — CEO Гевін Уберті (на фото вище) та президент Роберт Вахен — спілкуються з TechCrunch про свої плани щодо чипів ще з 2024 року. Обоє залишили Гарвард і стали стипендіатами програми Thiel Fellowship, щоб заснувати Etched, як раніше розповідав Уберті TechCrunch.

Станом на 2024 рік Etched уже була в полі зору інвесторів, зібравши понад $125 млн. Але у подкасті Патріка О’Шонессі «Invest Like the Best» засновники згадували, що ще у 2023 році їм було важко зацікавити інвесторів — навіть попри 30-сторінковий меморандум, у якому вони доводили, що AI-застосуванням зрештою знадобляться спеціалізовані чипи, а не лише універсальні GPU. Усі великі інвестори, до яких вони зверталися, відмовили. За повідомленнями, у ті перші місяці компанія працювала «з місяця в місяць» і була близькою до вичерпання коштів.

Джерело

TechCrunch

Від смартфона до продакшена: як Codex розгортає сайт на GitHub і Vercel без рядка коду

0

У новому великому гайді від освітнього проєкту Futurepedia розбирають Codex від OpenAI — настільного агента на базі ChatGPT, який працює безпосередньо на вашому комп’ютері. В одній з найпоказовіших частин цього туторіалу автор демонструє повний цикл: керування Codex з мобільного, генерація сайту на робочому столі, викладення коду в GitHub і деплой на Vercel — без ручного програмування.

Це не історія про «ще один чат-бот». Ідеться про те, як за кілька хвилин пройти шлях від ідеї до живого сайту у браузері, використовуючи лише природну мову й уже наявну інфраструктуру розробників.

Codex у кишені: як телефон керує настільним агентом

Codex — це десктопний застосунок, який виконує дії безпосередньо на комп’ютері: працює з файлами, запускає процеси, керує браузером. Але окремо в туторіалі показують ще один шар можливостей — Codex Mobile.

Спочатку Codex потрібно під’єднати до мобільного застосунку ChatGPT. У налаштуваннях користувач сканує QR‑код і проходить авторизацію. Після цього Codex з’являється у бічній панелі застосунку ChatGPT на телефоні.

Ключовий момент: відтепер з мобільного можна не просто спілкуватися з моделлю, а саме «керувати» настільним агентом. Телефон працює як пульт дистанційного керування: користувач надсилає запит, а Codex виконує роботу на підключеному комп’ютері.

Є одна критично важлива умова, яку автор окремо підкреслює: комп’ютер має бути увімкнений. Якщо машина вимкнена або в сплячому режимі, Codex фізично не зможе виконати завдання, навіть якщо команда надходить із телефону.

У демо використовується простий, але показовий запит: «Використай усе, що знаєш про контекст Window, щоб створити нам вебсайт». Далі все відбувається без участі користувача за комп’ютером: Codex на десктопі починає збір і генерацію файлів, а з телефона в реальному часі можна стежити за прогресом, бачити запити на підтвердження й затверджувати дії одним тапом.

У підсумку з мобільного відкривається вже готовий сайт — сайт «виглядає чудово» й, за оцінкою автора, «фактично ідеальний із першої спроби».

Вихід за межі локальної машини: Codex і GitHub

На цьому демонстрація не зупиняється. Наступний логічний крок — зробити проєкт доступним не лише на одному комп’ютері. Для цього використовується GitHub.

Команда звучить так: «Створи новий GitHub‑репозиторій для цього проєкту і запуш усі поточні файли». Codex, маючи вже налаштований доступ до облікового запису GitHub, самостійно виконує увесь процес: створює репозиторій і завантажує код.

У туторіалі окремо пояснюється, що таке GitHub у цьому ланцюжку: це безкоштовна хмарна платформа для хостингу коду. Коли проєкт потрапляє до GitHub, із ним можна працювати з будь‑якого пристрою, ділитися з іншими людьми або використовувати як джерело для деплою на веб.

Якщо GitHub ще не підключений, Codex не «ламається» — просто зупиняється на кроці, який не може виконати самостійно, і просить користувача пройти додаткові кроки. Логіка роботи зберігається: користувач спілкується природною мовою, а агент «підхоплює» усі рутинні технічні дії, щойно отримує необхідні доступи.

Фактично цей момент перетворює локальний no‑code‑проєкт на повноцінний хмарний репозиторій, сумісний із типовим стеком розробників.

Один клік до продакшена: Vercel як фінальний етап

Остання частина ланцюжка — деплой на Vercel. Тут автор уже не покладається на повністю автоматизований сценарій у Codex, але демонструє, наскільки мало ручних дій потрібно, коли код уже в GitHub.

Vercel описується як хостинг‑платформа, яка підключається до GitHub, бере код із репозиторію й «ставить» сайт у продакшен. У демо використовується безкоштовний план — підкреслюється, що навіть на ньому можна зробити досить багато.

Інтерфейс Vercel на цьому етапі вже «бачить» усі GitHub‑репозиторії користувача. Далі процес складається з двох кліків: спочатку імпорт потрібного репозиторію, потім натискання кнопки Deploy на наступній сторінці.

Результат не змушує чекати: за словами автора, «десь менш ніж за хвилину сайт стає доступним за цим URL і виглядає чудово». Це завершує повний цикл — від команди з телефона до публічного сайту, доступного будь‑кому в інтернеті.

Важливий момент тут не в конкретному хостингу, а в тому, що Codex плюс GitHub відкривають двері до всього існуючого світу інструментів для деплою. Якщо платформа підтримує підключення до GitHub‑репозиторію, Codex уже зробив більшу частину шляху за користувача.

No‑code‑конвеєр у дії: що насправді показує цей кейс

Усі ці кроки — керування з телефона, генерація сайту, пуш у GitHub, деплой на Vercel — у туторіалі укладаються у кілька хвилин живого часу. Важливо, що автор не перетворює це на абстрактну демонстрацію «можливостей ШІ», а показує реальний, послідовний конвеєр, який можна повторити без технічної освіти.

Промпт «Використай усе, що ти знаєш про контекст Window, щоб створити нам вебсайт» стає відправною точкою, а все подальше — низка кроків, де користувач переважно погоджується з тим, що робить агент. Там, де потрібні додаткові дії (налаштування GitHub чи підтвердження на телефоні), їхня роль зводиться до видачі дозволів і кількох натискань.

Цей кейс демонструє кілька принципових змін у звичному підході до веб‑проєктів.

По‑перше, промпт стає новим інтерфейсом для роботи з інфраструктурою розробки. Те, що зазвичай вимагало знання команд Git, базової фронтенд‑верстки та розуміння деплою, зводиться до серії фраз природною мовою.

По‑друге, мобільний сценарій показує, що точка входу в цей конвеєр практично не прив’язана до робочого місця. Телефон використовується і для постановки задач, і для контролю ході виконання, і для підтверджень — тоді як важка робота відбувається «там, де залізо».

По‑третє, увесь процес вкладається в уже звичну для розробників зв’язку GitHub + хмарний хостинг. Тобто Codex не створює власну замкнену екосистему, а під’єднується до наявних інструментів.

У підсумку автор приходить до висновку: Codex дає змогу відносно легко перейти від хаотичного набору локальних файлів і ідей до працюючих систем — аж до живого сайту — за один сеанс роботи. Сюжет із сайтом і деплоєм із мобільного стає концентрованою демонстрацією того, як може виглядати «повний стек» без коду в практиці, а не лише в теорії.

Джерело

Full OpenAI Codex Tutorial: Beginner to Advanced — Futurepedia

Чат-бот Proton Lumo отримав генерацію зображень

0

Proton випустила найбільше оновлення для свого чат-бота Lumo майже через рік після його запуску. Lumo версії 2.0 тепер підтримує розпізнавання та генерацію зображень, що нарешті робить його повноцінним конкурентом для ChatGPT і Gemini. Proton заявляє, що оновлений чат-бот вміє не лише створювати зображення, а й аналізувати та редагувати їх. Розмови із залученням зображень, як і решта чатів у Lumo, захищені шифруванням zero-access, тож доступні лише на вашому пристрої. Компанія стверджує, що до них не мають доступу треті сторони й навіть сама Proton.

Чат-бот Proton Lumo отримав генерацію зображень

Окрім генерації зображень, новий Lumo отримав і «thinking mode» для кращого міркування. За даними Proton, Lumo 2.0 Lite показав результат на 127% вищий, ніж Lumo 1.4, у бенчмарку Artificial Analysis Intelligence Index, а Lumo 2.0 Max — на 240% вищий. Цей бенчмарк оцінює можливості моделі в різних типах завдань. Оновлений Lumo має глибший контекст, завдяки чому краще підбирає релевантну фонову інформацію та дає точніші відповіді. Крім того, він тепер уміє підтягути найсвіжіші дані та додавати посилання на джерела у своїх відповідях.

Lumo 2.0 уже доступний для використання. Базові можливості ШІ залишаються безплатними, але за $10 на місяць можна оформити Lumo Plus — він відкриває безлімітні чати, розширену генерацію зображень і доступ до більш потужних моделей Proton.

«Lumo 2.0 був переосмислений із нуля, а поява thinking mode додає йому потужних нових можливостей», — сказав засновник і CEO Proton Енді Єн. «Тестування з користувачами показує, що розрив скоротився настільки, що для багатьох сценаріїв застосування люди вже не відчувають якісної різниці між Lumo 2.0 Max і найновішими моделями від OpenAI та Anthropic. Lumo 2.0 доводить, що користувачам більше не потрібно обирати між потужними можливостями ШІ та реальним захистом приватності».

Джерело

Engadget

Clicks показала смартфон Communicator з клавіатурою

0

Clicks привернула увагу на CES цього року своїм смартфоном Communicator у стилі Blackberry з апаратною клавіатурою та кастомізованим інтерфейсом Android. Ідея сподобалась, але тоді це був нефункціональний макет, тож сказати більше було важко. Тепер Clicks опублікувала перше відео з живою демонстрацією Communicator на YouTube, і пристрій виглядає ідеальним для тих, хто любить ретро-естетику та фізичні клавіші.

Clicks показала смартфон Communicator з клавіатурою

Як вже повідомлялося раніше, Communicator — це смартфон на базі Android 16 з 4-дюймовим OLED-дисплеєм, 3,5-мм аудіороз’ємом, підтримкою карт microSD для розширення пам’яті та, звісно, тактильною клавіатурою. У Clicks розглядають його як другий апарат для більшості користувачів і вважають, що основний «контент‑девайс» для фото й відео все ж має бути іншим смартфоном. Попри це, Communicator отримав усе, чого очікуєш від сучасного телефону: основну камеру на 50 Мп і фронтальну на 24 Мп, NFC для Google Pay, Bluetooth, Wi‑Fi, акумулятор ємністю 4 000 мА·год, а також заряджання через USB‑C і бездротове.

У демонстрації, яку провів віцепрезидент з маркетингу Джефф Гедвей, Clicks показала власний інтерфейс на базі лаунчера Niagara. Він дозволяє вибирати та впорядковувати застосунки через стрічку-«рибон» праворуч або просто вводячи їхні назви з клавіатури. У відео також показали, як приймати дзвінки, перемикатися між застосунками та виконувати інші повсякденні дії.

Компанія розкрила й апаратні особливості пристрою: сканер відбитків пальців вбудовано у пробіл, 3,5‑мм аудіороз’єм розташований зверху, передбачено три мікрофони (зверху, знизу та на задній панелі), динаміки та барометричний датчик. Поглиблення навколо порта USB‑C допомагає знімати задню кришку (доступну в кількох кольорах), під якою розміщено слоти для SIM‑карти та microSD.

Джерело

Engadget

Голосовий пошук Gmail Live запустили в бета-версії

0

Google продовжує шукати способи, як штучний інтелект може позбавити користувачів від рутинних завдань — наприклад, від необхідності вручну вводити ключове слово в поле пошуку Gmail. Gmail Live, анонсований на Google I/O минулого місяця й тепер запущений у бета-тестування, дозволяє шукати листи в поштовій скриньці за допомогою голосу.

Голосовий пошук Gmail Live запустили в бета-версії

Як помітив ресурс 9to5Google, деякі користувачі Android та iOS можуть почати бачити нову функцію на своїх смартфонах ще до того, як її цього літа офіційно відкриють для передплатників тарифів Google AI Pro та Ultra. Це частина спроби Google відтворити досвід роботи з Gemini Live — живих голосових чатів із чатботом Gemini — у популярних додатках на кшталт Gmail, Docs і Drive. Кожен із цих сервісів отримає свою версію такої функціональності впродовж найближчих місяців.

Журналісти Engadget ще не мали змоги протестувати Gmail Live особисто, але 9to5Google опублікував наочний огляд роботи сервісу. Якщо ви потрапили до числа тестувальників, у полі пошуку з’явиться піктограма Live, а поруч — кнопка Gemini. Натискання на неї відкриває Gmail Live на весь екран із попередженням, що це поки що бета-функція. На екрані також будуть кнопка виходу з Gmail Live і повернення до вхідних, а також перемикач вимкнення мікрофона.

Користувач може попросити Gemini знайти в пошті інформацію, наприклад, про майбутні подорожі чи статус замовлень. За даними 9to5Google, зараз між голосовою командою та отриманням результату є невелика затримка.

Функції Live на базі Gemini поступово з’являються в різних додатках Google. Ще очікується запуск Docs Live, який зможе перетворювати потік думок користувача на структурований чорновик документа, підтягаючи деталі з інших сервісів за згодою користувача. Keep Live принесе подібні можливості в додаток нотаток Google Keep — Android Authority уже зафіксував цю функцію «в полі».

Усі ці можливості спочатку будуть доступні лише передплатникам Google AI Pro та Ultra, а клієнти бізнес-сервісу Google Workspace зможуть випробувати їх у режимі попереднього доступу.

Джерело

Engadget

X запускає MCP-сервер для інтеграції з AI-асистентами

0

X спрощує підключення AI-асистентів на кшталт Claude, Cursor, Grok Build та інших сумісних із MCP застосунків безпосередньо до платформи завдяки новому хостинговому MCP-серверу.

X запускає MCP-сервер для інтеграції з AI-асистентами

У понеділок соціальна мережа, що належить Ілону Маску, представила хостинговий сервер Model Context Protocol (MCP), який дає змогу AI-інструментам взаємодіяти з X API, використовуючи права доступу облікового запису користувача.

MCP — це відкритий стандарт, що визначає єдиний спосіб підключення AI-моделей до зовнішніх інструментів і сервісів. Раніше, якщо розробники хотіли, щоб асистент на кшталт Claude або Cursor отримував доступ до X, їм доводилося самостійно створювати MCP-сервер, розгортати його, підключати до X API та налаштовувати автентифікацію. Тепер MCP розміщується на інфраструктурі X, а користувачі проходять автентифікацію за допомогою власних облікових записів і їхніх дозволів.

Це дозволяє розробникам заощадити час на інтеграційних роботах і зосередитися на основному продукті.

Давно існувала можливість шукати в X, читати пости, знаходити користувачів, аналізувати розмови й тренди та робити більше за допомогою API платформи. Хостинговий MCP не додає нових можливостей у цьому плані, але спрощує їхнє підключення до AI-застосунків. Таким чином X може позиціонувати себе як інформаційну мережу з масивом даних у реальному часі для отримання й аналізу, а не лише як місце для спілкування в соцмережі.

Цим кроком X приєднується до дедалі більшої кількості компаній, що пропонують власні офіційні MCP-сервери або кінцеві точки, зокрема GitHub, Slack, Notion, Stripe та Salesforce.

Водночас існують побоювання, що, прибравши частину інфраструктурних бар’єрів, X може відкрити шлях до більшої кількості автоматизованих постів або спаму.

Однак у X уточнили для TechCrunch, що інструмент MCP не сумісний із кінцевими точками Write API X, тож використати його для автономної (чи будь-якої) публікації постів у X неможливо.

Також важливо, що хостинговий MCP не обходить правила використання X API, які й надалі обмежують доступ у разі виявлення спам-поведінки.

Раніше цього року X оновила API v2, щоб протидіяти спаму, створеному за допомогою AI, зокрема масовим програмним відповідям у розмовах. Крім того, нещодавно компанія переглянула ціни на використання API: вартість публікації постів зросла до $0,015, а публікації посилань — до $0,20. Тоді X пояснила, що підвищення цін покликане «обмежити вектори зловживань», тобто спам у X стає принаймні дорожчим.

Матеріал оновлено після публікації, щоб додати підтвердження від X, що інструмент MCP не надає доступу до операцій «Write».

Джерело

TechCrunch

Чому «vibe coding» програє: професійний воркфлоу з AI та PyCharm

0

У новому великому розборі на каналі Tech With Tim автор показує, як перетворити хаотичне «vibe coding» з AI‑чатом у браузері на справжній професійний інженерний процес. У центрі — PyCharm як повноцінна IDE, глибоко інтегрована з AI‑агентами, базами даних, дебагером, MCP‑серверами та правилами для агентів. Це не про написання «коду будь‑що‑будь» з моделлю, а про те, як працювати як інженер, який відповідає за великий кодовий базис.

Коли AI вже недостатньо просто «підказувати код»

Відправна точка проста й жорстка: коли мета — стати професійним софтверним інженером, спосіб використання AI доводиться змінювати. Просте безкінечне «промптінг» моделі вже не працює як основний інструмент.

У професійному контексті виникають інші задачі. Потрібно заходити в код і реально його читати. Потрібно шукати визначення типів і функцій, розуміти, як пов’язані модулі. Потрібно запускати дебагер і дивитися на стан змінних у момент виконання. А коли модель ламається, генерує некоректний код чи конфігурації, все це доводиться виправляти руками — і для цього потрібен відповідний інструментарій.

Саме тут з’являється контраст між «vibe coding» у браузері та роботою в IDE. Професійний підхід, який демонструється в PyCharm, не покладається виключно на «cloud code» і відповіді моделі. Він поєднує AI з класичним набором інженерних засобів: повноцінним редактором, дебагером, профайлером, інтегрованою роботою з БД, Git, а також додатковими AI‑компонентами — MCP‑серверами, правилами та skills.

IDE як центр професійного AI‑воркфлоу

Серцевина підходу — перехід до професійної IDE, спеціально заточеної під Python. PyCharm тут розглядається не просто як «редактор з підсвіткою», а як середовище, що дозволяє зрозуміти й контролювати великий проєкт.

У типовому AI‑проєкті на FastAPI всередині PyCharm одночасно живуть:

  • код, розбитий на модулі (schemas, repositories, database, маршрути API);
  • середовище виконання й пакети, які можна переглядати та ставити безпосередньо з IDE;
  • інтегрований перегляд структури файлів, типів і роутів;
  • Git‑панель із гілками, комітами й дифами;
  • інструменти для роботи з проблемами в коді, попередженнями та помилками.

Це «надбудова» над кодом, якої бракує при роботі в CLI або в простому редакторі. Вона дає змогу швидко переходити до визначень, переглядати типи, ловити помилки ще до запуску застосунку. І саме в цей екосистемний простір вставляється AI — не як зовнішній чат, а як інтегрований агент, який «бачить» структуру проєкту та працює в тих же межах, що й розробник.

Тут же підкреслюється: весь цей стек «не просто так». Різноманітні панелі, вікна структур, переглядачі БД і комітів існують, щоб полегшити життя саме у великих професійних проєктах, де просто «згенерувати ще трохи коду» вже недостатньо, а головне завдання — розуміти, що відбувається в системі.

Агент проти моделі: як AI вписується в інженерний процес

Окрема лінія — як саме у такій IDE використовується AI. У PyCharm це не просто один «бот», а система агентів та моделей.

Важливе розрізнення: агент — це не сама модель, а «хавнес» (harness), тобто оболонка навколо моделі. Модель лише перетворює текст на текст, тоді як агент додає:

  • інструменти (skills);
  • правила, що завжди інжектуються в контекст;
  • інтеграцію з MCP‑серверами;
  • контекстне інженеринг запитів, пов’язаний із IDE і проєктом.

У межах одного й того ж агента можна вибирати різні моделі, наприклад GPT‑5.5. Але той самий GPT‑5.5 у Juni, Codex чи іншому агенті поводитиметься по‑різному, оскільки змінюється саме «обв’язка»: які інструменти та контекст йому надають, як формуються запити.

На практиці це помітно, наприклад, у роботі агента Juni. Зазвичай він спочатку досить детально планує все, перш ніж просто стрибати в код. Такий підхід добре підходить для структурованих задач і великих фіч, але може відчутно збільшувати час до першої версії коду. У PyCharm навіть створюється окрема папка з планами — своєрідний вбудований spec‑driven підхід, який фіксує, над чим саме зараз працює агент.

У підсумку, AI у цьому воркфлоу — не автономний «кодогенератор», а учасник процесу, який:

  • створює структуру проєкту;
  • підлаштовується під наявні правила та skills;
  • використовує додаткові інструменти через MCP;
  • а далі передає контроль людині й класичним засобам IDE — дебагеру, тестам, переглядачам БД.

Тести, HTTP‑запити й база даних в одному середовищі

Один із ключових елементів професійної роботи — валідація того, що код реально працює. Тут PyCharm пропонує одразу кілька шарів.

По‑перше, для FastAPI при створенні проєкту автоматично з’являється файл test_main.http. Це не просто нотатки, а робочий інструмент, який дозволяє прямо з IDE надсилати HTTP‑запити до API, зберігати їх і бачити відповіді. Таким чином формується окремий файл із тестами для ендпоїнтів, де:

  • зберігаються тіла запитів і заголовки;
  • фіксуються відповіді у вигляді JSON;
  • видно, який статус‑код повернувся, які дані реально створюються.

Це корисно, коли ендпоїнтів багато, і їх треба регулярно перевіряти, не стрибаючи між терміналом, браузером і якимись зовнішніми тулінгами.

По‑друге, у проєкті на FastAPI з локальною SQLite‑базою IDE дозволяє:

  • вказати діалект SQL як SQLite;
  • підключити сам файл бази даних як джерело даних;
  • переглядати таблиці, індекси й рядки безпосередньо з PyCharm;
  • запускати SQL‑запити в інтегрованому консольному режимі.

Після підключення БД зникають попередження на SQL‑рядках у коді, а IDE отримує змогу не лише підсвічувати синтаксис, а й реально виконувати запити та показувати вміст таблиць. Це особливо помітно при тестуванні CRUD‑операцій: розробник може відправити HTTP‑запит на створення книги, побачити JSON‑відповідь у test_main.http і тут же відкрити відповідну таблицю в переглядачі БД, щоб переконатися, що рядок з’явився.

Таке поєднання HTTP‑тестів та інтегрованої БД замінює розрізаний воркфлоу на «запустив — подивився лог у терміналі — відкрив інший тул для БД» і створює єдине контрольоване середовище всередині IDE.

Дебагер замість print: як розбиратися з помилками

Ще одна принципова межа між «vibe coding» і професійною роботою — спосіб налагодження. Придрук значень через print у логах тут прямо протиставляється використанню вбудованого дебагера.

У PyCharm дебагер працює нативно для Python‑проєктів. Сценарій виглядає так:

  1. У потрібних місцях ставляться breakpoints — червоні точки в «гуттері» біля номерів рядків.
  2. Застосунок запускається не в звичайному режимі, а в debug‑режимі.
  3. Поки код не дійшов до точки зупинки, все працює «як зазвичай».
  4. Коли виклик заходить у функцію з breakpoint’ом, виконання зупиняється, застосунок ніби «заморожується».

Далі IDE пропонує повний набір інструментів: перегляд усіх локальних змінних, стану об’єктів, їхніх полів, стеку викликів. Можна пошагово проходити кодом: «крокувати» по рядках, заходити всередину функцій або, навпаки, «перестрибувати» через них, виходити з поточного фрейму.

Практичний ефект відчутний навіть на невеликому FastAPI‑проєкті: коли HTTP‑тест запускає кілька ендпоїнтів, один із них «натрапляє» на breakpoint — і розробник в реальному часі бачить, наприклад, ID книги, об’єкт, що приходить із репозиторію, і те, як він трансформується перед поверненням у відповідь. Це той випадок, коли стає очевидно, чому застосунок «веде себе дивно» — замість того, щоб гадати по логах.

Найголовніше ж — дебагер стає звичним інструментом при роботі з великим застосунком. У такому режимі AI вже не «підміняє» собою розуміння коду, а допомагає скоротити дорогу до першої версії, після чого починається звичний для інженера цикл: тестування, дебаг, перегляд стану, виправлення, повторний запуск.

MCP, правила та skills: як формалізувати поведінку агента

На наступному рівні з’являється інфраструктура навколо AI‑агента. Мова йде про Model Context Protocol (MCP), правила (rules) і skills.

MCP‑сервери додають агенту зовнішні можливості. Показовий приклад — офіційний GitHub MCP‑сервер. Після додавання його в налаштуваннях PyCharm через HTTP‑конфігурацію й передачі йому GitHub personal access token агент отримує «інструменти» для роботи безпосередньо з GitHub. У підсумку досить у чаті попросити:

  • створити новий публічний репозиторій;
  • запушити весь код поточного проєкту;
  • налаштувати віддалений origin для подальшої роботи.

І агент, користуючись MCP‑сервером, виконає це, а розробник зможе спостерігати, як у Git‑панелі IDE з’являються нові коміти, remote‑репозиторій і push‑операції.

Правила — ще один шар керування агентом. У PyCharm для них є окрема папка в проєкті. Кожне правило — markdown‑файл, текст якого автоматично додається до промпту при кожному зверненні до агента. Наприклад, можна створити правило з інструкцією: «Завжди коміть основні зміни в Git перед тим, як продовжити». Таке правило стає частиною «постійної пам’яті» агента щодо цього проєкту, а якщо папку з правилами закомітити в репозиторій, їх успадкують усі члени команди.

Skills — більш складні, але потужні сутності. Це повторно використовувані сценарії або інструкції, які агент може читати й за потреби виконувати. У PyCharm є вбудований Skill Hub, де можна:

  • переглядати вже встановлені skills;
  • встановлювати нові з каталогу (наприклад, skill із порадами з безпеки чи бекенд‑гайдом);
  • імпортувати власні skills, додані в окрему директорію.

Агент може як користуватися заздалегідь встановленими skills, так і створювати нові на запит розробника. Наприклад, можна попросити: сформувати skill, який описує стек поточного проєкту — мову, фреймворк, основні бібліотеки. Агент створює markdown‑файл у директорії skills для конкретного агента, прописує там опис і зміст; надалі, коли його прямо або опосередковано просять уточнити стек, він читає цей файл і використовує його як «правду» про проєкт.

Разом MCP, rules і skills перетворюють агента з «розумної автодоповнювалки» на керований компонент інженерного процесу, з чітко окресленими можливостями, політиками й знаннями, які можна версіонувати разом із кодом.

Вихід із CLI та «чистого промптінгу»

У фіналі звучить дуже конкретна мета: показати, як налаштовується професійний воркфлоу, щоб розробники вийшли з CLI‑інструментів і режиму «просто промптити модель», і перейшли до роботи у повноцінній IDE з AI як інтегрованою частиною процесу.

Тут важлива не лише можливість «написати код швидше», а саме повний цикл: від генерації структури проєкту й маршрутизаторів до налаштування БД, тестування HTTP‑запитів, підключення MCP‑серверів, написання правил і skills, запуску дебагера й навігації по великому кодовому базису.

Професійність у цьому підході означає не те, що AI використовується менше, а те, що він використовується інакше. Модель перестає бути «чарівною чорною скринькою», яка сама «щось зробить», а стає співучасником інженерного воркфлоу, вбудованим у середовище, де головними інструментами залишаються розуміння коду, можливість дослідити його поведінку та керовані інструменти для зміни й налагодження.

Джерело

YouTube: How I Set Up Python for Professional AI Development

Codex підключається до всього: як плагіни, браузер і computer use перетворюють його на універсального виконавця

0

Codex від OpenAI — це настільний агент, який працює поверх ChatGPT і вміє не лише відповідати в чаті, а й реально керувати вашим комп’ютером. У великому покроковому гіді від каналу Futurepedia автор показує, як із цього інструмента зробити універсальний інтегратор: підключити пошту, календар, Google Drive, використовувати браузер і навіть весь комп’ютер як «руки» ШІ.

Цей матеріал зосереджений на тому, як Codex через плагіни, browser use, Chrome‑розширення та режим computer use вбудовується у вже наявний стек сервісів і виконує рутинні кліки й заповнення форм замість користувача.


Плагіни як місток між Codex і вашими сервісами

В інтерфейсі Codex на бічній панелі є окремий розділ плагінів. Саме вони перетворюють агента з інструмента, що працює лише з локальними файлами, на повноцінний вузол вашої цифрової інфраструктури.

Плагіни — це «конектори», до яких одразу вбудовані навички роботи з певними сервісами. Уже з коробки доступні «усі великі очевидні» інтеграції на кшталт Gmail, Google Calendar, Canva та низки інших популярних інструментів. Сценарій підключення максимально простий: користувач натискає «add», авторизується в сервісі, дає необхідні дозволи — й після цього Codex може оперувати цим інструментом через плагін.

Важливий акцент: плагін — це не просто API‑ключ. У ньому вже зашиті «skills», тобто знання про те, як правильно працювати з сервісом. Codex не треба по кроках пояснювати, як створити папку, надіслати лист чи згенерувати дизайн: він уміє читати структуру плагіна і сам будувати правильні дії у відповідь на звичайні текстові інструкції.


Практичний кейс: Google Drive як продовження робочої папки

Один із показових прикладів — інтеграція з Google Drive. Сценарій: у Codex уже згенеровано низку маркетингових матеріалів — меню, промо‑зображення тощо. Потрібно передати їх команді, звичною для неї мовою — через спільну хмарну папку.

Користувач у чаті просто тегне плагін Google Drive і формулює завдання: створити нову папку у Google Drive для всіх меню та маркетингових зображень, які Codex створює, і додати туди вже наявні файли. Далі агент сам виконує послідовність дій: через плагін створює хмарну папку, завантажує до неї потрібні зображення — і «буквально ось так» у Google Drive з’являється новий каталог із усім контентом усередині.

Результат — не просто перенесення файлів. Codex фактично стає проміжною ланкою між локальним робочим простором на комп’ютері та хмарним сховищем команди. Далі цю зв’язку можна включати в автоматизації: наприклад, щойно створені або оновлені маркетингові матеріали автоматично потраплятимуть у спільну папку, де з ними працюють дизайнери чи маркетинг.


Browser use: ШІ, який сам ходить сайтами і заповнює форми

Окремий клас можливостей Codex — це так званий browser use, тобто вміння агента керувати браузером. Ідеться не про абстрактні HTTP‑запити, а про клікання й заповнення форм так, як це робить людина.

У цьому режимі Codex може відкривати сайти, здійснювати пошук, переходити між сторінками, вводити текст у поля форм, відкривати випадаючі меню, натискати кнопки. Автор прямо формулює рамку: «просто все, що ви можете зробити в браузері».

Реальний сценарій, який демонструється, — створення простої Google‑форми для RSVP на подію. Користувач обирає відповідний плагін, що працює з браузером, і дає інструкцію: створити коротку Google‑форму для реєстрації на «Friday build night». Далі Codex:

  1. Відкриває браузер.
  2. Заходить у Google Forms.
  3. Самостійно рухає курсором, який видно на екрані як окремий «курсор Codex».
  4. Створює нову форму, прописує запитання, типи відповідей, структурує поля.

З боку це виглядає як робота віддаленого оператора: вікно браузера, курсор, що швидко бігає, вводить текст, натискає кнопки. Користувач у цей час може займатися іншими справами: Codex не потребує мікроменеджменту, доки завдання в межах його компетенції.


Chrome‑розширення: використати вже авторизовані акаунти

Важлива деталь реалізації browser use — поділ на два підходи.

Перший — вбудований браузер Codex. Він відкривається вбік як інтегроване вікно й придатний для перегляду результатів, тестування сторінок і роботи там, де не потрібна авторизація у ваших особистих акаунтах.

Другий — плагін Chrome, який запускає повноцінний браузер Google Chrome, де користувач уже залогінений у всі свої сервіси. Саме цей варіант критичний для сценаріїв, де потрібно працювати у вашому обліковому записі: від Google Forms і документів до інших платформ, де немає готового окремого плагіна.

У продемонстрованому кейсі з Google‑формою Codex відкриває саме Chrome, а не вбудований переглядач. На комп’ютері вже встановлене окреме Chrome‑розширення Codex, і агент користується ним, щоб отримати контроль над браузером, у якому збережені всі логіни. Це дозволяє автоматизувати завдання в реальному робочому середовищі користувача, а не в «пісочниці».


Computer use: крок за межі браузера

Ще один рівень інтеграції — плагін під назвою computer use. Якщо browser use обмежується діями в межах вікна браузера, computer use дає Codex можливість працювати з усім комп’ютером: це стосується будь-яких застосунків і вікон за межами веб‑інтерфейсу.

Автор зауважує, що особисто не покладається на computer use так активно, як на browser use, але наголошує: якщо потрібно, щоб Codex працював не лише в браузері, а й «по всьому десктопу», такий варіант є.

Водночас ця функціональність описується як «на передовій розвитку ШІ зараз». Вона нова, ще не універсальна: агент далеко не завжди впорається зі складним сценарієм, і завдання мають бути відносно простими. Але вже сам факт, що Codex може вміти повторювати дії користувача на рівні всього комп’ютера, ставить його в іншу категорію інструментів — ближче до «цифрового співробітника», а не просто чату з підказками.


Запис дій користувача: як навчити Codex нових трюків

Щоб розширити межі того, що Codex здатен робити в браузері чи в режимі computer use, доступна ще одна функція — запис навички.

Якщо є унікальне завдання, яке агент не може інтуїтивно освоїти, але ви виконуєте його регулярно, можна просто один раз зробити це самостійно. Codex у цей момент веде захоплення екрана й «дивиться». Після завершення запису він перетворює спостереження на навичку: у майбутньому зможе відтворювати те саме завдання за аналогією з вашими діями.

Цей підхід важливий саме в контексті computer use і browser use, де стандартних сценаріїв може бути недостатньо. Користувачеві не треба описувати десятки кроків текстом — достатньо один раз показати, і Codex спробує узагальнити побачене в повторюваний процес.


Коли немає потрібного плагіна: конструктор інтеграцій усередині Codex

Екосистема плагінів Codex не обмежується тільки готовими інтеграціями. Якщо користувач не знаходить конектора до потрібного сервісу, у Codex є окремий «plugin creator skill».

Цей інструмент допомагає визначити, з чим саме треба інтегруватися, і поетапно оформлює це в плагін за тією ж логікою, що й власні «skills» для задач, як‑от створення меню в певному стилі. Після цього новий плагін можна використовувати так само, як і вбудовані: тегати, підключати в автоматизації, комбінувати з browser use чи computer use.

Таким чином Codex перетворюється не просто на споживача існуючих інтеграцій, а на платформу, де сам агент може допомогти користувачеві створювати власні конектори до потрібних інструментів.


Висновок: від чату до повноцінного інтеграційного шару

Завдяки плагінам, браузерному керуванню, Chrome‑розширенню та режиму computer use Codex виходить далеко за межі класичних можливостей ChatGPT. Він підключається до знайомих сервісів — від Google Drive до календаря, уміє фізично «клікати» по сайтах і заповнювати форми в уже авторизованому Chrome, а за потреби — керувати всім комп’ютером.

Ця зв’язка робить його не просто консультантом, а інтеграційним шаром, який може зшивати між собою локальні файли, хмарні сервіси та веб‑інтерфейси. Там, де раніше потрібні були окремі скрипти, no‑code‑платформи чи ручні дії, Codex бере на себе рутину у відповідь на кілька простих інструкцій природною мовою.


Джерело:
Full OpenAI Codex Tutorial: Beginner to Advanced — Futurepedia

Realta Fusion вперше напряму отримала струм із термояда

0

Для стартапів у галузі керованого термоядерного синтезу найважче вже позаду: завдяки проривному експерименту 2022 року ми знаємо, що контрольовані реакції синтезу можуть виробляти більше енергії, ніж споживають. Але тепер компаніям потрібно довести, що їхні реактори можуть генерувати достатньо електроенергії, щоб це було рентабельно.

Realta Fusion вперше напряму отримала струм із термояда

Один зі шляхів — просто підняти температуру, отримуючи більше тепла для виробництва більшої кількості пари, яка обертатиме більшу турбіну. Інший — збирати електроенергію безпосередньо з реакцій синтезу, що потенційно є набагато ефективнішим підходом.

Realta Fusion повідомила, що під час експерименту 19 червня їй вдалося запалити лампочку, використавши електроенергію, зібрану безпосередньо з WHAM, демонстраційного термоядерного пристрою компанії. Стартап із Вісконсину вважає, що це перша приватна компанія, яка публічно продемонструвала такий результат.

“Ми можемо знімати потужність з плазми”, — розповів TechCrunch співзасновник і генеральний директор Realta Fusion Кіран Фурлонг. Ця віха показує, “що можливо”, додав він.

Realta планує використовувати пряме перетворення енергії для нагріву плазми у своєму реакторі — процесу, який потребує дуже багато енергії. За оцінкою Фурлонга, ефективність прямого перетворення становить близько 90%, тобто 90% потенційної енергії перетворюється на електрику. Для порівняння, парові турбіни в сучасних реакторах поділу мають ефективність близько 33%. Чим більше енергії компанія зможе зібрати, тим швидше вона вийде на прибутковість.

Кожна електростанція споживає частину виробленої енергії просто на власні потреби, і термоядерні реактори не є винятком. Головний виклик для термоядерних стартапів сьогодні — створити реактори, які вироблятимуть більше енергії, ніж споживають. Перевага у вигляді вищої ефективності прямого перетворення має полегшити подолання цього бар’єра.

Близько 20% енергії від реакцій синтезу на основі дейтерію-тритію, які Realta планує використовувати у своїх комерційних реакторах, припадає на заряджені ядра гелію, так звані альфа-частинки. Стартап побудував прототип перетворювача електроенергії та встановив його на виході реактора. Там йому вдалося зібрати достатньо “альфа-потужності”, щоб отримати кілька амперів струму при напрузі 100 вольт, чого вистачило для живлення кількох лампочок.

У масштабах комерційної електростанції такі перетворювачі прямої енергії мають забезпечити достатньо потужності для нагріву плазми. “Ви фактично можете рециркулювати електроенергію”, — пояснив Фурлонг.

Зрештою, за його оцінкою, така “циркулярність” може збільшити сумарну вихідну потужність комерційної електростанції на 20–30%. “Розкрутити своєрідний електричний маховик, якщо хочете, дуже вигідно”, — сказав він.

Хоча Realta, можливо, першою продемонструвала пряме перетворення енергії на практиці, вона не єдиний стартап, який планує використати цю технологію у своєму реакторі. Для Helion — компанії, яку підтримує Сем Альтман, — пряме перетворення енергії є ключовим елементом планів, хоча публічно вона ще нічого подібного не демонструвала.

Збір електроенергії безпосередньо з термоядерної реакції “дійсно допомагає економіці” конструкції реактора, підсумував Фурлонг.

Джерело

TechCrunch

Творці покерного ІІ з DeepMind заробляють для хеджфондів

0

Троє колишніх дослідників DeepMind, які створили ШІ, що переміг людей у покері, тепер застосували подібні технології до торгівлі акціями — і ставка, схоже, вже себе виправдовує. Їхня празька лабораторія штучного інтелекту EquiLibre Technologies отримала оцінку в $500 млн після раунду Series A на нерозголошену суму, дізнався TechCrunch.

Творці покерного ІІ з DeepMind заробляють для хеджфондів

Раунд очолив фонд Creandum. Хоча венчурна фірма також відмовилася розкривати розмір інвестиції, віцепрезидент Камерон Селлерс підтвердив, що це «найбільша одноразова інвестиція, яку ми коли-небудь робили в компанію», сказав він TechCrunch.

Спільний знаменник між покером і Wall Street у тому, що обидві сфери добре підходять для навчання з підкріпленням — техніки тренування ШІ, де самонавчальні моделі мотивуються винагородами. За словами CEO EquiLibre Мартіна Шміда, «класна річ у трейдингу та ринках у тому, що система оцінювання надзвичайно проста: скільки грошей заробив агент?»

І це не «ігрові» гроші. У партнерстві з квант-фондом Tower Research Capital алгоритми EquiLibre щодня торгують обсягами на мільярди доларів по індексах S&P 500 та Nasdaq. Стартап стверджує, що його агенти показують хороші результати ще з моменту виходу на крипторинки у 2025 році, а тепер і на фондові біржі, демонструючи «ідеальний рекорд із нульовою кількістю негативних місяців від заснування», тобто кожного місяця портфель за підсумками був у плюсі.

Застосовуючи свій ШІ у сфері квант-хеджфондів, стартап працює там, де автоматизація вже стала нормою і, у разі успіху, покращення дуже швидко конвертуються в прибуток. Це й зробило компанію привабливою для Creandum, каже Селлерс.

«Потенційний обсяг ринку торгівлі на фінансових ринках — один із найбільших у світі, і протягом років безліч фондів генерували такі обсяги прибутку, які змушують більшість венчурних успіхів виглядати скромними», — зазначив він. Але додав, що EquiLibre свідомо позиціонує себе як «лабораторія насамперед, а не фінансова компанія».

Шмід і двоє співзасновників — технічний директор Рудольф Кадлец і директор із науки Матеї Морявчик — не мають бекграунду у фінансах, і саме фінанси їх не мотивують, розповів він TechCrunch. «Я роблю це не тому, що мене захоплює ідея зробити ринки ефективними. Я це роблю, бо ми всі захоплені створенням речей, яких раніше не існувало, і це неймовірно цікаво будувати», — каже Шмід.

Перспектива передового ШІ від вихідців із DeepMind сьогодні дуже цікавить венчурних інвесторів. Ще один недавній приклад — Ineffable Intelligence, яка нещодавно залучила 1,1 млрд доларів. Більшість таких компаній базуються у Великій Британії, але є й помітні винятки, зокрема EquiLibre.

Трійця засновників EquiLibre були запрошеними PhD-студентами в першому міжнародному офісі досліджень ШІ Google у місті Едмонтон, провінція Альберта, Канада (Alphabet закрила його у 2023 році). Там вони створили DeepStack — першу програму ШІ, яка перемогла професійних гравців у безлімітному покері Texas hold’em. Вони також працювали з професорами, які тепер входять до високопрофільної консультативної ради стартапу, включно з Річем Саттоном, що у 2024 році отримав премію Тюрінга за роботи з навчання з підкріпленням.

Будуючи свій стартап, засновники EquiLibre вирішили повернутися до рідної Чехії. «Тут у нас було багато людей, із якими ми вже працювали, і існує велика чеська діаспора в Google та інших компаніях», — пояснює Шмід. «Це були наші друзі, тож ми сказали їм: “Гей, ми повертаємось до Праги, хочете приєднатися?”»

Це допомогло EquiLibre сформувати початкову команду ще у 2022 році й довести її до нинішніх 25 людей. Але, за словами Шміда, вибір локації продовжує давати бонуси. Порівняно з Сан-Франциско, «набагато легше утримати хороших людей тут, тому що кожні два місяці не з’являється черговий “сексуальний” ШІ-стартап».

Утім, EquiLibre не єдина «гаряча» ШІ-компанія в місті. BottleCap AI базується в тому ж будинку.

Попри це, EquiLibre залишається однією з найбільш помітних ШІ-компаній регіону за рівнем талантів. Далі вона планує масштабувати свою обчислювальну інфраструктуру, запускаючи кластер, який, за очікуваннями, стане одним із найбільших у Центрально-Східній Європі.

Стартап також відмовився розкривати загальний обсяг залучених коштів, але Шмід говорить, що раніше компанія провела ще два раунди фінансування. На пре-сид стадії інвестував, зокрема, CEE-орієнтований фонд Credo, який також підтримував ElevenLabs та UiPath. За даними Dealroom, посівний раунд EquiLibre на $10 млн очолив Blossom Capital при оцінці компанії в $140 млн.

Селлерс підтверджує, що оцінка в $500 млн у Series A — це великий стрибок. Але вона відображає і те, що «вітер змінився» на користь навчання з підкріпленням (RL), зокрема й у трейдингу. «Коли ми стартували, люди були скептичними», — згадує Шмід. Але зараз RL став стандартом. «Оскільки ми почали чотири роки тому, ми вважаємо, що випереджаємо інших».

Водночас є ризик, що стартап обженуть конкуренти. Наприклад, трейдинговий гігант Jane Street заявляє, що вже використовує RL разом із великими мовними моделями (LLM) «або чим завгодно іншим, що потрібно для навчання хороших моделей». Компанія також стверджує, що має «десятки тисяч високопродуктивних GPU», тоді як EquiLibre намагається «вичавити» максимум із значно меншої кількості чипів і «отримати більше з меншого», каже Шмід.

Джерело

TechCrunch

Microsoft може закрити Arkane та скасувати гру Blade

0

У межах масштабних скорочень у підрозділі Xbox, які мають розпочатися 6 липня, Microsoft розглядає можливість закриття Arkane Studios та скасування гри Blade, над якою студія працює з кінця 2023 року. Про це повідомляє Том Воррен із The Verge. Разом із попередніми матеріалами Bloomberg та GamesBeat це свідчить, що Microsoft готується вже наступного тижня закрити або продати п’ять студій: Compulsion Games, Double Fine, Ninja Theory, Undead Labs та Arkane.

Microsoft може закрити Arkane та скасувати гру Blade

Оновлень щодо Marvel’s Blade не було понад два роки, попри очікування фанатів. За даними The Verge, проєкт перевищив бюджет і затримується. Xbox вивчає можливості продажу Arkane — подібний підхід, за повідомленнями, розглядається щодо Compulsion, Double Fine, Ninja Theory та Undead Labs.

Увесь підрозділ Xbox готується до звільнень після внутрішнього листа нової генеральної директорки Asha Sharma та директора з контенту Метта Бути, в якому йшлося: «Ми опинилися в ситуації надмірної завантаженості… Надалі це не може тривати». Члени профспілки Xbox, яку представляє CWA, висловили розчарування та обурення діями керівництва Microsoft напередодні скорочень, закликавши до добросовісних перемовин і прозорості.

Arkane Studios більш відома як Arkane Lyon — автор серії Dishonored та Deathloop. Команда здобула репутацію завдяки відшліфованим стелс-екшенам від першої особи в стильних світах. У 2024 році Microsoft закрила сестринську студію Arkane Austin, відповідальну за Prey (ура) та Redfall (ой), у межах хвилі скорочень і закриття студій у підрозділі Xbox.

Тоді співкерівник Arkane Lyon Дінга Бакаба опублікував таке звернення:

«Це абсолютно жахливо. Дозвіл побути людиною: будь-якому керівнику, який це читає, дружнє нагадування — відеоігри це індустрія розваг і культури, а ваш бізнес як корпорації полягає в тому, щоб дбати про своїх митців/ентертейнерів і допомагати їм створювати для вас цінність. Не кидайте нас у “золоту лихоманку”, не робіть із нас цапів-відбувайл, коли йдеться про прорахунки чи сліпі зони, не перетворюйте наші робочі місця на дарвіністські джунглі. Ви кажете, що пишаєтеся нами, коли ми робимо хорошу гру. Зробіть так, щоб ми пишалися вами, коли часи складні. Ми знаємо, що ви можете, ми вже це бачили».

За даними трекера Game Industry Layoffs, у 2024 році в індустрії відеоігор через масові звільнення роботу втратили орієнтовно 14 600 людей, після вже вражаючих 10 500 скорочень у 2023-му.

Угода Microsoft із купівлі Activision Blizzard King за 69 млрд доларів — найбільше придбання в історії ігрової індустрії — була завершена у 2023 році. До цього компанія у 2021 році придбала ZeniMax (разом із Arkane Studios) за 7,5 млрд доларів і до того активно скуповувала студії.

У січні 2024 року Microsoft скоротила 1900 працівників у Xbox, Activision, Blizzard і ZeniMax, запустивши ще один важкий рік для індустрії. У 2024-му Xbox закрив Arkane Austin та Alpha Dog Games, продав Tango Gameworks і звільнив додатково ще 650 працівників. Влітку 2025 року підрозділ Xbox знову сколихнула хвиля скорочень і закриття студій, коли Microsoft звільнила 9000 співробітників по всій компанії.

Джерело

Engadget