Коли OpenAI готувала до запуску GPT‑4o, команда з оцінювання можливостей моделей раптово опинилася у новій реальності. Текстові бенчмарки, до яких уже звикли дослідники, перестали бути достатніми: модель вміла говорити в реальному часі, сприймати світ через зображення, а паралельно інша...
Коли OpenAI лише починала експерименти з новою «reasoning‑парадигмою», дослідницька команда бачила це як цікавий, але ще не до кінця зрозумілий злам у поведінці моделей. Сьогодні Теял Патвардхан, лідерка команди frontier‑evals в OpenAI, говорить про ці ж експерименти вже як...
Коли великі мовні моделі перестали спотикатися на шкільних тестах і академічних бенчмарках, у лабораторій зник простий термометр прогресу. В OpenAI цю проблему довелося розв’язувати зсередини: створювати нові вимірювачі, які не просто показують «IQ моделі», а дають уявлення про її...
Коли OpenAI випустила перші версії своїх мовних моделей, академічні тести з природної мови, шкільні іспити й класичні NLP‑бенчмарки ще могли щось сказати про прогрес. Сьогодні для команди frontier evals, яку очолює дослідниця Tejal Patwardhan, це вже радше історичні артефакти,...
На каналі Silicon Valley Girl підприємець і колишній продукт‑менеджер Reddit, Meta та Roblox Пітер Ян розповідає, як перезібрав свій робочий день навколо AI. Пішовши з корпорацій, він працює соло, веде велику розсилку, запускає продукти й при цьому наполягає: щоб...
Функція відображення трьох крапок у додатку iMessage, яку компанія Apple презентувала ще під час конференції WWDC у 2011 році, мала стати зручним інструментом для розуміння того, що співрозмовник готує відповідь. Проте на практиці цей механізм часто генерує хибні очікування,...
Пітер Янґ — колишній продакт-менеджер Reddit, Meta та Roblox, який пішов із корпорацій, щоб працювати соло. Сьогодні він веде велику розсилку, записує подкасти й запускає додатки, максимально спираючись на AI‑системи. Але попри майже тотальну автоматизацію, одна тема для нього...
Пітер Янґ — колишній продакт-менеджер Reddit, Meta та Roblox — сьогодні самостійно веде велику ньюзлетер‑аудиторію й запускає нові продукти майже повністю на базі AI. У розмові на каналі Silicon Valley Girl він описує власний «AI-first playbook» і пропонує простий,...
Соло-підприємець та колишній продуктовий менеджер Reddit, Meta і Roblox Пітер Ян останні роки демонструє радикальний підхід до роботи: замість команди він вибудовує навколо себе систему з AI-інструментів. Одна з найцікавіших її частин — персональний радник, щось на кшталт «chief...
Ринок твердотільних накопичувачів, більш відомих як SSD, для звичайних споживачів, схоже, майже припинив своє існування. Ця досить категорична заява пролунала з вуст Нельсона Дуанна, віцепрезидента компанії Silicon Motion, одного з найбільших виробників контролерів для SSD. За його словами, у...