Дослідники задаються віковими питаннями про природу думок – і вчаться їх читати. Це не означає, що технології просунулися далеко вперед, просто ми стали краще розуміти отримані результати. Настільки просунулися, що сни вже скоро можуть стати фільмами для публічного перегляду.
Як навчилися читати думки
Одного разу вночі в жовтні 2009 року молодий чоловік лежав у сканері ФМРТ в Льєжі, Бельгія. П’ять років тому він отримав травму голови в аварії на мотоциклі, і з тих пір він не розмовляв. Говорили, що він знаходиться в “вегетативному стані”.
Підписуйтесь на наш Telegram.
Нейробіолог на ім’я Мартін Монті сидів у сусідній кімнаті разом з кількома іншими дослідниками. Протягом багатьох років Монті та його постдокторський радник Адріан Оуен вивчали вегетативних пацієнтів, і вони розробили дві суперечливі гіпотези.
По-перше, вони вірили, що хтось може втратити здатність рухатися або навіть моргати, все ще перебуваючи в свідомості; по-друге, вони думали, що розробили метод спілкування з такими “замкнутими” людьми, виявляючи їх невисловлені думки.
У певному сенсі стратегія була проста. Нейрони використовують кисень, який переноситься через кровотік всередині молекул гемоглобіну. Гемоглобін містить залізо, і, відстежуючи залізо, магніти в апаратах фМРТ можуть створювати карти мозкової активності.
Розгледіти ознаки свідомості в цьому вирі здавалося майже неможливим. Але методом проб і помилок група Оуена розробила хитромудрий протокол. Вони виявили, що якщо людина уявляла, як ходить по будинку, в її парагіппокампальній звивині спостерігався сплеск активності-область у формі пальця, глибоко прихована в скроневій частці. Уява гри в теніс, навпаки, активувала премоторну кору головного мозку, яка розташована на гребені поруч з черепом. Активність була досить чіткою, щоб її можна було побачити в режимі реального часу за допомогою апарату фМРТ.
У дослідженні 2006 року, опублікованому в журналі Science, дослідники повідомили, що вони попросили замкнутої людини подумати про теніс і побачили на її скануванні мозку, що вона це зробила.
З молодим чоловіком, відомим як пацієнт 23, Монті і Оуен зробили ще один крок: спробували завести розмову. Вони задавали йому питання і говорили, що він може дати сигнал “так”, представивши, як грає в теніс, або “ні”, подумавши про прогулянку по своєму будинку. У кімнаті управління сканером на моніторі відображався поперечний зріз мозку пацієнта 23. У міру того як різні області поглинали кисень крові, вони мерехтіли червоним, потім яскраво-помаранчевим. Монті знав, куди дивитися, щоб помітити сигнали “так”і ” ні”.
Він включив інтерком і пояснив систему пацієнту 23. Потім він поставив перше питання: “вашого батька звуть Олександр?”. Премоторна кора головного мозку чоловіка загорілася. Він думав про теніс – це було сигналом «так». “Твого батька звуть Томас?”. Активність в парагиппокампальной звивині. Він уявляв, як ходить по своєму будинку – сигнал «ні».
Науковцям вдалося провести невеликий діалог із запитань і відповіді були правильними. Здивований Монті подзвонив Оуену, і той подумав, що їм слід задати більше питань. Група переглянула деякі можливості. “Ви любите піцу?”було відхилено як занадто неточне. Вони вирішили досліджувати більш глибоко.
Монті знову включив інтерком. “Ти хочеш померти?”він запитав. Вперше за цю ніч чіткої відповіді не було.
Тієї зими результати дослідження були опубліковані в медичному журналі Нової Англії. Газета викликала сенсацію. Лос-Анджелес Таймс написала про це статтю із заголовком “мозок вегетативних пацієнтів показує життя”.
Зрештою Оуен підрахував, що двадцять відсотків пацієнтів, які вважалися вегетативними, насправді не спали. Це було відкриття з величезними практичними наслідками: у наступні роки, завдяки кропітким сеансам МРТ, група Оуена знайшла багато пацієнтів, які могли спілкуватися з близькими і відповідати на питання про їх власний догляд. Бесіди підвищили їх шанси на одужання.
Проте, з чисто наукової точки зору, було щось незадовільне в методі, який Монті і Оуен розробили з пацієнтом 23. Хоча вони використовували слова “теніс” і “будинок” у спілкуванні з ним, у них не було можливості дізнатися напевно, що він думав про ці конкретні речі.
Вони змогли сказати тільки те, що у відповідь на ці підказки мислення відбувалося у відповідних областях мозку. “Чи уявляла собі ця людина гру в теніс, футбол, хокей, плавання — ми не знаємо”, – сказав Монті.
Як кілька кілограмів живої тканини вмішують безліч думок
За останні кілька десятиліть стан нейробіологічного читання думок значно покращився. Когнітивні психологи, озброєні апаратом фМРТ, можуть визначити, чи виникають у людини депресивні думки; вони можуть побачити, якими поняттями опанував учень, порівнюючи патерни його мозку з патернами його вчителя.
Аналізуючи знімки мозку, комп’ютерна система може відтворювати грубі реконструкції переглянутих вами відеороликів. Одна дослідницька група використовувала аналогічну технологію для точного опису снів сплячих суб’єктів.
В іншій лабораторії вчені сканували мозок людей, які читають розповідь Дж. Д. Селінджера “красивий рот і зелені мої очі”, в якому до кінця неясно, чи є у персонажа роман чи ні. Тільки за скануванням мозку дослідники можуть визначити, до якої інтерпретації схиляються читачі, і спостерігати, як вони змінюють свою думку.
Кен Норман, п’ятдесятирічний завідувач кафедри психології Прінстонського університету та експерта з розшифровки думок, який працює в Принстонському інституті нейробіології, пояснює, що апарати ФМРТ не настільки просунулися вперед.
Замість цього штучний інтелект змінив те, як вчені зчитують нейронні дані. Це допомогло пролити світло на давню філософську таємницю. Протягом століть вчені мріяли виявити думку всередині голови, але зіткнулися з неприємним питанням про те, що означає для думок існувати у фізичному просторі.
Коли Ерасистрат, давньогрецький анатом, препарував мозок, він підозрював, що його численні складки були ключем до інтелекту, але він не міг сказати, як думки були упаковані в цю заплутану масу.
У сімнадцятому столітті Декарт припустив, що психічне життя виникає в шишкоподібній залозі, але у нього не було хорошої теорії про те, що там можна знайти. Наші ментальні світи містять все, від смаку поганого вина до ідеї поганого смаку. Як може стільки думок вміститися в декількох кілограмах живої тканини?
Тепер, пояснив Норман, дослідники розробили математичний спосіб розуміння думок. Спираючись на ідеї машинного навчання, вони представляли думки як сукупність точок в щільному “смисловому просторі”.
Вони могли бачити, як ці точки взаємопов’язані і кодуються нейронами. Зламавши код, вони почали проводити інвентаризацію розуму. “Простір можливих думок, про які можуть думати люди, великий, але він не нескінченно великий”, – сказав Норман. Детальна карта концепцій в нашій свідомості незабаром може опинитися в межах досяжності.
Норман проводить експерименти по розшифровці думок разом з аспірантом на ім’я Маной Кумар. Вони сканером фМРТ показують пацієнтам слайд-шоу зі стандартними зображеннями: порожній пляж, печера, ліс.
“Ми хочемо отримати патерни мозку, які пов’язані з різними підкласами сцен”, – сказав Норман.
Поки піддослідний дивиться слайд-шоу, сканер відстежує патерни активації його нейронів. Ці закономірності будуть проаналізовані з точки зору “вокселів” – областей активації розміром приблизно в кубічний міліметр.
Дані фМРТ надзвичайно грубі: кожен воксел представляв споживання кисню приблизно мільйоном нейронів і міг оновлюватися тільки кожні кілька секунд – значно повільніше, ніж спрацьовують нейрони. Але, сказав Норман, “виявилося, що ця інформація містилася в даних, які ми збирали – ми просто не були настільки розумні, наскільки могли, в тому, як ми обробляли ці дані”.
Прорив стався, коли дослідники з’ясували, як відстежувати патерни, відтворені в десятках тисяч вокселів одночасно: так якби кожен воксел був клавішею на піаніно, а думки були акордами.
Секретний соус сучасного штучного інтелекту
Витоки цього підходу, якому вже майже сімдесят років, сходять до роботи психолога на ім’я Чарльз Осгуд. Коли він був дитиною, Осгуд отримав в подарунок екземпляр Тезауруса Роже. Вивчаючи книгу, Осгуд згадував, що у нього склався “яскравий образ слів у вигляді скупчень зіркоподібних точок у величезному просторі”.
В аспірантурі, коли його колеги обговорювали, як культура може впливати на пізнання, Осгуд згадав про цей образ. Він задався питанням, чи можна, використовуючи ідею “семантичного простору”, відобразити відмінності між різними стилями мислення.
Осгуд провів експеримент. Він попросив людей оцінити двадцять концепцій по п’ятдесяти різних шкалах. Поняття варіювалися в широких межах. Ідея полягала в тому, що метод дозволить виявити тонкі і навіть невловимі відтінки подібності та відмінності між концепціями.
“Більшість англомовних американців відчувають, що між “хорошим” і “приємним” є якась різниця, але це важко пояснити”, – написав Осгуд. Його опитування показали, що, принаймні, для студентів коледжу п’ятдесятих років дев’ятнадцятого століття, ці дві концепції більшу частину часу збігалися. Вони розходилися для іменників, які мали чоловічий або жіночий ухил.
Осгуд став відомий не результатами своїх опитувань, а методом, який він винайшов для їх аналізу. Він почав з того, що розмістив свої дані в уявному просторі з п’ятдесятьма вимірами – одне для справедливого-несправедливого, друге для гарячого-холодного, третє для ароматного-брудного і так далі. Будь-яка дана концепція, така як ТОРНАДО, мала рейтинг у кожному вимірі і, отже, перебувала в так званому багатовимірному просторі.
Осгуд зміг відобразити всі концепції в просторі всього з трьома вимірами. Перший вимір був “оціночним” – суміш таких шкал, як хороший-поганий, красивий-потворний і добрий-жорстокий. Другий був пов’язаний з “потенцією”: він консолідував такі масштаби, як великий-маленький і сильний-слабкий. Третій вимірював, наскільки “активною” або “пасивною” була концепція.
Протягом десятиліть методика Осгуда знаходила скромне застосування в свого роду тесті особистості. Його справжній потенціал проявився лише у вісімдесятих роках минулого століття, коли дослідники з Bell Labs намагалися вирішити те, що вони називали “проблемою словникового запасу”.
Люди, як правило, використовують безліч назв для одного і того ж. Це було перешкодою для користувачів комп’ютерів, які отримували доступ до програм, вводячи слова в командному рядку. Джордж Фурнас, який працював у групі взаємодії людини і комп’ютера організації, описав, як користувався внутрішньою телефонною книгою компанії.
“Ви знаходитесь у своєму офісі В Bell Labs, і хтось вкрав ваш калькулятор, – сказав він. – Ви починаєте додавати “поліція”, або “підтримка”, або “крадіжка”, і це не дає вам того, чого ви хочете. Нарешті, ви включаєте “безпеку”, і це дає вам це. Але насправді це дає вам дві речі: щось про план економії та безпеки Bell, а також те, що ви шукаєте”. Група Фурнаса хотіла автоматизувати пошук синонімів для команд і пошукових термінів.
Вони оновили підхід Осгуда. Замість опитування студентів вони використовували комп’ютери для аналізу слів приблизно в двох тисячах технічних звітів. У самих звітах – за темами, починаючи від теорії графів і закінчуючи дизайном інтерфейсу – пропонувалися розміри простору; коли в декількох звітах використовувалися однакові групи слів, їх розміри можна було об’єднати.
Зрештою, дослідники Bell Labs створили простір, який був більш складним, ніж у Осгуда. Дослідники назвали свою техніку “прихованим семантичним аналізом”, або L. S. A.
Спочатку Bell Labs використовувала L. S. A. для створення кращої внутрішньої пошукової системи. Потім, у 1997 році, Сьюзан Дюме, одна з колег Фурнаса, співпрацювала з вченим-когнітивістом Bell Labs Томасом Ландауером, щоб розробити систему штучного інтелекту на її основі.
Після обробки американської академічної енциклопедії Грольє, роботи, призначеної для молодих студентів, штучний інтелект набрав гідний результат в тесті з декількома варіантами відповідей з англійської мови як іноземної.
У наступні роки вчені застосовували L. S. A. до все більших наборів даних. У 2013 році дослідники з Google запустили його нащадка в текст всієї Всесвітньої павутини. Алгоритм Google перетворив кожне слово в “вектор” або точку в багатовимірному просторі. Вектори, створені програмою дослідників word2vec, є надзвичайно точними: якщо ви візьмете вектор для ” короля “і віднімете вектор для” чоловіка”, а потім додайте вектор для” жінки”, найближчим найближчим вектором буде”королева”.
Вектори слів стали основою значно покращеного Google Translate і включили автоматичне завершення пропозицій в Gmail. Інші компанії, включаючи Apple і Amazon, створили аналогічні системи.
Метью Ботвінік, професор Прінстона, який в даний час очолює відділ нейробіології в DeepMind, дочірній компанії Alphabet по штучному інтелекту, каже, що виділення подібностей і відмінностей у векторах було секретним соусом, що лежить в основі всіх досягнень штучний інтелект”.
У 2001 році вчений під назвою Джим Хаксбі приніс Машинне навчання у візуалізацію мозку. Він зрозумів, що вокселі нейронної активності можуть служити вимірами у своєрідному просторі мислення.
Хексбі продовжив працювати в Прінстоні, де співпрацював з Норманом. Двоє вчених разом з іншими дослідниками прийшли до висновку, що всього декількох сотень вимірювань достатньо, щоб вловити відтінки подібності і відмінності в більшості даних фМРТ.
Більш масштабна мета розшифровки думок полягає в тому, щоб зрозуміти, як наш мозок відображає світ. З цією метою дослідники прагнули спостерігати, як одні й ті ж переживання впливають на свідомість багатьох людей одночасно.
Норман розповів, що його колега з Прінстона Урі Хессон знайшов фільми особливо корисними в цьому відношенні. Вони “синхронно переміщують мізки людей через простір думок, – сказав Норман. – Що робить Альфреда Хічкока майстром саспенса, так це те, що у всіх людей, які дивляться фільм, одночасно вириваються мізки. Це схоже на контроль над розумом в буквальному сенсі”.
Протягом десятиліть експериментальної роботи психологи встановили важливість сценаріїв і сцен для нашого інтелекту. Увійшовши в кімнату, ви можете забути, навіщо увійшли; це відбувається, кажуть дослідники, тому що проходження через дверний отвір завершує одну уявну сцену і відкриває іншу.
І навпаки, під час навігації по новому аеропорту сценарій “посадка на літак” об’єднує різні сцени: спочатку квиткова каса, потім лінія безпеки, потім ворота, потім прохід, потім ваше місце. І все ж до недавнього часу було неясно, що ви знайдете, якщо почнете шукати “сценарії ” і” сцени ” в мозку.
Прагнення до перекладача думок
Подібно до Монті та Оуена з пацієнтом 23, сьогоднішні дослідники, що займаються розшифровкою думок, в основному шукають конкретні думки, які були визначені заздалегідь. Але “універсальний декодер думок” є наступним логічним кроком для дослідження. Такий пристрій міг би вимовляти вголос думки людини, навіть якщо ці думки ніколи не спостерігалися в апараті фМРТ.
У 2018 році Ботвінік написав у співавторстві статтю в журналі Nature Communications під назвою”До універсального декодера лінгвістичного значення від активації мозку”. Команда Ботвініка створила примітивну систему, яка могла розшифровувати нові пропозиції, які піддослідні читали про себе. Система дізнавалася, які патерни мозку викликаються певними словами, і використовувала ці знання, щоб вгадати, які слова маються на увазі під новими патернами, з якими вона зіткнулася.
Робота в Прінстоні фінансувалася iARPA, організацією R&D., якою керує офіс директора Національної розвідки. Брендон Міннері, в той час керівник проекту iARPA за програмою представлення знань в нейронних системах, сказав мені, що у нього є кілька додатків на прикметі. Якби ви знали, як знання представлені в мозку, ви могли б розрізняти початківців і досвідчених агентів розвідки. Ви могли б навчитися більш ефективно викладати мови, побачивши, наскільки близько ментальне уявлення студента про слово відповідає уявленню носія мови.
Корпорації хочуть заробляти на думках
Джек Галлант, професор Берклі, припустив, що технологія майбутнього – це портативний капелюх, схожий на мислячий капелюх. Він уявив собі компанію, яка платить людям тридцять тисяч доларів на рік за те, щоб вони носили мислячий капелюх разом з окулярами для відеозапису та іншими датчиками, що дозволяють системі записувати все, що вони бачать, чують і думають, в кінцевому рахунку створюючи вичерпну інвентаризацію розуму.
Одягнувши мислячий капелюх, ви могли б задати своєму комп’ютеру питання, просто представивши слова. Можливий миттєвий переклад. Пара власників могла б взагалі відмовитися від мови, спілкуючись безпосередньо, розум до розуму.
«Це вимагатиме певної технологічної революції», – сказав Галлант. Тим не менш, концептуальний фундамент, який сходить до п’ятдесятих років дев’ятнадцятого століття, був закладений.
У певному сенсі історія розшифровки думок нагадує історію нашого розуміння гена. Протягом приблизно ста років після публікації книги Чарльза Дарвіна “про походження видів” в 1859 році ген був абстракцією, що розуміється тільки як щось, через що риси передаються від батьків до дитини.
Ще в п’ятдесятих роках минулого століття біологи все ще задавалися питанням, з чого саме складається ген. Коли Джеймс Уотсон і Френсіс Крік нарешті знайшли подвійну спіраль в 1953 році, стало ясно, як гени приймають фізичну форму. П’ятдесят років потому ми могли б розшифрувати геном людини; сьогодні ми можемо його відредагувати.
Думки були абстракцією набагато довше. Але тепер ми знаємо, що це насправді: шаблони нейронної активації, що відповідають точкам у просторі значень.
Розум – єдине по-справжньому персональне місце – став доступний для огляду ззовні. У майбутньому психотерапевт, який бажає зрозуміти, як складаються ваші відносини, може вивчити розміри патернів, в які потрапляє ваш мозок.
При більш тонкому контролі розум можна було направляти куди завгодно. Звичайно, ми вже робимо це, думаючи, читаючи, спостерігаючи, розмовляючи.
За матеріалами: New Yorker