П’ятниця, 22 Листопада, 2024

Чому штучний інтелект не допоміг людям заговорити з тваринами?

Штучний інтелект виявився чудовим інструментом для визначення непомітних людині закономірностей. Завдяки цьому він генерує тексти, шукає нові ліки та матеріали, пише комп’ютерні програми та навіть вигадує свою мову. Очікувалося також, що штучний інтелект стане перекладачем з людської мови на мову тварин і навпаки, дозволивши нам повноцінно розмовляти з собаками, котами тощо. Але виявилося, що всі 6500 людських мов легше перекладати, ніж те, що виходить із зяблика.

Людям завжди було цікаво, що відбувається в головах тварин. Згадайте лише Доктора Дуліттла, про якого було вперше було опубліковано в 1920 році. Але і задовго до цього люди цікавилися мовою тварин. Греко-римська література рясніє розмовами з тваринами, наприклад, у еподі Архілоха «Лис і орел». Письменники в Китаї епохи Чжаньго регулярно приписували мову певним видам тварин. Такі прояви також поширені в індійській, єгипетській, єврейській та індіанській традиціях оповідання.

Навіть сьогодні популярна західна культура забавляється ідеєю розмовляючих тварин, дещо осучаснивши її основу: тварини починають розмовляти завдяки технологіям, а не надприродній силі чи магії. Дельфіни з Seaquest DSV і «Джонні Мнемоніка» спілкувалися зі своїми двоногими сучасниками за допомогою передових пристроїв перекладу, як це робив собака Dug з Up .

У нас уже є системи машинного навчання та процесори природної мови, які можуть перекладати людську мову на будь-яку іншу існуючу людську мову.

Може здатися, що адаптація цієї технології для перетворення звуків тварин у людські слова не є такою вже й складною. Однак виявилося, що у нас ще багато роботи, перш ніж ми зможемо спілкуватися з природою.

Що таке мова?

«Усе живе спілкується», — стверджувала міждисциплінарна група дослідників у статті « Про розуміння природи та еволюції соціального пізнання: потреба у вивченні комунікації».

«Комунікація передбачає дію або характеристику однієї особи, яка впливає на поведінку, поведінкові тенденції або фізіологію принаймні однієї іншої особи таким чином, як правило, пристосовуючись до обох», – писали вони.

Починаючи з мікробів, грибів і рослин на еволюційних сходах, науці ще належить знайти організм, який існує в такій крайній ізоляції, щоб не мати природних засобів спілкування з навколишнім світом. Але ми повинні чітко розуміти, що «спілкування» і «мова» — це дві дуже різні речі.

«Жодна інша система природного спілкування не схожа на людську мову», — стверджує Лінгвістичне товариство Америки. Мова дозволяє нам висловлювати наші внутрішні думки та передавати інформацію, а також просити або навіть вимагати її.

«На відміну від будь-якої іншої системи зв’язку з тваринами, вона містить вираз для заперечення — що не так… Системи спілкування з тваринами, навпаки, зазвичай мають щонайбільше кілька десятків окремих сигналів, і вони використовуються лише для повідомлення про нагальні проблеми, такі як їжа, небезпека, загроза або примирення», – пишуть дослідники.

Це не означає, що домашні тварини нас не розуміють. «Ми знаємо, що собаки та коти можуть точно реагувати на широкий спектр людських слів, якщо у них є попередній досвід роботи з цими словами та відповідні результати, — сказала доктор Монік Уделл, директор лабораторії взаємодії людей і тварин Університету штату Орегон. – У багатьох випадках ці асоціації засвоюються через базові умови». Наприклад, коли ми кричимо «вечеря» перед тим, як розставляти миски з їжею.

Чи розуміють наші собаки та коти справді, що означає «обід», поза миттєвою реакцією Павлова? Це ще належить побачити.

«Ми знаємо, що принаймні деякі собаки змогли навчитися реагувати на понад 1000 людських слів (міток для об’єктів) з високим рівнем точності, — сказав доктор Уделл. – Наразі собаки є рекордсменами серед видів тварин, не пов’язаних із людиною, за здатністю надійно зіставляти людські слова з об’єктами чи діями. Але важко напевно знати, наскільки собаки розуміють намір наших слів чи дій».

Доктор Уделл продовжив: «Це тому, що коли ми вимірюємо розуміння собакою чи котом стимулу, наприклад слова, ми зазвичай робимо це на основі їхньої поведінки».

Ви можете навчити собаку сидіти як англійською, так і німецькою командами, але «якщо собака однаково реагує на слово «сидіти» англійською та німецькою мовами, найпростішим поясненням — з найменшою кількістю припущень — є те, що вони дізналися, що коли вони сидять у присутності будь-якого слова, то є приємні наслідки».

Тихо, комп’ютери говорять

Програмування природною мовою (NLP) — це галузь штучного інтелекту, яка дозволяє комп’ютерам і алгоритмічним моделям інтерпретувати текст і мову, включаючи наміри мовця, так само, як це робимо ми, звичайні люди.

Процес поєднує в собі комп’ютерну лінгвістику, яка моделює синтаксис, граматику та структуру мови, і моделі машинного навчання, які автоматично витягують, класифікують і позначають елементи текстових і голосових даних, а потім призначають статистичну ймовірність кожному можливому значенню цих даних, повідомляє IBM.

NLP лежить в основі функціональності кожного цифрового помічника на ринку. По суті, кожного разу, коли ви говорите за допомогою «розумного» пристрою, NLP перетворює ваші слова на машинно зрозумілі сигнали і навпаки.

Сфера досліджень NLP зазнала значної еволюції за останні роки, оскільки її основні системи перейшли від старіших повторюваних і звивистих нейронних мереж до архітектури Google Transformer, що значно підвищує ефективність навчання.

Доктор Ноа Д. Гудман, доцент кафедри психології, комп’ютерних наук і лінгвістики Стенфордського університету, сказав, що з мережевими підходами «ви повинні проходити час за кроком або слово за словом через дані, а потім зробіть те ж саме назад». На відміну від цього, з Transformer «ви фактично берете весь рядок слів і просуваєте їх через мережу одночасно».

«Дійсно важливо зробити це навчання ефективнішим, — продовжив доктор Гудман. – Трансформери, вони круті… але, безперечно, найголовнішим є те, що вони дозволяють ефективно навчати, а отже, навчати набагато більші моделі на набагато більшій кількості даних».

Говорильня не тільки для індиків

Незважаючи на те, що останніми роками були вивчені комунікаційні системи багатьох видів на предмет потенційно синтаксичних властивостей їхніх пісень та загальної системи попередження — жоден не продемонстрував абсолютного ступеня складності, як виклик сімейства птахів Paridae (синиці).

Доктор Джеффрі Лукас, професор кафедри біологічних наук Університету Пердью, сказав, що голос Paridae «є однією з найскладніших голосових систем, які ми знаємо. Зрештою, [велика кількість дослідницьких статей у цій галузі] показує, що це божественно складно, і проблема з документами полягає в тому, що вони дуже недооцінюють, наскільки складними є насправді [виклики]».

Ці пароподібні часто живуть у складних у соціальному плані гетероспецифічних зграях, змішаних угрупованнях, які включають кілька видів співочих птахів і дятлів.

За словами доктора Лукаса, складність соціальної системи птахів пов’язана зі збільшенням різноманітності комунікаційних систем. «Частково така кореляція існує в тому, що якщо у вас є складна соціальна система, яка є багатовимірною, вам потрібно передавати різноманітну інформацію в різних контекстах. У пташиному світі їм доводиться захищати свою територію, говорити про їжу, інтегруватися в соціальну систему [і вирішувати] проблеми спаровування».

Виклик синиці складається щонайменше з шести різних нот, створених у відкритій вокальній структурі, що є надзвичайно рідкісним явищем у нелюдських системах спілкування та є причиною складності голосу синиці.

Відкрита вокальна система означає, що «збільшення кількості записів розмов курчат постійно виявлятиме розмови з чіткими нотними композиціями, — пояснюється в дослідженні 2012 року «Зв’язок соціальної складності та складності вокалу: паридна перспектива». – Ця відкрита природа є однією з головних рис звучання пташенят і людської мови, а також однією з головних відмінностей між звуками пташенят і обмеженим репертуаром пісень більшості видів співочих птахів».

Дельфінам не потрібні королі

Навчання мовних моделей — це не просто введення великих обсягів даних. Навчаючи модель перекладати невідому мову на те, що ви говорите, ви повинні мати принаймні елементарне розуміння того, як ці дві мови співвідносяться одна з одною, щоб перекладений текст зберігав правильний намір.

«Найвагоміший тип даних, який ми можемо мати, — це так званий паралельний корпус», — пояснив д-р Гудман, який, по суті, має на увазі Розеттський камінь для двох мов. У такому випадку треба просто зіставляти конкретні слова, символи та фонеми в кожній мові — з’ясувати, що означає «ріка» чи «один бушель пшениці» в кожній, і виходити з цього.

Без цього ідеального артефакту перекладу все ще залишається можливість розробити перекладач між двома мовами. Словник між двома мовами можна створити, якщо є великі масиви текстів для обох мов.

Наявність великого масиву даних, з якими можна працювати, також дозволяє використовувати методи неконтрольованого навчання для «вилучення прихованого концептуального простору», сказав доктор Гудмен, хоча цей метод є більш ресурсомістким і менш ефективним.

Однак якщо все, що у вас є, це великий корпус тестів лише однією з мов, вам, як правило, не пощастило.

«Для більшості людських мов ми припускаємо, що [концепції квартету] начебто подібні. Наприклад, можливо, у мові немає пари «короля і королеви», але вона точно має «чоловік і жінка, — продовжив доктор Гудмен. – Але я думаю, що для спілкування тварин ми не можемо припустити, що дельфіни мають поняття «король і королева» або чи є у них «чоловіки та жінки». Я не знаю, можливо так, а може, ні».

І навіть без цього елементарного концептуального узгодження, на основі якого можна працювати, розпізнати контекст і наміри заклику тварини, тим більше, розшифрувати синтаксис, граматику та семантику основної системи спілкування — стає набагато складніше.

По суті, якщо ви можете отримати мультимодальні дані, які надають контекст для записаного заклику тварин — умови навколишнього середовища, час доби чи року, наявність здобичі чи видів хижаків тощо — ви можете «приземлити» мовні дані у фізичне середовище.

Звідси ви можете припустити, що англійська мова увійшла у фізичне середовище так само, як ця дивна нова мова увійшла у фізичне середовище, і використовувати це як своєрідний міст між мовами».

На жаль, проблема перекладу голосів птахів на людську мову потрапить прямо до четвертої категорії. Це означає, що нам знадобиться більше даних і багато різних типів даних, оскільки ми продовжимо будувати наше базове розуміння структур цих викликів з нуля. Деякі з цих зусиль уже здійснюються.

Наприклад, у проекті Dolphin Communication Project використовується комбінація мобільної відео/акустичної системи, щоб фіксувати як слова диких дельфінів, так і їхнє відносне положення у фізичному просторі в цей момент, щоб надати дослідникам додатковий контекст для звуків.

Біологічні мітки — датчики тварин, прикріплені до шкури, волосся чи рогів, які відстежують місцезнаходження та стан їхніх господарів — продовжують зменшуватися в розмірі, одночасно збільшуючись як у ємності, так і в можливостях, що повинно допомогти дослідникам зібрати ще більше даних про тваринні спільноти.

Що робити, якщо птахи просто постійно кричать про спеку?

Навіть якщо ми не зможемо відразу поспілкуватися з нашими пухнастими та пернатими сусідами, краще розуміння того, як вони спілкуються один з одним, може виявитися цінним для зусиль по збереженню природи.

Доктор Лукас вказує на нещодавнє дослідження, яке виявило, що зміни навколишнього середовища, викликані зміною клімату, можуть радикально змінити взаємодію різних видів птахів у змішаних зграях.

«Ми показали, що якщо ви подивитесь на градієнти збурень, то все зміниться, — сказав доктор Лукас. – Змінюється те, що вони роблять із простором, змінюється те, як вони взаємодіють з іншими птахами. Їхні голосові системи змінюються».

«Соціальна взаємодія для птахів взимку надзвичайно важлива, тому що ви знаєте, 10-грамовий птах — якщо він не їсть за день, він мертвий, — продовжив доктор Лукас. – Тому інформація про їхнє оточення є надзвичайно важливою. І що ці зграї змішаних видів роблять, так це надають частину цієї інформації».

Однак ця мережа швидко руйнується, оскільки середовище існування деградує, і щоб вижити, птахи повинні пройти через досить екстремальні зміни в поведінці, соціальних системах і голосових системах… але це впливає на рівень народжуваності та їхню здатність годувати своїх дітей.

Краще розуміння тваринних звуків допоможе нам краще зрозуміти їхній рівень стресу, який може служити як зусиллям із збереження природи, так і цілям сільського господарства.

«Ідея полягає в тому, що ми можемо отримати уявлення про рівень стресу у [сільськогосподарських тварин], а потім використовувати це як індекс того, що відбувається в корівнику, і чи можемо ми навіть пом’якшити це за допомогою вокалізації, — сказав доктор Лукас. – Імовірно, штучний інтелект допоможе нам це зробити».

Ян Броучек з Науково-дослідного інституту тваринництва Нітра зазначив у 2014 році: «Особливо тривалі звуки можуть вплинути на здоров’я тварин. Шум безпосередньо впливає на репродуктивну фізіологію або споживання енергії».

Навпаки, дослідження 2021 року «Вплив музики на худобу: велику рогату худобу, птицю та свиней» показало, що відтворення музики допомагає заспокоїти худобу та зменшити стрес під час інтенсивного виробництва. Ми можемо виміряти це зниження стресу на основі того, які щасливі звуки видають ці тварини. Подібно до слухання музики іншою мовою, ми можемо сприймати атмосферу, навіть якщо не розуміємо слова

За матеріалами: Engadget

Євген
Євген
Євген пише для TechToday з 2012 року. Інженер за освітою. Захоплюється реставрацією старих автомобілів.

Vodafone

Залишайтеся з нами

10,052Фанитак
1,445Послідовникислідувати
105Абонентипідписуватися