Искусственный интеллект оказался отличным инструментом для определения незаметных человеку закономерностей. Благодаря этому он генерирует тексты, ищет новое лекарство и материалы, пишет компьютерные программы и даже придумывает свой язык. Ожидалось также, что искусственный интеллект станет переводчиком с человеческого языка на язык животных и наоборот, позволив нам полноценно разговаривать с собаками, котами и т.д. Но оказалось, что все 6500 человеческих языков легче переводить, чем то, что выходит из зяблика.
Людям всегда было интересно, что происходит у изголовья животных. Вспомните только Доктора Дулиттла, о котором впервые было опубликовано в 1920 году. Но и задолго до этого люди интересовались языком животных. Греко-римская литература изобилует разговорами с животными, например, в эпиде Архилоха «Лис и орел». Писатели в Китае эпохи Чжаньго регулярно приписывали язык определенным видам животных. Такие проявления также распространены в индийской, египетской, еврейской и индейской традициях повествования.
Даже сегодня популярная западная культура забавляется идеей говорящих животных, несколько осовременив ее основу: животные начинают разговаривать благодаря технологиям, а не сверхъестественной силе или магии. Дельфины из Seeste DSV и «Джонни Мнемоника» общались со своими двуногими современниками с помощью передовых устройств перевода, как это делала собака Dug из Up.
У нас уже есть системы машинного обучения и процессоры естественного языка, которые могут переводить человеческий язык на любой другой существующий человеческий язык.
Может показаться, что адаптация этой технологии для превращения звуков животных в человеческие слова не так уж сложна. Однако оказалось, что у нас еще много работы прежде, чем мы сможем общаться с природой.
Что такое язык?
«Все живое общается», — утверждала междисциплинарная группа исследователей в статье «О понимании природы и эволюции социального познания: потребность в изучении коммуникации».
«Коммуникация предусматривает действие или характеристику одного лица, влияющего на поведение, поведенческие тенденции или физиологию по крайней мере одного другого лица таким образом, как правило, приспосабливаясь к обоим», — писали они.
Начиная с микробов, грибов и растений на эволюционной лестнице, науке еще предстоит найти организм, существующий в такой крайней изоляции, чтобы не иметь естественных средств общения с окружающим миром. Но мы должны четко понимать, что «общение» и «язык» — две очень разные вещи.
«Ни одна другая система естественного общения не похожа на человеческий язык», — утверждает Лингвистическое общество Америки. Язык позволяет нам выражать наши внутренние мнения и передавать информацию, а также просить или даже потребовать ее.
«В отличие от любой другой системы связи с животными она содержит выражение для отрицания — что не так… Системы общения с животными, наоборот, обычно имеют не более нескольких десятков отдельных сигналов, и они используются только для сообщения о насущных проблемах, такие как еда, опасность, угроза или примирение», – пишут исследователи.
Это не значит, что домашние животные нас не понимают. «Мы знаем, что собаки и кошки могут точно реагировать на широкий спектр человеческих слов, если у них есть опыт работы с этими словами и соответствующие результаты, — сказала доктор Моник Уделл, директор лаборатории взаимодействия людей и животных Университета штата Орегон. – Во многих случаях эти ассоциации усваиваются из-за базовых условий». К примеру, когда мы кричим «ужин» перед тем, как расставлять миски с едой.
Понимают ли наши собаки и кошки действительно, что означает «обед» вне мгновенной реакции Павлова? Это еще предстоит увидеть.
«Мы знаем, что, по крайней мере, некоторые собаки смогли научиться реагировать на более 1000 человеческих слов (меток для объектов) с высоким уровнем точности, — сказал доктор Уделл. — Пока собаки являются рекордсменами среди видов животных, не связанных с человеком, по способности надежно сопоставлять человеческие слова с объектами или действиями. Но трудно точно знать, насколько собаки понимают намерение наших слов или действий».
Доктор Уделл продолжил: «Это потому, что, когда мы измеряем понимание собакой или котом стимула, например слова, мы обычно делаем это на основе их поведения».
Вы можете научить собаку сидеть как на английском, так и на немецком командах, но «если собака одинаково реагирует на слово «сидеть» на английском и немецком языках, самым простым объяснением – с наименьшим количеством предположений – является то, что они узнали, что когда они сидят в присутствии любого слова, это приятные последствия».
Тихо, компьютеры говорят
Программирование на естественном языке (NLP) – это отрасль искусственного интеллекта, которая позволяет компьютерам и алгоритмическим моделям интерпретировать текст и язык, включая намерения говорящего, так же, как это делаем мы, обычные люди.
Процесс сочетает в себе компьютерную лингвистику, моделирующую синтаксис, грамматику и структуру языка, и модели машинного обучения, автоматически извлекающие, классифицирующие и обозначающие элементы текстовых и голосовых данных, а затем назначающие статистическую вероятность каждому возможному значению этих данных, сообщает IBM.
NLP лежит в базе функциональности каждого цифрового ассистента на рынке. В сущности, всякий раз, когда вы говорите с помощью «умного» устройства, NLP превращает ваши слова в машинно понятные сигналы и наоборот.
Сфера исследований NLP претерпела значительную эволюцию за последние годы, поскольку ее основные системы перешли от более старых повторяющихся и извилистых нейронных сетей к архитектуре Google Transformer, что значительно повышает эффективность обучения.
Доктор Ноа Д. Гудман, доцент кафедры психологии, компьютерных наук и лингвистики Стэнфордского университета, сказал, что с сетевыми подходами «вы должны проходить время за шагом или слово за словом через данные, а затем сделайте то же самое обратно». В отличие от этого, с Transformer «вы фактически берете всю строчку слов и продвигаете их через сеть одновременно».
«Действительно важно сделать это обучение более эффективным, — продолжил доктор Гудман. — Трансформеры, они крутые… но, безусловно, самое главное, что они позволяют эффективно обучать, а значит, обучать гораздо большие модели на гораздо большем количестве данных».
Говоритель не только для индеек
Несмотря на то, что в последние годы были изучены коммуникационные системы многих видов на предмет потенциально синтаксических свойств их песен и общей системы предупреждения, ни один не продемонстрировал абсолютной степени сложности, как вызов семейства птиц Paridae (синицы).
Доктор Джеффри Лукас, профессор кафедры биологических наук Университета Пердью, сказал, что голос Paridae является одной из самых сложных голосовых систем, которые мы знаем. В конце концов, [большое количество исследовательских статей в этой области] показывает, что это божественно сложно, и проблема с документами заключается в том, что они очень недооценивают, насколько сложны на самом деле [вызовы]».
Эти парообразные часто живут в сложных в социальном плане гетероспецифических стаях, смешанных группировках, включающих несколько видов певчих птиц и дятлов.
По словам доктора Лукаса, сложность социальной системы птиц связана с увеличением разнообразия коммуникационных систем. «Отчасти такая корреляция существует в том, что если у вас есть сложная социальная система, которая многомерна, вам нужно передавать разнообразную информацию в разных контекстах. В птичьем мире им приходится защищать свою территорию, говорить о еде, интегрироваться в социальную систему и решать проблемы спаривания».
Вызов синицы состоит, по меньшей мере, из шести различных нот, созданных в открытой вокальной структуре, что является редким явлением в бесчеловечных системах общения и является причиной сложности голоса синицы.
Открытая вокальная система означает, что «увеличение количества записей разговоров цыплят будет постоянно проявлять разговоры с четкими нотными композициями, — объясняется в исследовании 2012 года «Связь социальной сложности и сложности вокала: паридная перспектива». – Эта открытая природа является одной из главных черт звучания птенцов и человеческого языка, а также одним из главных отличий между звуками птенцов и ограниченным репертуаром песен большинства видов певчих птиц».
Дельфинам не нужны короли
Обучение языковым моделям – это не просто ввод больших объемов данных. Обучая модель переводить неизвестный язык на то, что вы говорите, вы должны иметь по крайней мере элементарное понимание того, как эти два языка соотносятся друг с другом, чтобы переведенный текст сохранял правильное намерение.
«Самый весомый тип данных, который мы можем иметь, – это так называемый параллельный корпус», – объяснил д-р Гудман, который, по сути, подразумевает Розеттский камень для двух языков. В таком случае нужно просто сопоставлять конкретные слова, символы и фонемы в каждом языке – выяснить, что означает «река» или «один бушель пшеницы» в каждой, и исходить из этого.
Без этого идеального артефакта перевода все еще остается возможность разработать переводчик между двумя языками. Словарь между двумя языками можно создать, если есть большие массивы текстов для обоих языков.
Наличие большого массива данных, с которыми можно работать, также позволяет использовать методы неконтролируемого обучения для «извлечения скрытого концептуального пространства», сказал доктор Гудмен, хотя этот метод более ресурсоемкий и менее эффективный.
Однако если все, что у вас есть, это большой корпус тестов только на одном из языков, вам, как правило, не повезло.
«Для большинства человеческих языков мы предполагаем, что [концепции квартета] вроде бы подобны. Например, возможно, в языке нет пары «короля и королевы», но у нее точно есть «мужчина и женщина», — продолжил доктор Гудмен. – Но я думаю, что для общения животных мы не можем предположить, что дельфины имеют понятие «король и королева» или есть ли у них «мужчины и женщины». Я не знаю, возможно да, а может, нет».
И даже без этого элементарного концептуального согласования, на основе которого можно работать, распознать контекст и намерения призыва животного, тем более расшифровать синтаксис, грамматику и семантику основной системы общения становится намного сложнее.
По сути, если вы можете получить мультимодальные данные, предоставляющие контекст для записанного призыва животных — условия окружающей среды, время суток или года, наличие добычи или видов хищников и т.д. — вы можете «приземлить» языковые данные в физическую среду.
Отсюда вы можете предположить, что английский язык вошел в физическую среду так же, как этот странный новый язык вошел в физическую среду, и использовать это как своеобразный мост между языками».
К сожалению, проблема перевода голосов птиц на человеческий язык попадет прямо в четвертую категорию. Это значит, что нам понадобится больше данных и много разных типов данных, поскольку мы продолжим строить наше базовое понимание структур этих вызовов с нуля. Некоторые из этих усилий уже предпринимаются.
К примеру, в проекте Dolphin Communication Project используется комбинация мобильной видео/акустической системы, чтобы фиксировать как слова диких дельфинов, так и их относительное положение в физическом пространстве в данный момент, чтобы предоставить исследователям дополнительный контекст для звуков.
Биологические метки — датчики животных, прикрепленные к шкуре, волосам или рогам, отслеживающие местонахождение и состояние их хозяев — продолжают уменьшаться в размере, одновременно увеличиваясь как в емкости, так и в возможностях, что должно помочь исследователям собрать еще больше данных о животных сообществе.
Что делать, если птицы просто постоянно кричат ??о жаре?
Даже если мы не сможем сразу пообщаться с нашими пушистыми и пернатыми соседями, лучшее понимание того, как они общаются друг с другом, может оказаться ценным для усилий по сохранению природы.
Доктор Лукас указывает на недавнее исследование, обнаружившее, что изменения окружающей среды, вызванные изменением климата, могут радикально изменить взаимодействие различных видов птиц в смешанных стаях.
«Мы показали, что если вы посмотрите на градиенты возмущений, то все изменится, – сказал доктор Лукас. — меняется то, что они делают с пространством, меняется то, как они взаимодействуют с другими птицами. Их голосовые системы меняются».
«Социальное взаимодействие для птиц зимой чрезвычайно важно, потому что вы знаете, 10-граммовая птица — если она не ест за день, она мертва, — продолжил доктор Лукас. — Поэтому информация об их окружении чрезвычайно важна. И что эти стаи смешанных видов делают, так это дает часть этой информации».
Однако эта сеть быстро разрушается, поскольку среда обитания деградирует, и чтобы выжить, птицы должны пройти через достаточно экстремальные изменения в поведении, социальных системах и голосовых системах… но это влияет на уровень рождаемости и способность кормить своих детей.
Лучшее понимание животных звуков поможет нам лучше понять их уровень стресса, который может служить как усилиям по сохранению природы, так и целям сельского хозяйства.
«Идея состоит в том, что мы можем получить представление об уровне стресса у [сельскохозяйственных животных], а затем использовать это как индекс происходящего в коровнике, и можем ли мы даже смягчить это с помощью вокализации, — сказал доктор Лукас. . – Вероятно, искусственный интеллект поможет нам это сделать».
Ян Броучек из Научно-исследовательского института животноводства Нитра отметил в 2014 году: «Особенно длительные звуки могут повлиять на здоровье животных. Шум оказывает непосредственное влияние на репродуктивную физиологию или потребление энергии».
Напротив, исследование 2021 года «Влияние музыки на скот: крупный рогатый скот, птицу и свиней» показало, что воспроизведение музыки помогает успокоить скот и снизить стресс во время интенсивного производства. Мы можем измерить это снижение стресса на основе того, какие счастливые звуки издают эти животные. Подобно слушанию музыки на другом языке, мы можем воспринимать атмосферу, даже если не понимаем слова
По материалам: Engadget