Как ИИ от Google раскрывает секреты коммуникации дельфинов

Дельфин в океане, окруженный пузырями, говорят через звук. Вдали виден научный корабль с антеннами.

Дельфины известны своим интеллектом, сложным социальным поведением и изощренными системами коммуникации. На протяжении многих лет ученые и любители животных были очарованы идеей о том, обладают ли дельфины языком, похожим на человеческий. В последние годы искусственный интеллект (ИИ) открыл новые захватывающие возможности для исследования этого вопроса. Одним из самых инновационных достижений в этой области стало сотрудничество Google и проекта Wild Dolphin Project (WDP) по созданию DolphinGemma — ИИ-модели, предназначенной для анализа вокализаций дельфинов. Этот прорыв может не только помочь расшифровать коммуникацию дельфинов, но и потенциально проложить путь к двустороннему взаимодействию с этими удивительными созданиями.

Роль ИИ в понимании звуков дельфинов

Дельфины общаются с помощью комбинации щелчков, свистов и движений тела. Эти звуки различаются по частоте и интенсивности, что может сигнализировать о разных сообщениях в зависимости от социального контекста, например, при поиске пищи, спаривании или взаимодействии с другими особями. Несмотря на годы изучения, понимание полного спектра этих сигналов оказалось сложной задачей. Традиционные методы наблюдения и анализа не справляются с огромным количеством данных, генерируемых вокализациями дельфинов, что затрудняет извлечение полезной информации.

ИИ помогает преодолеть эту проблему, используя алгоритмы машинного обучения и обработки естественного языка (NLP) для анализа больших объемов данных о звуках дельфинов. Эти модели могут выявлять закономерности и связи в вокализациях, которые недоступны человеческому уху. ИИ может различать различные типы звуков дельфинов, классифицировать их на основе характеристик и связывать определенные звуки с конкретным поведением или эмоциональными состояниями. Например, исследователи заметили, что определенные свисты, по-видимому, связаны с социальными взаимодействиями, в то время как щелчки обычно связаны с навигацией или эхолокацией.

Хотя ИИ обладает большим потенциалом в расшифровке звуков дельфинов, сбор и обработка огромных объемов данных от групп дельфинов и обучение моделей ИИ на таком большом наборе данных остаются значительными проблемами. Для решения этих задач Google и WDP разработали DolphinGemma — модель ИИ, специально созданную для анализа коммуникации дельфинов. Модель обучается на обширных наборах данных и способна обнаруживать сложные закономерности в вокализациях дельфинов.

Понимание DolphinGemma

DolphinGemma построена на основе Google Gemma — генеративной модели ИИ с открытым исходным кодом, содержащей около 400 миллионов параметров. DolphinGemma предназначена для изучения структуры вокализаций дельфинов и генерации новых звуковых последовательностей, похожих на дельфиньи. Разработанная в сотрудничестве с WDP и Georgia Tech, модель использует набор данных вокализаций атлантических пятнистых дельфинов, которые собираются с 1985 года. Модель использует технологию Google SoundStream для токенизации этих звуков, что позволяет ей предсказывать следующий звук в последовательности. Подобно тому, как языковые модели генерируют текст, DolphinGemma предсказывает звуки, которые могут издавать дельфины, что помогает ей определять закономерности, которые могли бы представлять грамматику или синтаксис в коммуникации дельфинов.

Эта модель даже может генерировать новые звуки, похожие на дельфиньи, аналогично тому, как предиктивный текст предлагает следующее слово в предложении. Эта способность может помочь определить правила, регулирующие коммуникацию дельфинов, и предоставить информацию о том, образуют ли их вокализации структурированный язык.

DolphinGemma в действии

Особенно эффективной DolphinGemma делает ее способность работать на таких устройствах, как смартфоны Google Pixel, в режиме реального времени. Благодаря своей легкой архитектуре модель может функционировать без необходимости в дорогостоящем, специализированном оборудовании. Исследователи могут записывать звуки дельфинов непосредственно на свои телефоны и немедленно анализировать их с помощью DolphinGemma. Это делает технологию более доступной и помогает снизить затраты на исследования.

Кроме того, DolphinGemma интегрирована в систему CHAT (Cetacean Hearing Augmentation Telemetry), которая позволяет исследователям воспроизводить синтетические звуки, похожие на дельфиньи, и наблюдать за реакцией. Это может привести к развитию общего словаря, обеспечивающего двустороннюю связь между дельфинами и людьми.

Если вы интересуетесь применением ИИ в различных областях коммуникации и хотите создать собственного умного ассистента, стоит изучить, как работают AI агенты и как они могут трансформировать взаимодействие между человеком и технологиями.

Более широкие последствия и будущие планы Google

Разработка DolphinGemma важна не только для понимания коммуникации дельфинов, но и для продвижения исследований когнитивных способностей и коммуникации животных. Расшифровывая вокализации дельфинов, исследователи могут получить более глубокое представление о социальных структурах дельфинов, их приоритетах и процессах мышления. Это не только может улучшить усилия по сохранению видов благодаря пониманию потребностей и проблем дельфинов, но также имеет потенциал для расширения наших знаний об интеллекте и сознании животных.

DolphinGemma является частью более широкого движения, использующего ИИ для изучения коммуникации животных, с аналогичными усилиями, предпринимаемыми для таких видов, как вороны, киты и сурикаты. Google планирует выпустить DolphinGemma как открытую модель для исследовательского сообщества, с целью расширения ее применения на другие виды китообразных, такие как афалины или дельфины-вертуны, путем дальнейшей доработки. Такой подход с открытым исходным кодом будет стимулировать глобальное сотрудничество в исследованиях коммуникации животных.

Проблемы и научный скептицизм

Несмотря на свой потенциал, DolphinGemma также сталкивается с несколькими проблемами. На океанические записи часто влияет фоновый шум, что затрудняет анализ звука. Тад Старнер из Georgia Tech, исследователь, участвующий в этом проекте, отмечает, что большая часть данных включает фоновые звуки океана, требующие продвинутых методов фильтрации. Некоторые исследователи также сомневаются, можно ли действительно считать коммуникацию дельфинов языком. Например, зоолог Арик Кершенбаум предполагает, что, в отличие от сложной природы человеческого языка, вокализации дельфинов могут быть более простой системой сигналов. Tea Тейлор, директор проекта Sussex Dolphin Project, выражает обеспокоенность по поводу риска непреднамеренного обучения дельфинов имитации звуков. Эти перспективы подчеркивают необходимость строгой проверки и тщательной интерпретации результатов, полученных с помощью ИИ.

Итог

Исследование Google в области коммуникации дельфинов с использованием ИИ — это новаторское усилие, которое приближает нас к пониманию сложных способов взаимодействия дельфинов между собой и с окружающей средой. С помощью искусственного интеллекта исследователи обнаруживают скрытые закономерности в звуках дельфинов, предлагая новые идеи о их системах коммуникации. Хотя проблемы остаются, достигнутый на сегодняшний день прогресс подчеркивает потенциал ИИ в исследованиях поведения животных. По мере развития этих исследований они могут открыть двери к новым возможностям в области охраны природы, изучения когнитивных способностей животных и взаимодействия человека с животными.