啥?竟然想用“海豚语”教会海豚什么是围巾?

在本月14日的世界海豚日,谷歌宣布,他们开发了一个帮助解码海豚交流的人工智能模型:DolphinGemma

这是第一个尝试理解海豚语言的大语言模型。他们不仅想知道海豚到底在说什么,还试图创造出豚言豚语来和海豚交流。

AI真的能让我们跟海豚说上话吗?

他们对海豚做了什么

DolphinGemma是谷歌与“野生海豚计划”(Wild Dolphin Project,WDP)合作开发的。

WDP是一个非盈利的研究机构,他们从1985年开始,一直在追踪巴哈马的大西洋斑海豚,收集了长达数十年的单个海豚的水下视频和音频,以及海豚的生活史和行为。

一只海豚一边觅食一边看着幼崽,她会用独特的哨音叫孩子回来,右图为这种哨音的可视化频谱图|DolphinGemma

WDP的音频数据库里,有一半是海洋噪音,剩下的则是海豚经常发出的三类声音。WDP根据几十年的观察,将一些声音与特定的行为情境匹配了起来:

DolphinGemma是一个音频输入、音频输出的模型。它先利用WDP的音频数据库进行训练,通过分析自然环境下海豚声音序列的模式和结构,最终预测出序列的下一个声音——就像打字的时候,输入法会联想你下一步想打什么字一样。

DolphinGemma在早期测试阶段产生的哨音(左)和爆裂脉冲(右)的可视化频谱。DolphinGemma将海豚的自然声音编码为声学单元进行处理,并输出生成新的模拟海豚声音的音频序列|DolphinGemma

此外,谷歌和WDP还试图创造一些新的语言来跟海豚交流。他们与佐治亚理工学院(Georgia Institute of Technology)合作,开发了一个名为“鲸类动物听力增强遥感”(Cetacean Hearing Augmentation Telemetry,CHAT)的系统。

摁一下面板上的按钮会发出特定的声音,用“海豚语”教海豚说海草这个词|DolphinGemma

这是一台水下计算机,研究者利用它发出一些类似海豚的声音,并将这些词汇与特地的物品联系起来(比如海藻、海草、研究者的围巾)。

他们背着这个计算机来到水下,当研究者A使用CHAT发出某个声音时,研究者B会将对应的物品递给A——他们希望,围观这一来回互动的海豚可以明白这种模式,并且模仿出这个声音。DolphinGemma则可以帮助预测和识别海豚的模仿,以便于研究者迅速地对海豚的模仿给予反馈,从而实现与海豚的交流。

比如,研究者A使用CHAT发出代表围巾的音,研究者B会将围巾递给A。研究者设想海豚在偷偷观察后会学会“围巾”怎么说|DolphinGemma

WDP今年将在野外应用DolphinGemma。这个模型仅有约400M,直接在谷歌推出的Pixel手机上就能运行,这能适应水下环境便于实地应用。研究团队希望,DolphinGemma可以通过识别反复出现的声音模式和序列,帮助研究人员发现海豚自然交流中的隐藏结构和潜在的含义。

真的可以交流吗?

但这不意味着我们已经破译海豚的语言了。相反地,正如WDP的研究总监Denise Herzing所说:我们并不确定海豚是否有语言。

海豚常发出三种不同类型的声音,虽然这些声音与特定行为高度相关,但科学家尚不确定它们是否拥有明确、具体的含义——比如是否代表“某个物体”或“某个动作”。更重要的是,即使这些声音可以被视为“词汇”,我们仍然不清楚海豚是否具备类似的语法结构来组织这些词汇,从而表达更为复杂的含义。

因此,DolphinGemma对“海豚语言”的破译,更多的只是对声音序列的分析。研究团队希望,通过AI对这些豚言豚语的学习,发现海豚交流方式中一些细微的人类无法识别的模式——得益于这几年大语言模型的发展,这比人类手动学习要快得多。

如果DolphinGemma发现了某种固定的声音模式,WDP多年的观察结果则可以提供“发出这个声音时,海豚在做什么”的信息,这就有可能了解海豚的交流方式,甚至了解它们的语言和文化。不过从目前来看,我们最多只是理解了声音与行为之间的联系,还不算真正翻译出“海豚语言”。

一群大西洋斑海豚(Stenella frontalis)|Google

另外,不管是DolphinGemma对声音序列的解析,还是CHAT项目试图与海豚互动,这些研究都是基于WDP在巴哈马追踪的大西洋斑海豚。但不同地区、不同种群的海豚,发声方式可能存在差异,可能也有自己的方言和口音。因此,DolphinGemma目前的训练成果不一定能推广到其他海豚上。

谷歌表示,他们预计将在今年夏天开源DolphinGemma。届时,DolphinGemma还能用于其他鲸豚物种的声学研究。

AI加持下的动物研究

DolphinGemma并不是第一个想要破译动物语言的模型。在人工智能迅猛发展的这几年,越来越多的动物研究里都有了AI的身影。

一个名为“鲸类翻译倡议”(Cetacean Translation Initiative,CETI)的非盈利研究项目,专注于解码抹香鲸的交流。抹香鲸最常发出的声音是一连串的咔哒声,这种像摩斯密码一样的声音被称为“密码曲”。CETI收集了60头抹香鲸的8000多条密码曲,通过传统的统计分析和机器学习,发现咔哒声的数量、节奏和节奏的变化组成了不同的密码曲。他们认为,抹香鲸可以通过无限的组合创造出各种密码曲,从而拥有庞大的交流系统;但目前仍无法破解这些咔哒声和密码曲包含了什么信息。

CETI 项目尝试“解码”抹香鲸的交流系统。图中展示了从水下机器人和无人机收集语音与行为数据开始,经过数据处理、共享与可视化,结合鲸类社会行为、生物学观察、机器学习和语言学分析,逐步构建鲸类语言模型,尝试理解其语法、语义及交流内容|CETI

另一个研究团体“地球物种项目”(Earth Species Project)关注的物种更多,包括乌鸦、白鲸、大象等。他们同样希望利用人工智能,解码动物的交流。他们认为这有助于动物保护,比如帮助濒危物种保留它们的语言,或者通过破译鲸豚类动物的语言,在它们即将浮出水面时,提醒附近船只避开动物。

此外,还有用于分析啮齿类动物、非人灵长类动物叫声语义的模型。2022年发表在《自然-通讯》的一篇研究,通过机器学习,发现了斑胸草雀不同圈养种群之间求偶歌曲的差异,而且这种差异会影响雌性的选择。研究者认为,人工智能可以找出人类尚未发现细微的差别。

斑胸草雀(Taeniopygia guttata)|christoph_moning / Wikimedia Commons

破译语言难度还很大,而通过人工智能分析声音、识别物种的技术则成熟得多,这些技术也常常用在动物保护工作中。

由康奈尔鸟类实验室开发的BirdNet,通过机器学习来检测和分类鸟的鸣叫声,目前可以识别约3000种常见鸟类物种。BirdNet可以直接在手机上使用,为观鸟爱好者、公民科学家和保护工作者提供识别的工具。

今年年初,AI还帮人们发现了一种在当地消失近30年的鸟。在澳大利亚墨尔本西部的草原上,保护组织安装了35个录音机,收集了数万个小时的录音。他们使用AI对录音进行筛选,AI从其中两个地点发现了一种轻柔低沉的“Ooming”声——这是领鹑的叫声,人类专家随后确认了AI的发现。

领鹑是澳大利亚特有种,因为栖息地的丧失,其种群数量大幅下降,现在属于极度濒危物种,上次在这片地区出现还是1989年。如果没有AI,人类要从海量的声音信息里发现领鹑,工作量将会大得多。

AI帮助研究者找到了领鹑(Pedionomus torquatus)的踪迹|JJ Harrison / Wikimedia Commons

我们好像总是想知道动物在说什么,家中的宠物在表达什么需求,大自然里的动物在交换什么情报……这可能只是出于本能的好奇,但如果能够了解动物之间的交流,我们就可以更懂动物,懂得它们的需求,或许也更懂得它们之间的情感和连结,懂得它们与人类的相似与平等。

但对我们人类来说,动物之间的交流还有太多的未知,自然还有太多的神秘。人工智能可以解开这些秘密吗?拭目以待吧。

参考文献

[1]https://blog.google/technology/ai/dolphingemma/

[2]https://apnews.com/article/sperm-whale-language-talk-clicks-a94df8e07b129f19917437fcb85e7655

[3]https://apnews.com/article/artificial-intelligence-climate-change-reid-hoffman-ab1d38583c4102185a494e465358963e

[4]https://www.nature.com/articles/s41467-022-28881-w

[5]https://www.theguardian.com/environment/2025/feb/12/plains-wanderers-spotted-in-melbournes-west-for-first-time-in-30-years-with-help-of-ai

作者:麦麦

编辑:黄线狭鳕

主题测试文章,只做测试使用。发布者:参考消息网,转转请注明出处:https://www.cns1952.com/gov/12259.html

(0)
参考消息网的头像参考消息网
上一篇 2025年4月21日 上午10:03
下一篇 2025年4月21日 上午10:03

相关推荐

  • 生活百科 | 这样的牛奶已经变质了,千万不要再喝!

    牛奶是许多人补充营养的重要选择。它富含蛋白质、钙、维生素等多种营养成分,对人体健康有着诸多益处。然而,你知道吗?牛奶一旦变质,不仅营养全无,还会危害身体健康。 ;;;; ;;;; 从外观上看,正常的牛奶质地均匀,呈乳白色或略带淡黄色。而变质的牛奶可能会出现分层现象,上层是清液,下层则是沉淀的蛋白质和脂肪。有时,牛奶表面还会出现一些小颗粒或絮状物,这是蛋白质变…

    2025年3月24日
    6900
  • 在4000多米的高原狂奔,牦牛为啥没“高原反应”?

    引言:藏语中,牦牛被称为“诺尔”,意思是宝贝。“牦牛不仅是青海人的‘宝贝’,更是科研人员的‘宝贝’。越是气候条件恶劣的地方,越是有珍贵的科研材料。作为唯一适应高海拔的大型反刍动物,牦牛为何能在4000多米的高寒缺氧环境生存和繁衍,这一问题吸引了大批研究者的目光。我们要破译它们生存的遗传密码,一方面是系统开展牦牛遗传资源保护与利用的迫切需求;另一方面可以对理解…

    2024年12月24日
    24100
  • 21日世预赛18强赛国足VS沙特直播几点钟在哪看?国足直播观看指南

      北京时间3月21日(周五)凌晨2点15分,世预赛18强赛第七轮将如期打响,中国男足将在世预赛亚洲区 18 强赛第七轮客场挑战沙特队。本场比赛是国足冲击2026 美加墨世界杯的关键战役,伊万科维奇率队能否在客场抢分备受关注。本文整合最新直播信息与赛事看点,助球迷一键锁定观赛全攻略。   相关赛事:3月20日晚上7点35分U22国足邀请赛国足VS乌兹别克斯坦…

    2025年3月27日
    15200
  • 2025年WTT重庆冠军赛直播在哪看?重庆乒乓球冠军赛赛程与观看指南

      2025年WTT重庆冠军赛将于3月11日至3月16日 在重庆巴南区华熙LIVE·鱼洞·场馆举办,这是一场备受期待的乒乓球顶级赛事。为了让广大乒乓球爱好者不错过这场精彩的比赛,以下是详细的WTT赛事观看指南,包括直播平台、赛程安排以及如何观看的建议。   一、2025年WTT重庆冠军赛赛程安排与直播时间   本次乒乓球赛事从3月11日开始,持续至3月16日…

    2025年3月11日
    24700
  • 生活百科 | 痛风不能吃豆腐?

    豆腐的营养价值丰富,吃法多种多样,深受国人的喜爱。但关于豆腐的谣言越来越多,比如痛风不能吃豆腐。许多痛风患者,不仅不敢吃黄豆,连豆芽、豆浆都敬而远之。痛风与豆制品真的是“势不两立”吗? ; 其实,这是一种常见的误区。 嘌呤在人体中会代谢产生尿酸,尿酸过高就容易导致痛风,所以减少摄入高嘌呤食物是预防和治疗痛风的关键方法之一。 在豆制品制作过程中,大多数嘌呤已经…

    2025年2月18日
    17800

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信