Meta开源多感官人工智能模型 结合六种类型的数据
时间:2023-05-10 10:36:50来源:cnBeta

Meta公司宣布了一个新的开源人工智能模型,将多个数据流联系在一起,包括文本、音频、视觉数据、温度和运动读数。该模型目前只是一个研究项目,没有直接的消费者或实际应用,但它指出了生成性人工智能系统的未来,可以创造沉浸式的多感官体验,并表明在OpenAI和Google等竞争对手变得越来越神秘的时候,Meta继续分享人工智能研究。

该研究的核心概念是将多种类型的数据连接起来,形成一个单一的多维指数(或"嵌入空间",用人工智能的说法)。这个想法可能看起来有点抽象,但正是这个概念支撑着最近生成性人工智能的蓬勃发展。

例如,像DALL-E、Stable Diffusion和Midjourney这样的人工智能图像生成器都依赖于在训练阶段将文本和图像联系起来的系统。他们在视觉数据中寻找模式,同时将这些信息与图像的描述联系起来。这就是使这些系统能够按照用户的文字输入生成图片的原因。许多以同样方式生成视频或音频的人工智能工具也是如此。

Meta公司说,其模型ImageBind是第一个将六种类型的数据结合到一个单一的嵌入空间的模型。该模型包括的六种数据是:视觉(图像和视频形式);热能(红外图像);文本;音频;深度信息;以及最有趣的--由惯性测量单元或IMU产生的运动读数。(IMU存在于手机和智能手表中,它们被用于一系列任务,从将手机从横向切换到纵向到区分不同类型的身体活动)。

Meta博客文章中的一张截图,显示了不同类型的链接数据,例如,火车的图片、火车鸣笛的音频,以及关于火车三维形状的深度信息。

Meta的ImageBind模型结合了六种类型的数据:音频、视觉、文本、深度、温度和运动。

我们的想法是,未来的人工智能系统将能够交叉引用这些数据,就像目前的人工智能系统处理文本输入一样。例如,想象一下,一个未来的虚拟现实设备不仅能产生音频和视觉输入,还能产生你在物理舞台上的环境和运动。你可能会要求它模拟一次漫长的海上航行,它不仅会把你放在一艘船上,背景是海浪的噪音,而且还有甲板在你脚下的摇晃和海洋空气的凉风。

在一篇博文中,Meta公司指出,其他的感官输入流可以被添加到未来的模型中,包括"触摸、语言、气味和大脑fMRI信号"。它还声称这项研究"使机器离人类同时、全面和直接从许多不同形式的信息中学习的能力更近了一步"。

当然,这都是非常推测性的,而且像这样的研究的直接应用很可能会更有限。例如,去年,Meta公司展示了一个人工智能模型,可以从文本描述中生成短小而模糊的视频。像ImageBind这样的工作显示了该系统的未来版本如何纳入其他数据流,例如,生成音频以匹配视频输出。

不过,对于行业观察者来说,这项研究也很有趣,因为Meta公司正在开放底层模型--这是人工智能世界中越来越受到关注的做法。

那些反对开源的人,比如OpenAI说这种做法对创作者有害,因为对手可以复制他们的作品,而且这可能有潜在的危险,让恶意的行为者利用最先进的人工智能模型。倡导者回应说,开放源代码允许第三方仔细检查系统的缺陷,并改善它们的一些缺陷。他们指出,这甚至可以提供商业利益,因为它基本上允许公司招募第三方开发人员作为无偿工人来改进他们的工作。

到目前为止,Meta一直坚定地站在开源阵营中,尽管并非没有困难。(例如,其最新的语言模型LLaMA今年早些时候在网上泄露了。) 在许多方面,它在人工智能方面缺乏商业成就(该公司没有可以与Bing、Bard或ChatGPT匹敌的聊天机器人),这使得这种做法成为可能。同时,通过ImageBind,它正在继续实施这一战略。

标签: 人工智能 多感官人工智能 多感官人工

最新
  • Meta开源多感官人工智能模型 结合六种类型的数据

    Meta公司宣布了一个新的开源人工智能模型,将多个数据流联系在一起,包括文本、音频、视觉数据、温度和

  • 现在去法院离婚需要什么手续带什么东西 从起诉离婚到判离需要多长时间?

    去法院离婚需要什么手续带什么东西去法院离婚需要以下手续带以下东西:1 起诉,即向有管辖权的法院立案

  • 犯罪中止存在两种情况分别是什么?犯罪中止的量刑标准是什么?

    一、犯罪中止必须具备的条件(一) 必须在犯罪过程中停止犯罪犯罪中止只能发生在犯罪过程中,即只能发生

  • 食邑是什么意思?食邑的发展历程介绍

    食邑是什么意思?食邑的发展历程介绍如果你经常看古代小说或者电视剧,你会发现皇帝经常奖励食邑一千户。

  • 空调自动停机是什么原因?空调停机压力多少正常?

    空调自动停机是什么原因?1、电路故障。当电路出现故障时,空调没电或者电路接触不良都会造成空调自动停

  • 视焦点讯!【港股异动】中国海外发展(00688.HK)涨3.26%

    企查查APP显示,近日,寿县永良粮油食品有限公司因虚假宣传被淮南市市场监督管理局行政处罚200万元。据悉,

  • 湖北小将彭旭玮获全国游泳冠军赛女子200米冠军-天天微动态

    5月3日晚,全国游泳冠军赛在杭州奥体中心进行了第三天的决赛,彭旭玮在女子200米仰泳中游出了今年世界第四

  • 视焦点讯!美国劳工部: 3家麦当劳特许经营商非法雇佣300余名童工

    劳工部说,这3家麦当劳特许经营商被合计处以约21 据该部门统计,在2022财年发现688名儿童被非法雇佣从事危

  • qdii基金适合定投吗?qdii基金的汇率按哪天算?

    qdii基金适合定投吗?qdii基金是适合有经验的投资者定投的,但不适合新手定投。qdii基金是在一国境内设立

  • 交强险赔付额度是多少?交强险赔偿限额累计吗?

    交强险赔付额度是多少?在被保险车辆发生交通事故并造成受害人的人身伤亡、财产损失后,交强险在责任限额

  • 农村宅基地如何补偿?农村没有宅基地拆迁有补偿吗?

    农村宅基地如何补偿?征收集体土地住宅房屋的拆迁,可以实行产权调换、货币补偿,或产权调换与货币补偿相

  • 投入产出比是怎么计算出来的?投入产出比越高越好吗为什么?

    投入产出比是怎么计算出来的?投入产出比的计算公式如下:投入产出比=投资总额÷项目寿命期内增加

  • 2022北京本科院校录取分数线是多少?北京排名靠前的大学有哪些?

    北京本科院校录取分数线是多少?1、2022年中国科学院大学的最低录取分数线为705分;2、2022年北京大学的最

  • 股票主力被套了如何解套?主力成本计算方法有哪些?

    最近小编看到很多人在搜索股票主力被套的相关内容,小编呢对此也是非常感兴趣,特意整理了相关的内容,

  • 摩托车托运是怎么收费的?摩托车托运是送货上门吗?

    摩托车托运是怎么收费的寄物流大概就200-300元人民币,如果是委托物流托运,箱子的体积要尽量在3*3米以

  • 民事诉讼法属于什么法?房产官司属于民事诉讼法吗?

    民事诉讼法属于什么法?《中华人民共和国民事诉讼法》是以宪法为根据,结合我国民事审判工作的经验和实际

  • 旅游
    • 河南:推进灾后恢复重建 提高防灾抗灾整体能力

    • 十年来,孟津黄河湿地的鸟类增加了60多种

    • 河南多地优化疫情防控措施 生产生活秩序全面恢复

    • 河南工运史馆等10家单位获首批河南省职工爱国主义教育基地