谷歌打擂OpenAI:Gemini Live和GPT

在本周二举行的谷歌I/O大会上,谷歌推出了一款全新的人工智能产品——Gemini Live。人们原本以为安卓系统的Gemini助手会带来某些新东西,但这就是谷歌,一切皆有可能。

在本周二举行的谷歌I/O大会上,谷歌推出了一款全新的人工智能产品——Gemini Live。人们原本以为安卓系统的Gemini助手会带来某些新东西,但这就是谷歌,一切皆有可能。

值得一提的是,Gemini Live是在OpenAI首次消费者产品活动的第二天发布的,很难不让人猜想该产品是否是为了对抗ChatGPT Voice而发布的。 

而且两者都采用了原生多模态人工智能模型,并拥有出彩的语音和视频功能。 

目前,在全球人工智能竞赛中,领跑者无疑是OpenAI和谷歌,OpenAI似乎与苹果和iPhone建立了紧密的联系,而谷歌则掌控着安卓系统。 

并且,相对于Rabbit r1或Humane Pin这样的人工智能设备而言,智能手机才是短期的赢家。ChatGPT Voice和Gemini Live都被集成到了现有的智能手机产品中,而且这两款产品目前都还未上市。至于下一代助手是否能够与之相比,这是后话了。 

01.Gemini Live与GPT-4o谁更胜一筹? 

下图是谷歌发布Gemini Live时的发言: 

“今年夏天,我们将扩展Gemini的多模态功能,包括使用语音进行深入的双向对话。这种新体验被称为Live。”

 

图片

在实时视频分析和语音功能方面,谷歌是有所欠缺的。去年谷歌发布Gemini Ultra时,它发布了一段响应“实时视频”的视频,但生成的结果并不理想。

不过,这一次谷歌把这项技术放在了I/O上试用,包括语音和视频对话。

OpenAI和谷歌都为视频及语音对话提供了一个界面,都可以通过手机摄像头进行实时的视频分析。并且语音和视频的响应都很快,能够进行真正自然的对话,甚至可以中途打断人工智能。

不过,两者也有一些明显的不同之处。OpenAI的ChatGPT Voice听起来更自然,能检测并响应情绪和声调,甚至能根据你的要求实时调整说话方式。在Gemini Live上并没有看到这种功能。

二者另一个最大的不同是多模态。Gemini仍然依赖其他模型进行输出,包括使用Imagen 3输出图像和Veo输出视频。但GPT-4o是双向的原生多模态,“o”代表了全方位,可以创建自己的图像和声音。

02.AI的下一步发展:全方位语音助手

总的来看,目前人工智能的发展趋势似乎正在从文字输入转向语音输入

当人们看到OpenAI的公告时,可能就会意识到,这是人机界面的一次范式转变,其意义不亚于鼠标或触摸屏的推出。

谷歌也将继续推出原生、自然的语音界面,Meta公司在其VR头显和Ray-Ban智能眼镜中配备了语音机器人MetaAI。

图片

虽然智能手机可能是目前的赢家,但这些语音AI模型真正的适配设备显然是智能眼镜。因为眼镜上的摄像头与眼睛同高,眼镜臂也可以将声波送入用户的耳朵,我们可以称之为完美的人工智能设备。

目前的问题在于,OpenAI是否会进军硬件领域,推出自己的智能眼镜,或者这会成为新的Siri,并为未来的苹果眼镜产品提供动力。此外,谷歌是否真的有勇气复活谷歌眼镜,也是一个问题。

中文内容由元宇宙之心(MetaverseHub)团队编译,如需转载请联系我们。

       原文标题 : 谷歌打擂OpenAI:Gemini Live和GPT-4o谁能更胜一筹?

(来源:维科网)
免责声明:本文内容来源于第三方或整理自互联网,本站仅提供展示,不拥有所有权,不代表本站观点立场,也不构成任何其他建议,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容,不承担相关法律责任。如发现本站文章、图片等内容有涉及版权/违法违规或其他不适合的内容, 请及时联系我们进行处理。

相关推荐

  • 科技公司大裁员,AI创业公司却受资本追捧

           根据Crunchbase最新统计,2023年美国科技公司裁员浪潮汹涌,超过19.1 万名员工在大规模裁员中被解雇,且裁员趋势一直延续至2024年。      不过即便如此,但某些领域依然保持着强劲的发展势头

    2024-06-18
    0
  • OpenAI正式重启机器人团队!之前曾一度被放弃

    快科技5月31日消息,据媒体报道,OpenAI将重启其机器人团队。 这一团队在2020年因多种原因被解散,但随着对人工智能机器人的投资升温,OpenAI决定再次进军机器人领域。 据知情人士透露,OpenAI目前正在积极招募研究工程师,以重建曾经解散的机器人团队

    2024-05-31
    0
  • 谷歌开了两个小时的发布会,比不上OpenAI半小时

    在OpenAI 春季发布会的第二天,2024

    2024-05-15
    0
  • AI Agent如何颠覆传统自动化?

    去年 11 月, OpenAI 发布 AI Agent 初级形态产品 GPTs,让人看到智能体的应用前景。谷歌、亚马逊在该领域也有所涉猎。比尔?盖茨更是认为 AI Agent 是 AI 的未来,并预言不久的将来,所有人都将拥有专属 AI 助理

    2024-05-14
    0
  • 突发!又一巨头宣布:大裁员

    背后透露哪些信号? 铅笔道作者丨黄小贵 谷歌开启今年第二轮裁员。 4月18日,谷歌宣布从本周开始裁掉一批员工。消息人士透露,财务和

    2024-04-20
    0
  • AI卷到人身上了!OpenAI、谷歌上演抢人大招,最高开出1873万年薪

    在生成式AI之前,似乎没有哪个行业如此明确地展露它对于天才的巨大需求。马斯克直言,AI的人才争夺是他从业以来见过的史无前例的最疯狂的一次。 不久前,马斯克又和奥特曼公开叫板了,而这一次不再是关于开源盈利的钱财之争

    2024-04-10
    0
  • 国产系统加速占领两个行业,微软、苹果和谷歌都慌了

    国产操作系统占领市场,一直是国内消费者期待的愿景,如今这正逐渐变成现实,快速占领市场,给美国几款操作系统都造成了巨大的压力,显示出国产操作系统努力近20年后,终于取得了重要进展。 首先取得进展的

    2024-04-07
    0
  • 抢夺TikTok,一个不能打开的“潘多拉魔盒”

    危机有了新的变化撰文/ 陈邓新编辑/ 李觐麟排版/ AnnaleeTikTok的危机,有了新的变化。据彭博社报道,虽然美国众议院日前通过了《保护美国人免受外国对手控制应用程序侵害法案》,但美国两党参议

    2024-03-21
    0
  • Sora只用于娱乐?智能制造第一个不服

    Sora如果真的朝智能制造方向去做,黑灯工厂、自动驾驶、数字孪生中的一系列难题,有希望得到解决。 文|赵艳秋 编|牛慧 OpenAI推出Sora后,立刻在影视界、广告界和

    2024-03-12
    0
  • 离了个大谱!OpenAI创始人兼CEO被董事会罢免了

    突发!!! OpenAI的董事会决定将现任首席执行官兼创始人Sam Altman(山姆·奥特曼)逐出公司,现任首席技术官CTO Mira Murati被任命为临时首席执行官。

    2024-03-08
    0