百度360必应搜狗淘宝本站头条
当前位置:网站首页 > SEO教程 > 正文

刚刚,谷歌Gemini Live上新功能,能看懂手机屏幕、还能实时视频

gaoyangw 2025-04-05 18:33 5 浏览 0 评论

机器之心报道

编辑:陈陈、蛋酱

好消息,谷歌在 MWC 上关于 Project Astra 与 Gemini Live 集成的承诺兑现了。

刚刚,谷歌发言人 Alex Joseph 在给 The Verge 的邮件中确认,谷歌已经开始向 Gemini Live 推出新的 AI 功能,能够共享用户的手机屏幕或者通过智能手机摄像头回答相关问题。这对于实时人工智能交互来说是一个重大进步。

这些功能的推出距离谷歌首次展示「Project Astra」项目已经过去一年时间。

有 Reddit 用户表示自己已经率先体验到了屏幕共享功能,该功能通过一个名为「Share screen with Live」的新按钮来实现。

这位用户还发布了一段视频来证明。

通过视频我们可以看出 Gemini 根据用户共享的屏幕,回答出了今天的日期、温度等信息。

另外,Gemini Live 推出的另一项功能是实时视频功能,它可以让 Gemini 实时解读你手机摄像头的画面,并回答相关问题。

效果如何,我们通过示例来感受一下。在谷歌本月发布的一段演示视频中,用户使用该功能向 Gemini 求助,他们上釉的陶器选择什么颜色的颜料最合适。

只见用户打开手机摄像头,对准物体进行实时拍摄,然后询问这些釉料中哪一种最适合?

几乎是毫无延迟的 Gemini 给出了回答:

一个问题回答完毕后,你也可以继续追问,Gemini 都能对答如流

Project Astra 是谷歌去年发布的 AI 智能体项目,用户通过摄像头,可以与大模型进行实时的视觉与语音交互,也是谷歌对标 GPT-4o 的又一项重要研究。

Project Astra 有三个特点:

  • 实时对话可以进行实时音频和视频对话,低延迟,还掌握多种语言。
  • 记忆:通过记住过去对话的关键细节以及当前会话中最多 10 分钟的内容来完善其回答。
  • 工具调用:提出问题后,Project Astra 可以使用谷歌搜索、地图等来提供答案。

此外,Project Astra 还可以跨设备工作,用户可以在安卓手机或原型眼镜上使用 Project Astra 功能。

视频对话功能并非新概念。最早公开演示 AI 视频通话的 OpenAI,则在去年 12 月底就在自家产品上线了对应能力:在 ChatGPT 的移动端应用程序 App 中,高级语音模式 Advanced Voice 提供了视频和共享屏幕功能。目前该功能还没有免费开放,也是 Plus 用户和 Pro 用户才能使用。

谷歌此时推出这些功能,至少证明了 Gemini 在努力保持人工智能助手领域的「前排」地位。

与之形成鲜明对比的是,苹果推迟了 Siri 的升级。彭博社前几天报道,一份 Siri 团队内部会议的记录显示,我们期待的 Apple Intelligence 仍遥遥无期。

会议由负责该部门的高级主管 Robby Walker 主持。他称此次延迟是一个「糟糕的」情况,并同情那些可能因苹果的决定和 Siri 仍然不佳的声誉而感到疲惫或沮丧的员工。

Robby Walker 还表示,承诺过的 Siri 功能不一定会在今年出现在 iOS 19 中:「这是该公司目前的目标,但并不意味着我们会在那时推出。」

近几周,苹果一直无法摆脱有关其在 Siri 和人工智能方面进展缓慢的负面新闻。去年 6 月承诺过的高级智能功能至今无法兑现。几个月过去了,除了更漂亮的 Siri 动画外,几乎没有任何成果。

除此之外,苹果尚未公开评论此事。当时该公司表示,高级 Siri 功能「比预期耗时更长」。但 Robby Walker 告诉员工,公司的软件主管、人工智能主管等高管正在为这一困境承担「个人责任」,然而这一困境引发了广泛的、激烈的批评。

这些功能对于 Siri 的现代化、苹果在人工智能竞赛中的追赶其实非常重要。我们仍然不知道这些 Apple Intelligence 功能何时会到来。似乎,从最近这次全体会议的讨论内容来看的话,苹果本身也不知道。

参考链接:

https://www.theverge.com/news/634480/google-gemini-live-video-screen-sharing-astra-features-rolling-out

https://www.theverge.com/news/629940/apple-siri-robby-walker-delayed-ai-features

相关推荐

工业品网络推广/工业品网络推广,慢就是快

工业品网络推广/工业品网络推广,慢就是快。做工业品网络推广,慢就是快,很多人都因为想要快而被割了韭菜。今天跟一个做机械设备的老板聊天,他想要快点把他的短视频账号做起来,所以他打算在这个账号上投5-10...

活动H5网页制作指南:提升品牌推广效果

活动H5是一种利用HTML5技术制作的活动网页。目前,在网络活动领域,它相当受欢迎,常被用于企业宣传、产品推广和节日庆典等活动,扮演着至关重要的角色。下面,我将为大家详细解说活动H5的相关内容。基本概...

工业品网络推广/小微企业如何稳中求胜

工业品网络推广/小微企业如何稳中求胜。工业品小企业,如何在没什么优势的情况下,做好网络推广,接到稳定的询盘和订单呢?我经常会遇到这样的老板,我问他公司有什么优势?他说公司没什么优势,跟同行差不多。其实...

全面介绍H5活动:网络推广常用且具有多种优势的手段

H5活动是现在网络推广中常用的一种手段,它结合了文字、图像、声音等多种媒体元素,提供了既有趣又方便的交流方式。接下来,我将全面为大家介绍这种活动。定义本质简单来说,活动H5是利用HTML5技术构建的页...

谷歌搜索引擎出现罕见的服务中断,数据中心发生爆炸

8月9日(周二),谷歌为8月8日搜索引擎中断问题道歉。该公司的一位发言人表示,该团队已“迅速开展工作”以解决故障,服务已恢复正常运行。此外,对于数据中心爆炸,Google发言人DevonSmiley...

谷歌搜索改版:取消连续滚动,重回分页显示

IT之家6月26日消息,据SearchEngineLand,谷歌现已取消搜索结果界面的“连续滚动”显示,转而采用之前一直使用的“分页”模式。IT之家查询发现,谷歌最初于2021年1...

谷歌组织迎重大调整!Gemini并入DeepMind团队,搜索广告业务主管升为首席技术官

谷歌重组旗下人工智能部门,将Gemini应用团队转移至DeepMind,以增强AI领域的竞争力。10月17日周四,谷歌宣布将把Gemini应用团队转移至人工智能研究实验室DeepMind,隶属于谷歌A...

谷歌测试纯AI版搜索引擎,彻底取消传统展示形式

来源:网易新闻3月6日消息,Alphabet旗下谷歌当地时间周三推出一款实验版搜索引擎,彻底取消10个蓝色链接的传统展示形式,转而采用人工智能生成摘要的全新界面。这项名为“AI模式”的新功能已经向Go...

谷歌搜索升级隐私保护工具:主动监控示警,让用户掌控网络足迹

IT之家2月27日消息,谷歌公司昨日(2月26日)发布公告,宣布升级“Resultsaboutyou”工具,可在搜索结果中扫描包括电话号码、家庭住址等个人信息,并帮助用户快速移除这些...

AI 搜索模式:Google 让 Gemini 完全掌控你的搜索结果

这一天终于来了——Google正式开始测试一项全新的AI搜索模式,这将让用户的搜索体验完全由Gemini主导。...

谷歌Chrome浏览器将整合Gemini AI:窗口与任务栏双入口曝光

IT之家3月20日消息,科技媒体WindowsLatest今天(3月20日)发布博文,报道称谷歌计划将Gemini人工智能助手深度整合至Chrome浏览器,类似微软Edg...

谷歌测试Gemini模型新技能:借助用户搜索记录提供更个性化回应

IT之家3月8日消息,外媒AndroidAuthority昨天报道称,谷歌正在开发一款新的Gemini模型,该模型可以访问用户的谷歌搜索记录,从而提供更个性化的AI回应。其在最新...

Google 搜索升级:由 Gemini 2.0 驱动的 AI 概览功能扩展

来源:至顶网根据Google周三发布的博客文章,公司正在将AI概览功能扩展到更多美国用户,并对其进行Gemini2.0升级。AI概览是Google搜索的一项功能,它会在显示常规蓝色...

谷歌搜索上线AI模式:整合多模态和实时信息,一键解答复杂问题

IT之家3月6日消息,谷歌公司昨日(3月5日)发布博文,邀请谷歌搜索用户,测试全新的“AI模式”(AIMode)。用户可以提出更复杂的问题,并基于搜索结果,AI生成更详细、更直观的...

刚刚,谷歌Gemini Live上新功能,能看懂手机屏幕、还能实时视频

机器之心报道编辑:陈陈、蛋酱...

取消回复欢迎 发表评论: