跳转到主要内容

Google Gemini Live 推出屏幕共享与实时视频功能

在最近的世界移动通信大会(MWC)上,Google 宣布了对其 Gemini Live 平台的重大更新,整合了 Project Astra,引入了屏幕共享实时视频交互功能。这些增强功能旨在通过实现更多动态和互动功能来提升 AI 助手的用户体验。

Google 发言人 Alex Joseph 通过电子邮件确认了这些功能的推出。一个名为“与 Live 共享屏幕”的新按钮使用户能够轻松共享手机屏幕。一位 Reddit 用户分享的演示中,Gemini 根据共享的屏幕信息准确回答了诸如当前日期和温度等问题。

Image

除了屏幕共享,Gemini Live 现在还支持实时视频解析。用户可以打开手机摄像头,Gemini 将分析捕捉到的图像并提供相关答案。在 Google 的演示中,一位用户询问了用于陶器上釉的最佳涂料。在几乎没有延迟的情况下,Gemini 提供了详细的建议,展示了其先进的实时处理能力。

这些更新是 Project Astra 的一部分,这是 Google 去年推出的 AI 代理计划。该项目专注于实现与大型语言模型的实时视觉和语音交互。关键功能包括低延迟的音视频对话多语言支持、对过去对话细节的记忆以及与 Google Search 和 Maps 等工具的集成。值得注意的是,Project Astra 设计为跨设备兼容,允许用户在 Android 手机或专用眼镜上访问这些功能。

与 Google 的快速进展形成对比的是,Apple Siri 的升级据报道已经停滞。根据 Bloomberg 的消息,Apple高管在内部会议上承认 Siri的AI改进未达预期,承诺的 Apple Intelligence仍未实现。这一缓慢进展使 Apple在竞争激烈的AI领域中处于劣势。

Google的最新功能突显了其在AI助手领域的领导地位,同时激发了人们对未来AI驱动交互的期待。随着竞争的加剧,用户可以期待在这一快速发展的领域中继续看到创新和改进。

关键点

  1. Google Gemini Live现在支持屏幕共享和实时视频交互。 2.这些更新整合了Project Astra以增强AI能力。 3.用户可以共享手机屏幕或使用摄像头进行实时分析。 4.Project Astra提供低延迟对话和跨设备兼容性。 5.Apple Siri的升级落后于Google在AI技术上的进展。

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

ChatGPT现可像Shazam一样识别歌曲——工作原理揭秘
News

ChatGPT现可像Shazam一样识别歌曲——工作原理揭秘

OpenAI与Shazam合作,将音乐识别功能直接整合进ChatGPT。当听到动听旋律时,无需再切换应用——只需询问ChatGPT正在播放的歌曲,即可获得即时结果。该集成允许用户通过简单的语音或文本命令识别歌曲,并提供艺人信息和预览片段。就像聊天框里有个懂音乐的朋友。

March 10, 2026
OpenAIChatGPTShazam
GPT-5.4震撼登场:具备读心AI与百万级token记忆能力
News

GPT-5.4震撼登场:具备读心AI与百万级token记忆能力

OpenAI最新模型GPT-5.4带来了革命性功能,让我们离真正智能的数字助手更近一步。全新的'思维模式'让用户可以窥见AI的推理过程,而百万级token记忆能力使其能够处理海量文档。最令人惊叹的是其原生计算机操作能力——这款AI不仅能对话,还能实际跨应用程序工作。

March 6, 2026
AIOpenAIGPT
News

谷歌Canvas功能正式上线:搜索与创作工具的结合

谷歌已在美国全国范围内推出其Canvas功能,将搜索结果转变为可定制的应用和文档。这款由AI驱动的工具帮助用户在搜索界面内组织信息、生成学习指南,甚至创建功能性应用程序。凭借对海量文本处理和自然语言编程的支持,Canvas代表了谷歌超越传统搜索的最大胆尝试。

March 5, 2026
GoogleAI工具搜索技术
AI智能体通过新型训练框架实现实时进化
News

AI智能体通过新型训练框架实现实时进化

蚂蚁集团与清华大学联合发布AReaL v1.0强化学习框架,这项突破性技术让AI智能体在实际使用中持续自我提升。与传统需要大量编码的系统不同,该创新方案能让现有智能体无缝连接——想象你的数字助手每次使用时都在变得更聪明。系统的秘密武器?一个AI驱动的开发助手在创纪录时间内帮助构建了其复杂架构。

March 4, 2026
AI机器学习科技创新
StepZen开源AI模型挑战行业巨头
News

StepZen开源AI模型挑战行业巨头

StepZenith已将其Step3.5Flash AI模型完全开源,该模型采用庞大的1960亿参数MoE架构。这款高能效模型在使用时仅激活110亿参数,在编码任务中实现了惊人的350 TPS速度。其使用量仅次于OpenClaw位居第二,凭借速度和稳定性迅速成为开源社区的新宠。

March 4, 2026
AIOpenSourceMachineLearning
Telegram机器人API迎来流式升级:聊天机器人现在能像人类一样实时响应
News

Telegram机器人API迎来流式升级:聊天机器人现在能像人类一样实时响应

Telegram最新的Bot API 9.5更新为所有聊天机器人带来了颠覆性的流式传输能力,消除了AI对话中尴尬的停顿。该更新允许机器人在生成回复时逐步显示内容,类似人类的打字过程。OpenClaw率先实现即时兼容性,在私聊和群组中提供更流畅的交互体验。

March 3, 2026
TelegramChatbotsAI