Google展示Gemini AI眼镜原型 实时翻译与导航逼近商用
•85 阅读•3分钟•视野
GoogleGemini智能眼镜Android XR
Sarah Perez••85 阅读•3分钟•视野

产品概览
Google在本次I/O大会上展示了最新的Android XR眼镜原型,配备了内置Gemini大模型的AI引擎。眼镜采用单眼微型显示屏,能够在使用者视野中叠加实时信息。硬件由Google与Warby Parker、Gentle Monster、Samsung合作打造,外观保持时尚,内部则是可自由实验的显示与电池模块。
关键功能
- 实时翻译:通过Gemini调用Google Translate,系统自动识别语音语言并在镜片上显示对应文字,同时以自然语音输出译文。
- 导航指示:用户只需说出目的地,Gemini激活Google Maps,几秒后在视野中弹出转向提示和蓝点地图,可随视线切换。
- 音乐播放:语音点播喜爱歌手,音频经框架扬声器私密输出,虽音质不及高端耳塞,但足以满足户外轻量使用。
- 摄像与AI图像处理:按侧边按钮即可拍照,图像先传至手机再送至Gemini进行编辑(如将人物转化为动漫形象),全链路约45秒。原型仅支持单眼拍照,视频功能仍在研发。
体验细节与局限
- 显示效果:原型仅在右眼配备显示,画面略显模糊,佩戴处方隐形眼镜时出现轻度眼部疲劳。
- 交互方式:长按框架右侧启动Gemini,启动时摄像头默认开启,未来版本将允许用户自行配置摄像开关。
- 硬件成熟度:目前仍是实验机型,外形尺寸、配重以及电池续航均未达到量产标准,设计重点在于验证显示技术与AI交互流程。
"我们希望通过原型快速迭代显示与交互层面的技术,而不是在外观上追求完美,"一位现场演示的Google工程师如是说。
市场前景与竞争
Google明确将此眼镜定位为音频眼镜的下一代升级版,预计在今年下半年向受限测试者开放更多功能。与Meta的Ray‑Ban Stories和Snap的Spectacles相比,Google的优势在于深度整合Gemini大模型和Google生态(Maps、Translate、YouTube)。然而音频版眼镜仍将先行上市,显示版的上市时间仍取决于电池与显示技术的突破。
整体来看,Gemini AI眼镜原型展示了AI在增强现实中的可行路径:从语言翻译到情境导航,再到即时图像编辑,均已在原型中实现。若后续在续航、显示清晰度以及隐私控制上取得突破,预计将开启AI视觉交互的商业化新篇章。
本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。