前段時間舉行的 Google I/O 上,Google 正式發布了新一代 Gemini 3.5 模型,同時也提到未來會將 Gemini 的能力融入到 Google 生態的更多產品中。
但讓雷科技沒想到的是,第一個用上 Gemini 的 Google 生態應用并不是搜索、Youtube、地圖等 Google 生態大戶,而是近幾年存在感不斷降低的 Google 翻譯:昨天,Google 發布 Google 翻譯更新,在翻譯中加入了最新的音頻模型 Gemini 3.5 Live Translate(下文簡稱 Gemini 3.5 LT)。

那么在 Gemini 3.5 LT 的驅動下,Google 翻譯的實時語音翻譯功能體驗又如何呢?
打開 Google 翻譯的實時翻譯功能,選擇「實時聽」模式,就能進入全新的 Gemini 3.5 LT 驅動的翻譯模式了。不過奇怪的是,這個「實時聽」模式必須連接外置耳機才能激活。考慮到 Google 翻譯這個實時聽模式并不能像時空壺同傳模式那樣雙向同時工作,雷科技對這個「必須接耳機才能用」的設計實屬不解。
好在這個「實時聽」模式的操作還算簡單:打開實時聽模式,把手機靠近對方,耳機里就能「實時」聽到翻譯后的音頻了。

和 Google 翻譯之前那個按住才能說話、松手才開始翻譯的「對話」模式相比,實時聽模式會在對方完成一個短句后開始翻譯,時效性要高不少。但在翻譯時,Google 依舊有比較明顯的延遲。
以中譯英的古詩翻譯為例,要念到第三句時,耳機里才會聽到第一句的翻譯,和專業同傳耳機那種幾乎「同時啟動」的翻譯還是有點差距。
至于翻譯準確性的問題,雷科技這里給 Google 翻譯安排了幾個比較經典的游戲對話「原聲大碟」用于測試,同時也拉來了蘋果翻譯和有道翻譯作為對比。
我們先來看看原文,相信玩過 GTA:SA 的玩家對這段點餐錄音都不會陌生:
I'll have 2 number 9s, a number 9 large, a number 6 with extra dip, a number 7, 2 number 45s, one with cheese and a large soda.
以下是 Google 翻譯「聽」到的英文原文:
Now, I have two number nines, but number nine Lord, number six with extra dip, a number seven, two number 45s, one with cheese and a large soda. Okay.Okay.
可以看到,即使是有 Gemini 3.5 LT 驅動的 Google 翻譯,在一些細節處也會錯過原文,比如:
I ’ ll have 變成了 I have(連讀遺漏);
a number 9 large 變成了 but number nine Lord(識別錯誤);
開頭、結尾處也多了 Now 和 Okay.Okay.(識別幻覺)。
不過在翻譯效果方面,Google 翻譯倒是準確的把這個錯誤的原文翻譯了出來。

相比之下,Apple 翻譯的問題就大得多了:識別出現大量錯誤,翻譯幾乎不可用。


除了「實時聽」,Google 翻譯還有「對話」「文本」等多種翻譯模式,后者在翻譯結束后都能從歷史紀錄里看到原文與翻譯的文本。但「實時聽」模式下的翻譯記錄在退出該模式(耳機斷開導致的強制退出也算)后全部消失。
如果你打算用 Google 翻譯的「實時聽」模式做采訪記錄,那雷科技勸你還是放棄這個想法。

更重要的是,作為全球通用翻譯賽道的代表,Google 翻譯加入 AI 陣營,必將推動整個通用翻譯賽道朝著 AI 翻譯轉型。
其實把 Google 翻譯這次更新單獨拿出來看,雷科技認為這只能算得上是一次「AI 功能補課」:別人都在接大模型,Google 翻譯當然也要接。但如果把視角放到 2026 年整個 AI 硬件市場,雷科技反而覺得翻譯可能是今年最值得關注的 AI 落地場景之一。
原因也不復雜:和很多還停留在「炫技」階段的 AI 功能相比,「翻譯」的需求足夠明確,也足夠高頻。不同于需要「教育用戶」「創造需求」的品類,品牌不需要解釋「加 AI 能干什么」,用戶也不會質疑「為什么要用 AI」。
比如時空壺此前推出的 X1 Meeting AI 會議同傳設備,就利用時空壺的 AI 模型能力,解決了同傳過程中斷句點識別、語義推測、上下文糾錯的傳統短板。在「翻譯」之外,時空壺也用 AI 技術打造了骨聲紋識別功能,讓翻譯耳機可以準確識別哪句話是從誰嘴里說出來的,為后面的同傳翻譯環節打下基礎。


而在雷科技看來,無論時空壺同傳耳機,還是訊飛 AI 眼鏡,這些 AI 翻譯設備本質上都在試圖讓翻譯從一個 App 功能,變成一種可以「移植」到不同硬件中的能力,從而覆蓋更多的場景。
以 Google 翻譯為例,雖然現階段的 Google 翻譯還面臨延遲、漏譯、記錄缺失等問題;但長遠來看,Gemini 3.5 LT 的實時音頻能力完全可以接入耳機、眼鏡、會議設備,甚至汽車座艙當中。
對時空壺、訊飛這類專業翻譯硬件廠商來說,Gemini 3.5 LT 的出現既是壓力,也是機會。「壓力」很好理解:Google 這樣的玩家一旦下場,必然會抬高用戶對免費翻譯工具的預期——去年各手機品牌先后為 TWS 耳機加入 AI 翻譯功能,就直接擠壓來入門翻譯耳機的市場空間,拉高了翻譯耳機能力的「及格線」。

但從另一個角度想,通用翻譯也有著天然的短板:商務會議需要多人識別,采訪需要留備份,跨境展會需要長時間續航,嘈雜環境需要更強收音,這些都不是單靠一個模型更新就能解決的。
也正因如此,Google 翻譯變強并不意味著翻譯耳機、翻譯眼鏡的故事就此結束。
Google 翻譯等通用翻譯 App 和采用通用翻譯模型的產品,只能解決「從無到有」的問題。而未來的高端翻譯耳機,必將把專用 AI 能力當作產品迭代的核心驅動力,用更快、更強的專用翻譯模型拉出體檢的差距。也只有這樣,才能在 AirPods 等「AI 翻譯耳機」帶來的沖擊下守住核心用戶群,并在更細分、更高價值的市場中延續優勢。
隨著免費 App 把基礎翻譯門檻越拉越低,專業設備就必須在專業場景中證明自己的實力和價值??梢钥隙ǖ氖?,隨著 AI 技術在翻譯賽道的普及,翻譯硬件也必將迎來新一輪的洗牌。
技術迎來革新、產品優勝劣汰、消費者體驗升級,這才是 AI 技術推動行業發展的意義。