百度輸入法體驗:解決語音輸入4大痛點,取代打字正在成為現實

黑貓科技迷 發佈 2022-05-17T20:42:15.535559+00:00

語音輸入的4大痛點用語音輸入取代打字,不是未來的趨勢,而是正在發生的事實。不過想要做好中文語音輸入法,難度是非常高的,當下中文語音輸入有4大痛點。

語音輸入的4大痛點

用語音輸入取代打字,不是未來的趨勢,而是正在發生的事實。不過想要做好中文語音輸入法,難度是非常高的,當下中文語音輸入有4大痛點。

第一,因為中文存在大量的同音字,不管你吐字多麼清晰,總會有被誤判的可能,所以極其考驗算法的準確性;

第二,大多數語音輸入法需要聯網,才能正常運行,斷網後識別準確率會大幅下降,不如直接打字更為可靠。

第三,平時說話偶爾需要夾雜英文,這時候輸入法要同時識別中英文,容易出現誤判。而且漢語的語種非常多,光是主要方言就高達15種,語音輸入法很難實現面面俱到。

第四,中文語音輸入法的準確率做到95%以上,就已經是頂級水準了,想要達到100%幾乎不可能,最後還是需要略微修改一下,不可能完全脫離鍵盤。

一次很偶然的機會,讓我開始嘗試百度輸入法的語音輸入功能。畢竟百度是全球最大的中文搜尋引擎,小度更是智能屏行業的領頭羊。在中文搜索和AI人機互動這兩大賽道,百度都是行業的領軍者。

因此,百度輸入法從一開始就被我寄予厚望。問題來了,最新版本的百度輸入法,是否解決了語音輸入的4大痛點?接下來分享一下我個人的體驗。

正常念稿時的語音準確率

我認為中文語音輸入法最關鍵的就是同音字的糾正,以及標點符號的標註。我用了兩台手機,分別用百度和蘋果原生輸入法,兩個手機同時測試一段語音進行對比。畢竟沒有對比,是得不出客觀結論的。

百度輸入法非常精準的判斷了我的意思,標題符號也在最適合的地方,數字會自動替換成阿拉伯數字,基本不用再修改。

蘋果原生輸入法出現了3個瑕疵:缺了一個「逗號」,「而」這個字沒有識別到,「80」沒有轉成阿拉伯數字,上下文格式不一致。簡單對比後,可以明顯感覺到百度語音輸入的使用感受更流暢。

千萬別覺得這點差距無所為。總共才60個字左右就有三個瑕疵。這意味著你用十幾秒輸入的文字,也需要十幾秒去改,這顯然不能提高碼字效率。日常聊天用用還好,拿來工作肯定不行。

斷網時語音識別的準確率

可能很多人都不知道,語音識別技術如果需要較強的性能,需要用到的計算量、模型體積是比較大的,所以一般會放到雲伺服器上。因此,許多輸入法的語音功能都要求聯網才能使用,斷網識別則會降低準確率。

而百度輸入法支持離線語音功能,APP里自帶離線語音識別模組,就算沒有聯網也能正常使用,同時語音識別的準確率也非常高,和它形成明顯的對比的是搜狗輸入法。我用兩台手機分別使用百度、搜狗,開啟飛行模式,同時識別同一段語音,結果非常有趣。

客觀地說,搜狗輸入法在聯網狀態下,語音識別率和百度是同一梯隊。不過在斷網之後,搜狗輸入法的語音識別準確率就會大幅下滑。而且不是標點符號的斷句出現問題,也不是漏字,而是直接識別成了別的意思——比如把「拼音」識別為「小藝」,「鍵盤」識別為「健康」。

相比之下,百度輸入法就很穩定,離線狀態下的準確率,和聯網狀態幾乎沒有區別。成熟的「離線語音」可以帶來多方面的好處,比如可以適應各種複雜的環境,就算斷網了也能用。對我而言,「離線語音」讓我可以放心地用語音輸入,去做一些安全性要求較高的編輯工作。

豐富多樣的語種支持

中國地大物博,有多少地區,就有多少種方言。全國的普通話普及率才剛超過80%,還有很多人仍然在用方言交流。

為了讓人與人之間的溝通再無障礙,百度推出了「方言自由說」功能,融合各種方言為一體,目前已經支持河南、四川、東北、山東、粵語、武漢、昆明等多種方言,使用時不需要切換語種。

好奇之下,我做了個小小的測試,選擇「方言自由說」模式,先後測試河南話「俺要錄個視頻」、粵語「床前明月光,疑是地上霜」、四川話「這個火鍋巴適得很」,百度輸入法都能準確識別。

也就是說,百度輸入法可以智能判斷你說的話是否屬於方言,並自動匹配最適合的模型,不需要自己動手去調。「方言自由說」功能,抹平了方言和普通話在發音、用詞上的重大區別,讓語音輸入全面普及成為可能。

除了方言,百度輸入法還可以實現「中英自由說」。簡單測試了一下,它可以實現中英文同時識別,甚至可以「語碼轉換」,即當無法精確用中文描述某個概念時,就部分替換成英文來替代。

比如這段話:這個app的logo和slogan都超有feel的,你一定要感受一下。我嘗試用中英文自由說來念這段文字,識別結果一字不差,算法非常精準。

要注意的是,「中英自由說」在離線狀態下也是能使用的。之前我們提過,百度輸入法在斷網的時候,語音輸入的準確率依然很高。我再次用這段話測試了一遍,結果是完全一致的,可用性非常高。

用語音指令去修改語音結果

根據iiMedia Research的報告,百度輸入法的AI語音功能識別準確率高達98.6%,是業界最高。不過我們也能看出,由於中文的同音字、諧音太多,市面上的語音輸入法,都很難做到100%完美,還是有繼續提升的空間。

但是我發現,新版百度輸入法給出了解決辦法,那就是用「語音指令」去修改語音結果。這樣一來,哪怕是語音識別結果出現偏差,我們也能不用鍵盤修改,單純只用語音來打字了。

官方給出了多種語音指令,包括修改、刪除、加字等等。

比如「語音輸入的極限速度是一分鐘400字」這段話,如果語音指令來修改,能精確到什麼程度呢?對此,我先是在聊天窗口裡進行了測試。

比如改字,我說了指令「小度小度,把語音改成說話」,結果「語音」這兩個字真的改成了「說話」;然後是刪除,我說了指令「小度小度,刪除說話」,然後「說話」這兩個字被刪除了。

除此之外,我發現不僅僅是在聊天時,在APP的搜索框中,也能啟用語音指令功能。比如我在某APP的搜索欄中,輸入「百度輸入法體驗」,然後再用語音指令進行修改,結果依然是可行的。

比如加字,我說了指令「小度小度,在體驗前面加深度」,這句話就被改成了「百度輸入法深度體驗」。也就是說,百度輸入法可以智能識別輸入場景,在需要用到的場景下,會自動開啟語音指令功能。

我測試了一下,百度輸入法絕大多數情況下都能使用語音指令,比如發朋友圈、發動態、APP搜索框、評論區留言等等。只有極少數APP是無法識別的,比如在Edge瀏覽器的搜索框裡就無法開啟。

百度輸入法的體驗總結

是時候該做個總結了,綜合體驗下來看,我覺得百度輸入法的表現可以用四個字來形容:超乎預期。

首先,百度語音的識別準確率已經達到了高度可用的水平,標點符號的斷句也十分準確;第二,百度在輸入法里內置了完整的語音模型,就算離線也不受影響;第三,「中英自由說」和「方言自由說」這兩大功能,讓大多數人都能用上便捷的語音輸入;第四,「語音指令」可以徹底解放雙手,單純用語音就能輸出整段話,不需要用到鍵盤來修改。

百度輸入法解決了語音輸入的4大痛點,讓「語音取代打字」正在成為現實。體驗完之後,我開始明白為什麼百度輸入法是行業的領軍者了——它的實力不是吹出來的,而是用實實在在的技術打出來的。

據艾媒諮詢公布的《2021年度中國第三方手機輸入法行業研究報告》,百度輸入法市場占有率達到44.5%,月活用戶達5.62億,始終保持領先的地位。消費者的眼光是雪亮的,誰更好用大家心裡都知道。

你用過百度輸入法的語音功能嗎?一起分享你的真實體驗。

關鍵字: