科大訊飛推出“離線輸入法”!
近日訊飛輸入法新版上線,科大訊飛正式推出一套離線輸入方式,包括完全離線的拼音、語音及手寫輸入,以更好的保護用戶數據安全。
據《信息安全技術移動互聯網應用(App)收集個人信息基本規范》規定,輸入法類應用程序為用戶提供鍵盤、手寫、語音等方式輸入字符功能的服務,該服務類型必須遵循知情同意和最小必要原則,明確無需個人信息即可使用基本服務功能。
其他類型的互聯網App也需如此。近日,國家對互聯網平臺違規收集用戶個人信息的行為監管日趨激烈嚴格,已有多家互聯網企業下架接受網絡安全審查。未來,把個人數據的控制權交給用戶,將會成為互聯網App的主流趨勢。
拼音輸入、手寫、語音識別均可“離線化”
據悉,在新版訊飛輸入法內,手寫和拼音輸入都可以實現“離線化”,用戶打字數據不會被傳到互聯網上。同時,該版本也會將AI能力“離線化”,既保證智能化體驗,又可解決用戶數據安全問題。
如離線語音輸入方面,新版訊飛輸入法升級了AI語音識別模型,在不聯網的環境下,無云端數據傳輸,通過手機本地解碼就能為用戶提供轉文字服務,可以滿足在任何場景下進行語音輸入的需求。用戶也可以通過設置自主選擇啟用或停用離線語音輸入。
后續,訊飛輸入法將對OCR識別、智能翻譯等更多AI功能進行廣泛的“本地化”。
值得一提的是,訊飛輸入法新版還推出“基礎輸入”模式,該模式下不上傳任何數據也能順暢輸入,同時用戶可以使用皮膚、表情等功能,盡可能保障輸入體驗。如果想獲得更多元的輸入體驗,享受更智能化的服務,用戶可以通過【全部設置】-【隱私設置】-【使用方式】-開啟完整體驗。對于“完整體驗”的設計,訊飛輸入法也會進行嚴格把關,清晰列出系統權限使用說明。
能力行業領先
在AI能力方面,訊飛輸入法一直走在行業前列。
訊飛輸入法AI功能包括智能語音輸入、智能OCR識別、智能翻譯等多個方面。
智能語音輸入即識別用戶語音自動輸入文字。目前,訊飛輸入法語音輸入可實現1分鐘打400字。
為提高識別準確率,科大訊飛持續深耕語音識別領域,令通用語音識別率在98%基礎上再獲重大突破。
在扎實技術的支持下,訊飛輸入法還支持粵語、四川話、東北話、閩南語等23種方案識別,以及英、日、韓、俄等多國語言輸入。
除提高正常語音情況下的識別率外,通過搭載耳語識別等技術,訊飛輸入法在輕聲說話、噪聲等復雜環境中也能保持超高識別率。
此外,訊飛語音輸入還可在PC端操作,支持23種方言、3種民族語言以及4種外語,同時支持跨屏操作:手機充當電腦麥克風,使用手機語音輸入時,電腦屏幕上能快速打字。
在手寫識別方面,訊飛輸入法基于空間注意力機制的端到端思想獨家打造出OCR識別引擎,支持兩萬多類中文字符、52類英文字符、10類阿拉伯數字以及100多種特殊符號,行書、草書、生僻字、數字符號等都能識別并轉成電子文檔。
此外,訊飛輸入法還拓展了機器視覺技術,在傳統OCR文字識別基礎上新增拍照翻譯、手寫公示識別等功能,甚至能夠對數學運算進行智能批改。
在翻譯方面,據了解,憑借自研核心的翻譯技術以及對大數據的深度挖掘,訊飛輸入法的隨聲譯能夠支持日語、韓語、西班牙語、泰語越南語、德語、法語、俄語等多國主流語言與中文的即時互譯。
技術的發展也是為服務更多的人群,在這些AI技術的支持下,訊飛輸入法成為了國內最早適配無障礙功能的App之一,依托無障礙語音輸入、表情輸入等功能,為視障人群鋪設了通向互聯網世界的“盲道”。
以訊飛輸入法在無障礙模式上做了諸多適配。拿安卓用戶舉例,用戶進入安卓系統【設置】-【無障礙】-【屏幕閱讀器】使用TalkBack服務,訊飛輸入法就會提供語音反饋。
在語音指示下開啟無障礙模式后,訊飛輸入法的輸入面板、菜單面板以及表情面板的屏幕即可隨選朗讀,即便視力不便情況也能打字,待語音輸入完成后輸入法會自動朗讀,用戶便可得知輸入結果是否準確,并且進行修改。
此外,無障礙模式下,用戶打開文字掃描功能,對著圖片或者文本拍照,瞬間文字就能提取出來,識別的文字通過語音播報讓視障人群知道。值得一提的是,訊飛輸入法也是中國盲人協會認證的首個輸入法產品,獲得了中國盲人協會頒發的無障礙認證證書。
11年征程,“用人工智能建設美好世界”
從2010年成立至今,訊飛輸入法已經走過了11年的歷程。
2010年10月28日,全球首款基于云計算實現的語音輸入法--訊飛輸入法正式發布;同年,訊飛AI研究院就將GMM-hmm-隱馬爾可夫模型應用到語音識別系統中,通過運用WFST解碼器,提高復雜的語言模型,達到了70%識別率。
2012年,訊飛又在輸入法中使用了深度神經網絡技術,把全球首個中文云識別的DNA上線到產品中,使得語音識別率一下子提升了到80%。2018年 ,訊飛又開始使用HybridCNN 算法,通過結構優化大幅提升并發路數,語音識別準確率突破98%。
2020年,訊飛又在產品中加入了動態自適應編解碼語音識別引擎 ,進一步實現了多模態輸入和領域個性化識別。
疫情期間,訊飛輸入法在10天內上線了武漢話轉普通話功能,開放給馳援武漢的醫生、護士,助力醫患團隊溝通,累計服務了3萬人。
除方言外,訊飛輸入法還在持續發展“個性化語音”功能,2012年便在行業內首創了個性化語音識別,允許用戶將本地的人名,自己定義的專業詞匯,特有詞語,上傳到云端進行機器學習。用戶下次說到這些詞語時,訊飛輸入法就可以把相應的詞語識別出來。
如今,在5G和Alot的技術大背景下,訊飛輸入法也在不斷進步以適應人機交互和萬物互聯的世界。訊飛輸入法此前推出10.0版本上,就搭載了“動態自適應編解碼語音識別引擎”,新增的唇形輔助輸入,能夠提高嘈雜環境及近距離多人說話的識別效果。
該版本還優化了領域詞識別,可更精準的匹配游戲、醫療、旅游、購物等不同的場景詞匯。除了語音功能邊界的拓展,訊飛輸入法10.0版本還基于“免切換”的理念,實現英文單詞連續手寫,即在輸入面板既可以手寫漢字也可以直接手寫完整的英文單詞。
而此次完全離線版本的出現,說明訊飛輸入法在發展技術的同時也在注重保護用戶的數據和隱私安全,真正切切為用戶考慮更多。