近日,訊飛輸入法新版本正式上線,在隨聲譯和快捷翻譯功能里增加了日譯中、韓譯中、泰、越、西、法、德、俄與中文互譯,合計18種翻譯,這也使得訊飛輸入法成為中文與外語互譯最多的輸入法產(chǎn)品。
不得不說,語音輸入已經(jīng)越來越受歡迎。艾媒《2019-2020中國第三方手機輸入法市場監(jiān)測報告》顯示,29%的受訪者表示2019年使用語音輸入的頻率明顯增加,是增長最快的輸入方式。
面對輸入方式的變遷,訊飛輸入法、百度輸入法、搜狗輸入法三大輸入法,也一直在圍繞AI技術(shù)不斷加碼語音輸入服務(wù),使其不斷實現(xiàn)準(zhǔn)確率的突破,比如訊飛輸入法的語音識別準(zhǔn)確率已經(jīng)高達(dá)98%。
輸入法越來越智能的背后,各家的AI技術(shù)加持至為關(guān)鍵。而面對每天數(shù)億次甚至數(shù)十億次的使用需求,今天的輸入法產(chǎn)品已經(jīng)嵌滿了令人意想不到的五彩黑科技。
輸入法的重?fù)?dān)
輸入法越來越智能的代價,就是要背負(fù)越來越重的使命。追溯市面上幾款主流輸入法產(chǎn)品的發(fā)展歷史,可以發(fā)現(xiàn)這些產(chǎn)品已經(jīng)不年輕,至少都有十年或以上的產(chǎn)品迭代時間。以此推算,輸入法產(chǎn)品與移動互聯(lián)網(wǎng)的發(fā)展同步,可以說是跟著移動互聯(lián)網(wǎng)一路走來的。
最早的輸入法,不論是設(shè)備自帶輸入法,還是第三方輸入法,功能普遍比較簡單,比如只支持9鍵和26鍵鍵盤輸入、手寫輸入等非智能機時代沿襲的輸入方式,主要是為了滿足最普遍的用戶需求。
但移動社交、移動趨勢的明晰,以及智能手機的普及,徹底改變了輸入法產(chǎn)品們的發(fā)展路徑。個人用戶在多元場景下不斷衍生出更多的輸入需求,開始特別注意到輸入體驗的進(jìn)步,希望更快和更好,比如能否根據(jù)拼音首字母快速預(yù)測想打的字。特別是在移動社交場景下,個人用戶使用輸入法的頻率越來越高,用戶對輸入法體驗的感知非常明顯,輸入法好不好用,效率高不高,用戶其實心知肚明。
這讓輸入法的擔(dān)子越來越重,原本定位于輕服務(wù)工具的輸入法,不得不開始思考如何滿足不同用戶不同場景下的個性化需求。于是,為巨大體量的用戶大規(guī)模同步提供優(yōu)質(zhì)的輸入服務(wù),成為輸入法產(chǎn)品們發(fā)展的核心目標(biāo)。
愈發(fā)全能的輸入法
場景和需求之變,不斷倒逼著輸入法產(chǎn)品的進(jìn)化,結(jié)果就是,輸入法變得越來越全能,越來越精致,越來越個性。以目前的三大輸入法產(chǎn)品為例,十年前的它們與十年后的它們,已經(jīng)“判若兩人”。
一方面,不斷的功能增加使得產(chǎn)品能夠適應(yīng)許多輸入場景。除了傳統(tǒng)的手寫和鍵盤輸入外,三大輸入法還加入了OCR掃描、智能預(yù)測/糾錯等功能。其中,OCR掃描指的是用戶可以通過掃描將圖片或手寫稿轉(zhuǎn)換成文字,而智能預(yù)測功能則可以提前根據(jù)輸入拼音預(yù)測用戶想打的字,智能糾錯則可以根據(jù)詞庫、語境快速糾正用戶的錯誤。
各種功能的豐富,使得輸入法可以服務(wù)于用戶的全輸入過程,在輸入前、中、后每個環(huán)節(jié)提供對應(yīng)的服務(wù)。
另一方面,產(chǎn)品能力的極限突破為用戶帶來了全面的體驗。以從語音起家的訊飛輸入法為例,目前訊飛輸入法已經(jīng)做到了一分鐘400字的輸入速度,以及語音識別準(zhǔn)確率達(dá)98%的水平,也就是說整段輸入的出錯率非常小,為用戶帶來的是極速和流暢的綜合輸入體驗。
可以說,這些功能所達(dá)到的極限顛覆了以往低效低質(zhì)的輸入體驗,從感官上彌補了用戶對輸入法的體驗缺乏。
黑科技成就輸入法
無論是功能上的全能,還是體驗上的全能,輸入法產(chǎn)品能夠?qū)崿F(xiàn)質(zhì)變,甚至能夠適應(yīng)一些極限和極端的輸入場景,除了產(chǎn)品本身的創(chuàng)新外,不斷的技術(shù)迭代是最核心的原因。用戶之所以能夠只花一半的時間完成整個輸入過程,都依賴于輸入法們背后的黑科技。
訊飛輸入法可以說是“科技成就輸入法”的最佳代言人。 一方面,其背靠有20多年智能語音技術(shù)沉淀的科大訊飛,已有20萬小時訓(xùn)練數(shù)據(jù)積累;另一方面,科大訊飛有太多的國際賽事頂尖榮譽,比如在2018年由國際計算語言學(xué)協(xié)會(ACL)下屬組織主辦的第十二屆國際語義評測比賽(SemEval2018)中,科大訊飛斬獲了基于常識的機器閱讀理解全球第一;2018年的國際權(quán)威英文語音識別大賽“CHiME-6”中,科大訊飛包攬了兩項第一名;2019年在ICDAR2019舉辦的場景文本視覺問答挑戰(zhàn)賽ST-VQA中,科大訊飛包攬了三項冠軍;2020年初在德國The 20BN-Jester Dataset手勢識別評測中,科大訊飛以97.26%的準(zhǔn)確率斬獲冠軍,且刷新了世界紀(jì)錄……訊飛輸入法背后的黑科技可以從四方面來看。
一、語音輸入
語音輸入講究快速和準(zhǔn)確,訊飛輸入法之所以能達(dá)到一分鐘400字、識別準(zhǔn)確率98%的水平,主要在于其自研的“記憶增強的多通道全端到端語音識別框架”,這項技術(shù)簡單來說就是能夠完全將前端語音處理過程深度學(xué)習(xí)化,并使用深度卷積神經(jīng)網(wǎng)絡(luò)和后端識別模型進(jìn)行混合訓(xùn)練,從而大大提高了語音識別的效率。
至于能夠使用23種方言進(jìn)行精準(zhǔn)語音輸入,一方面要靠通過多方言共享方式訓(xùn)練的Multi-lingual多語言建模技術(shù),另一方面要靠GlobalPhone全球音素集,這項技術(shù)從聲學(xué)層面的相似性來統(tǒng)一各方言的音素定義,使方言“語圖譜”模型進(jìn)一步精進(jìn),從而使得方言識別效果有效提升。多語種互譯功能則對技術(shù)提出了更大的挑戰(zhàn)性,以中英互譯為例,訊飛輸入法基于對抗樣本訓(xùn)練方法提出了融合副語言特征的“高魯棒性語音翻譯技術(shù)”,并在模型中結(jié)合特定技術(shù),有效提高了最終翻譯結(jié)果。
二、拼音輸入
在拼音輸入上,訊飛輸入法創(chuàng)新性引入了Encoder-Decoder框架,構(gòu)建了新一代拼音識別引擎,極大簡化了傳統(tǒng)拼音識別模型,同時在Attention機制和長短期記憶網(wǎng)絡(luò)的門控機制,以及Transformer等模塊的共同作用下,長句輸入識別效果有效提升,能夠提前預(yù)測用戶想輸入的內(nèi)容,還能有效實現(xiàn)智能糾錯。
此外,這一模型由于采用的是序列建模,建模不再依賴詞典,更易實現(xiàn)中英文混合建模,因而讓訊飛輸入法在中英混輸上實現(xiàn)了非常出色混輸表現(xiàn)。值得注意的是,不論是智能預(yù)測,還是智能糾錯,背后都有可實時更新的百萬詞庫。
三、手寫輸入
同樣是手寫,體驗卻完全不一樣,這是因為訊飛輸入法的手寫識別可支持兩萬多類中文字符、52類英文字符、10類阿拉伯?dāng)?shù)字以及100多種特殊符號,這種超級識別能力的背后,是訊飛輸入法的“HWR手寫識別技術(shù)”,這項技術(shù)采用的是CNN卷積神經(jīng)網(wǎng)絡(luò)技術(shù),可支持實時手寫軌跡,邊寫邊出字,而且單個字符識別僅需15ms,響應(yīng)迅速無延遲。
四、掃描輸入
掃描輸入的技術(shù)支撐是計算機視覺,面對復(fù)雜的手寫文字、中英混合文字,“OCR文字檢測技術(shù)”可檢測任意方向和形狀的文字,“OCR文字識別技術(shù)”則可以有效緩解因環(huán)境問題造成的識別效果低下問題。
綜上,基于AI和大數(shù)據(jù)的組合技術(shù),如今的輸入法不再死板堅硬,即使面對輸入場景的復(fù)雜需求,也能夠在不同語種、不同語境、不同語調(diào)下滿足不同用戶的需求。過去的輸入法只能輔助,而現(xiàn)在,科技加持下的輸入法,更像是一個“一站式”的輸入管家。
輸入法的智能普惠
黑科技成就了輸入法,也成就了輸入法的地位。根據(jù)相關(guān)報告提供的數(shù)據(jù),以三大輸入法為代表的第三方輸入法,已經(jīng)覆蓋了超過90%的中國網(wǎng)民。
要是放大到整個輸入法行業(yè),可以說人人都是輸入法的受益者,移動設(shè)備也好,個人電腦也好,日常交流必然離不開輸入法的幫助。可以說,輸入法已經(jīng)成為一個互聯(lián)網(wǎng)溝通的基礎(chǔ)設(shè)施。而且值得慶幸的是,訊飛輸入法等頭部產(chǎn)品在技術(shù)上的進(jìn)化,讓這個基礎(chǔ)設(shè)施不斷產(chǎn)生質(zhì)變,越來越智能。
應(yīng)該說,像訊飛輸入法這樣始終癡迷于“科技驅(qū)動”的輸入法產(chǎn)品,是輸入法作為工具產(chǎn)品在價值上得到躍進(jìn)式提升的關(guān)鍵,因為它們用技術(shù)無限拔高了輸入法產(chǎn)品的價值上限。換言之,訊飛輸入法們的“科技大法”一定程度上改善了整個互聯(lián)網(wǎng)世界的溝通協(xié)作效率。
技術(shù)無上限,輸入法產(chǎn)品也無上限。對9.04億中國互聯(lián)網(wǎng)網(wǎng)民而言,黑科技持續(xù)加持下的輸入法工具,會繼續(xù)為每個用戶提供獨一無二的使用體驗,真正實現(xiàn)全方位的智能普惠。
文/劉曠公眾號,ID:liukuang110
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!
雖然我國汽車芯片行業(yè)還處在發(fā)展初期,但已經(jīng)迸發(fā)出無限潛力。一方面,智能汽車的發(fā)展不斷帶動需求增長;另一方面,政策引導(dǎo)下,汽車芯片企業(yè)持續(xù)搶占高地。對此,在7月5日-7日舉辦的2023年中國汽車論壇上,中國汽車工業(yè)協(xié)會副秘書長李邵華就做出表示,“中國將成為未來汽車芯片發(fā)展的集聚地”。車規(guī)芯片行業(yè)近日的
2023世界人工智能大會將于7月6日至8日在上海舉辦。云天勵飛將在大會上展示自主設(shè)計開發(fā)的新一代邊緣計算芯片DeepEdge10系列SoC芯片,并公布“天書”大模型的最新動態(tài)。歡迎蒞臨上海世博展覽館H1-C801展臺參觀交流!同時,云天勵飛也將與中國電子、中國信通院、華為等合作伙伴,在WAIC的舞臺
近日,酷學(xué)院智能產(chǎn)品發(fā)布會在深圳閃亮登場。近200位現(xiàn)場觀眾和近萬人次在線觀看,共同見證了這一激動人心的時刻。發(fā)布會上,酷學(xué)院引領(lǐng)大家探索企業(yè)培訓(xùn)學(xué)習(xí)和人才發(fā)展領(lǐng)域的新高度,并揭幕其全新的產(chǎn)品智能升級和突破??釋W(xué)院產(chǎn)品負(fù)責(zé)人徐晨通過形象生動、邏輯嚴(yán)謹(jǐn)?shù)闹v述,揭曉了全新的智能企業(yè)培訓(xùn)和人才發(fā)展平臺,以
隨著人工智能技術(shù)的快速發(fā)展,各行各業(yè)都受到了深刻影響,特別是中小學(xué)人工智能教育的普及,已經(jīng)成為當(dāng)今不可忽視的重要課程。ChatGPT等人工智能技術(shù)的出現(xiàn),讓我們看到了人工智能將成為未來推動科技跨越發(fā)展、生產(chǎn)力整體躍升的重要驅(qū)動力量之一。在這個背景下,中小學(xué)教育已經(jīng)將人工智能作為重要學(xué)習(xí)內(nèi)容,并將科技
我不是危言聳聽,現(xiàn)在全球的AI巨頭都在做MCP,毫不夸張的說:誰能把MCP做起來,誰就擁有AI生態(tài)控制權(quán),誰就是AI圈的老大。你們有沒有發(fā)現(xiàn),MCP在2025年初開始特別火爆,互聯(lián)網(wǎng)技術(shù)大廠都在強推MCP。(1)阿里云百煉搞了個MCP平臺,提供50+預(yù)置MCP服務(wù)。不過大都只面向阿里系產(chǎn)品。(2)騰
2025國際人工智能程序設(shè)計精英挑戰(zhàn)賽(IAEPC)在香港中文大學(xué)成功舉辦。作為主辦方之一,歐美同學(xué)基金會理事長李軍接受了大賽主持人艾誠采訪。在采訪中,李軍認(rèn)為IAEPC不僅是一場“冠軍中的冠軍”對決,更是一次全球AI人才的線下交流盛會。大賽“史無前例”的吸引了全球青年科技精英匯聚香港,更加推動和普
2025國際人工智能程序設(shè)計精英挑戰(zhàn)賽(IAEPC)在香港中文大學(xué)成功舉辦。作為大賽發(fā)起人方之一及裁判委員會負(fù)責(zé)人,施韓原與杜瑜皓接受了大賽主持人艾誠采訪。裁判委員會主席施韓原分享了此次大賽的亮點,IAEPC首次引入創(chuàng)新賽道,探索選手如何與AI合作進(jìn)行答題。裁判委員會副主席杜瑜皓認(rèn)為,選手最終目標(biāo)并
2025國際人工智能程序設(shè)計精英挑戰(zhàn)賽(IAEPC)在香港中文大學(xué)成功舉辦。來自深圳的學(xué)生吳林林作為主辦方記者團成員,采訪了大賽冠軍選手之一。在吳林林的采訪中,選手認(rèn)為與來自全球的參賽者交流是自己學(xué)到的最重要的一課。在科技與AI之前,選手們可以平等、開放、友好的交流。以下是采訪實錄(有刪節(jié)):吳林林
2025國際人工智能程序設(shè)計精英挑戰(zhàn)賽(IAEPC)在香港中文大學(xué)成功舉辦。來自深圳的學(xué)生吳林林作為主辦方記者團成員,采訪了大會嘉賓:全國政協(xié)委員、香港特別行政區(qū)立法會議員、香港中文大學(xué)工程學(xué)院副院長、IAEPC聯(lián)合發(fā)起人黃錦輝先生。在吳林林的采訪中,黃錦輝教授勉勵年輕人要像懂中文和英語一樣懂AI,
昨天新出了一個AI,據(jù)說比DeepSeek還牛,而截止到今早,已經(jīng)有10萬人在排隊申請Manus邀請碼了,而且它邀請碼已經(jīng)炒到10萬了。這是北京的一家人工智能公司蝴蝶科技,創(chuàng)始人是一名來自華中科技大學(xué)的90后畢業(yè)生肖弘,突然向全球宣布:世界上第一款真正的人工智能、通用智能體產(chǎn)品出現(xiàn)了,名叫Manus
謠言肆虐,擦亮眼睛
蘋果16弄了兩個版本,一個是專門給中國人用的,準(zhǔn)備用百度的AI,還要交錢。第二個是全世界都可以用的,用了ChatGPT,包括臺灣、香港、澳門都可以用。以后都這樣了。好,問題就出在這,蘋果和百度的合作出現(xiàn)問題了,新聞連起來看,才能明白其中含義。新聞一:蘋果正在和騰訊、字節(jié)初步接洽,考慮將二者的AI模型
“技術(shù)日新月異,人類生活方式正在快速轉(zhuǎn)變,這一切給人類歷史帶來了一系列不可思議的奇點。我們曾經(jīng)熟悉的一切,都開始變得陌生。”計算機之父約翰·馮·諾依曼曾這樣說到。