Windows 10是美國微軟公司研發(fā)的跨平臺及設(shè)備應(yīng)用的操作系統(tǒng)。是微軟發(fā)布的最后一個獨(dú)立Windows版本。Windows 10共有7個發(fā)行版本,分別面向不同用戶和設(shè)備。截止至2018年3月7日,Windows 10正式版已更新至秋季創(chuàng)意者10.0.16299.309版本,預(yù)覽版已更新至春季創(chuàng)意者10.0.17120版本 Win10語音輸入怎么樣
據(jù)PCWorld網(wǎng)站報(bào)道,Windows有一項(xiàng)微軟不愿意提及的功能。雖然Windows10可以讓用戶使用觸控筆“寫寫畫畫”,借助Windows Hello利用臉部登錄系統(tǒng)(或保護(hù)Web安全),甚至命令小娜設(shè)置提醒事項(xiàng),但它明顯不想讓用戶使用的一項(xiàng)功能是,利用其語音識別引擎對系統(tǒng)發(fā)號施令或讓用戶利用語音輸入編輯文檔。
微軟不大力宣揚(yáng)Windows語音識別功能的原因可以追溯到10年前,當(dāng)時微軟產(chǎn)品經(jīng)理謝恩·博切(Shanen Boettcher)在演示W(wǎng)indows Vista的語音輸入功能時搞砸了。之后Windows的語音輸入一直相當(dāng)“低調(diào)”,目前幾乎沒有用戶知道Windows有語音輸入功能。
如果說Windows有機(jī)會再戰(zhàn)語音輸入領(lǐng)域,目前似乎是個時機(jī)——計(jì)算機(jī)和人工智能的進(jìn)展為語音輸入提供了好得多的基礎(chǔ)。
在被問及語音輸入技術(shù)在Office中的未來時,微軟負(fù)責(zé)語音識別研究以及小娜和必應(yīng)的執(zhí)行副總裁哈里·舒姆(Harry Shum)表示,“這是一個重大問題。語音輸入沒有扮演更重要的角色是不可理解的。”
1、語音識別不完美的原因:
部分用戶仍然認(rèn)為語音輸入還是《杜恩斯比利》(Doonesbury)系列漫畫中蘋果牛頓PDA的水平,把用戶說的“I am writing a test sentence”,聽為“Siam fighting atomic sentry”。用戶有這種想法是可以原諒的:Windows語音識別功能仍然采用微軟Speech Recognizer 8.0技術(shù),自Vista以來,這一技術(shù)就基本上沒有什么變化。舒姆稱之為“祖父”級技術(shù)。
PCWorld表示,但硬件已經(jīng)發(fā)生了很大變化:聽和解釋語音要求的處理能力遠(yuǎn)低于10年前。Surface Book等PC產(chǎn)品中的集成式麥克風(fēng)陣列的質(zhì)量,意味著無需使用專用麥克風(fēng)語音識別就可以達(dá)到很高的準(zhǔn)確率。只是,語音輸入技術(shù)的發(fā)展已經(jīng)適合大眾使用了嗎?
在使用語音輸入軟件輸入長度為1028個單詞的文章時,95%的準(zhǔn)確率意味著用戶必須修正逾15個錯誤。在測試中,Windows語音輸入準(zhǔn)確率為93.6%,從理論上說這一數(shù)值并不高,低于測試的其他專用語音輸入軟件。Windows有個奇怪的習(xí)慣,在輸入逗號時,它會在文檔中插入“comma”(逗號)這個詞匯。語音輸入社區(qū)似乎對這類相對較小的失誤是否有重要影響有不同看法。
當(dāng)然,這還不是全部。使用過語音輸入軟件的人都知道,準(zhǔn)確率的關(guān)鍵是訓(xùn)練。隨著時間推移,語音輸入軟件會了解用戶口音,“apricot”中“a”的發(fā)音與“bad”還是“ape”中的“a”相同,和如何過濾無意識的痙攣性語言障礙。微軟員工曾聲稱,經(jīng)過適當(dāng)訓(xùn)練,Windows語音識別技術(shù)的準(zhǔn)確率可以達(dá)到99%。1000個單詞出現(xiàn)10個錯誤還不算太壞。
很少有用戶愿意花時間訓(xùn)練使用語音識別軟件。Windows語音識別軟件,要求用戶用10分鐘時間訓(xùn)練數(shù)個句子,會讓用戶有度日如年的感覺。小娜和Siri不要求用戶進(jìn)行訓(xùn)練,那是因?yàn)樗鼈円呀?jīng)被訓(xùn)練了數(shù)以百萬計(jì)的語音樣本。
小娜(可以在PC和手機(jī)上使用)在語音識別方面表現(xiàn)遠(yuǎn)優(yōu)于Windows語音輸入系統(tǒng)的原因是,它利用了微軟云服務(wù)的計(jì)算能力。微軟會對用戶的語音進(jìn)行分析,使用戶語音與其其他數(shù)據(jù)相關(guān)聯(lián),生成作為小娜靈魂的智能。
2、微軟重視語音識別:
鑒于小娜的出色表現(xiàn),用戶會認(rèn)為語音應(yīng)當(dāng)成為上周微軟Ignite會議的中心。但I(xiàn)gnite期間沒有任何與語音輸入有關(guān)的會議,只有一次會議與語音識別有關(guān)。微軟首席執(zhí)行官薩蒂亞·納德拉(Satya Nadella)在主旨演講中把語音識別稱作是微軟未來的關(guān)鍵元素。
以Skype Translator為例。據(jù)納德拉稱,Skype Translator依賴三個方面的研究:語音識別、語音合成和機(jī)器翻譯。在演講中,納德拉稱微軟語音識別算法的誤字率為6.9%,這是一個糟糕的成績:準(zhǔn)確率僅為93.1%。PCWorld稱,如果微軟真正看好辦公軟件,語音識別在PC中的未來不僅僅是利用Skype在孟加拉國訂賓館,而是撰寫體驗(yàn),不過是通過語音而非手指。
新技術(shù)融合:在易用性、安全性等方面進(jìn)行了深入的改進(jìn)與優(yōu)化。針對云服務(wù)、智能移動設(shè)備、自然人機(jī)交互等新技術(shù)進(jìn)行融合。Windows 10所新增的Windows Hello功能將帶來一系列對于生物識別技術(shù)的支持。除了常見的指紋掃描之外,系統(tǒng)還能通過面部或虹膜掃描來讓你進(jìn)行登入。當(dāng)然,你需要使用新的3D紅外攝像頭來獲取到這些新功能。
|