為什麼和Siri、Alexa對話這麼費勁?語音優先技術前景怎樣?
2021-06-11由 棧外 發表于 農業
例行程式是什麼
原文來自Wall Street Journal,作者Wilson Rothman
原文連結:https://www。wsj。com/articles/why-you-cant-have-a-decent-conversation-with-your-voice-assistant-yet-11576418400
我:“Alexa,微波加熱燕麥片。”
Alexa:“好,設定什麼溫度?”
我:“我不知道。”
Alexa:“我,我也不知道。”
我正在試用Amazon推出的新款烤箱,對Alexa說出語音指令即可完成操作。
儘管從各方面來說簡易便捷,令人印象深刻,但它充分說明了我們在嘗試聲控一切時會遇到的許多問題。有人知道自己加熱燕麥片的溫度嗎?還是您今天才知道微波爐還可以設定溫度?
烤箱有很多功能,比如對流烤箱、空氣炸鍋,但是當我說“烹飪三文魚”時,Alexa問:“多少?”我回答一磅,然而我得知只能做“0。063至0。37磅的三文魚”。雖然我可以聲控開啟烤箱,但卻不能聲控關閉。烤箱本身不會講話,需要使用Alexa輔助交流。
圖注:Amazon智慧烤箱。
Amazon表示,許多問題已在後臺更新中得到解決,但是語音助手達到幾可亂真的地步尚有待時日。
這就像是出行前練習外語一樣:先死記硬背些日常表達,用完之後就加大嗓門,比手畫腳。
我已經用Wi-Fi操控取代了許多電燈開關,許多燈泡也已接入網路。我在許多房間中都裝了語音控制系統(包括浴室),聖誕樹彩燈也連上了智慧插頭。我的家人會向Alexa大喊,基本操作她都能完成。但我們用的指令非常直截了當:播放這首歌、關閉這些燈、設定計時器或鬧鐘。
我們與Apple的Siri或Google廚房助手Nest Hub Max的溝通也很相似。
“當您手頭有其他事的時候,語音是最佳選擇,它能夠快速提供幫助。”
語音優先(voice first)軟體開發商Witlingo執行長、前Alexa產品負責人艾哈邁德·布茲德(Ahmed Bouzid)在一份電子郵件中解釋道。
最好的互動應該比原來節省精力,
而不是大費周章。
對於Amazon的智慧烤箱,布茲德提出了質疑:如果您正在做飯,烤箱肯定不會離得很遠,做飯時也不會一心多用,因此最好還是自己按下按鈕。
保持簡單
根據2019年的一項調查,人們向智慧聲控語音助手發出的大多數命令往往
簡單且易記
。
資料來源:Futuresource Consulting Ltd。。
Amazon智慧家居副總裁丹尼爾·勞斯(Daniel Rausch)提出反對意見,烤箱功能眾多,其他形式難以覆蓋這麼多功能:“如果您試圖繪製一張所有功能的圖表,並希望給每個功能分配一個按鈕,您可能需要一個路邊廣告牌大小的面板。”
所以這是否就是語音助手存在的意義,取代開關和搜尋框?語音助手不斷新增新功能,有一些功能大有助益。
語音控制已經可以實現很多功能,但是由於多種因素的綜合考慮,比如隱私,語音控制的發展仍在原地踏步。
有問有答
例行程式(routines)是一種
將單獨命令組合
的方法。一個簡單的語音命令例如“我回來了”就可以關閉提示、開燈、調節恆溫器以及播放柔和的爵士樂。
從理論上講這很酷,但事實上,這很煩人,因為要進行設定,必須坐在那裡,思考想要一次性發生的所有事情,以及如何實現。
現在,控制這些介面的App還會提供建議。這些建議通常以您的操作為基礎。
Shortcuts就是個典型的例子,雖然功能尚有待加強,但是開啟它並點選“Gallery”就可以檢視App中可以使用的簡便程式了。我以前會設定三個鬧鐘:起床、校車接送和地鐵。
現在,我只需要說“晨鐘”,然後三個鬧鐘就都設定好了。
但是例行程式只能解決按鍵太多的問題。
開發人員正在致力於使這些介面更具互動性,從而允許後續的對話。也許您會說:“開啟廊燈”,廊燈打開了,然後您的語音助手可能會建議:“您是否也要開啟露臺燈?”因為這樣做很合理。
儘管Amazon和Google都建議採取行動,但Amazon的“直覺”則更進一步:當您請求開啟廊燈時,它可能會說:“您還希望我播放柔和的爵士樂嗎?”
問題將基於您(可能是無意識)的行為:
通常,開啟廊燈時,還會選擇播放舒緩的爵士樂。
圖注:在智慧手機上看到一個新的App圖示,但實際上您看不到語音助手和家庭聲控助手(例如Google的Home Mini)到底做了哪些更新。
Amazon和Google都可以暫時不設定喚醒詞。
透過在Alexa App中啟用“Follow-Up”和在Google Home App中啟用“Continued Conversation”喚醒助手,然後繼續提出問題而無需重複喚醒詞。它還保留了一些上下文:“ Alexa,聖誕節是幾號?”然後您可以問:“復活節呢?”
蘋果的Siri會在不同的語境下執行此操作。
AirPods Pro現在具有朗讀訊息的功能,可以閱讀訊息並允許以對話方式回覆。Walmart iOS版的雜貨配送App將Siri和您的購物記錄緊密聯絡,您只需語音便可輕鬆挑選商品,無需記住關鍵短語。
個性化和隱私
人與無實體的聲音之間真正需要的是更緊密的聯絡。
個性化意味著識別誰在說話並記住他們的偏好。
但這需要資料收集,最近我們對此有了更多的認識。
諮詢公司Futuresource Consulting首席分析師西蒙·弗萊斯特(Simon Forrest)先生表示,“
隱私是消費者的首要考慮因素。
像Apple這樣的公司在改進隱私方面已經做了很多。例如將資訊儲存在裝置上,可以實現透過語音識別播放特定的電影。
Alexa可選擇清除獨立智慧家居裝置的歷史記錄。Google也表示允許使用者檢視和刪除歷史記錄。
圖注:Amazon和Google出售配備螢幕的語音控制裝置(例如Google的Nest Hub Max)。
“我們正在全面思考如何在擁有儘可能少的資料的前提下,仍能為使用者改善產品。”Google助手產品高階總監莉蓮·林肯(Lilian Rincon)表示。目前,出於質量原因,Google助手所做的大部分工作都需要雲服務,她說,但是,
“我們希望在裝置上增加更多功能。”
Google的Pixel 4手機就是一個很好的例子。它可以僅僅使用電話本身將語音實時轉錄為文字。iPhone 11可以在沒有云服務的情況下做更多的事,例如播放Siri的新聲音,甚至舊版的iPhone也可以使用裝置觀察使用者行為並根據其建議操作。
發現我
那麼,為什麼在所有這些程序中,我們大多依然只是設定計時器和要求播放音樂?與您喜歡的App新圖示不同,您無法真正看到語音助手的新功能。Alexa、Google Home和Siri Shortcuts 提供了大量建議,Amazon和Google配備螢幕的聲音控制裝置也是如此,但這還不足以教會人們如何使用。
“我們現在面臨的最大問題就是如何促進使用者發現並探索我們的產品,尤其是對於語音控制器來說,讓您知道它可以做什麼。”
林肯女士說。
Amazon的勞斯也用傑夫·貝佐斯(Jeff Bezos)的一句名言承認了這一點:“Amazon的新生,絕對是因為Alexa和AI。”
那麼之後的發展會如何呢?Futuresource的弗萊斯特說,
即使是語音優先的介面,也可能包含手勢控制和觸覺反饋等技術,
例如在手腕上輕按Apple Watch。他認為“Hearables”(又名超級智慧AirPods)可能是語音優先的產品。
現在,我得想辦法讓這個智慧烤箱烹飪超過0。37磅的三文魚。