《時(shí)代》(Time)發(fā)布文章稱,谷歌的個(gè)性團(tuán)隊(duì)成員正在試圖使得它的數(shù)字助手Google Assistant聽上去像是人類,給你的計(jì)算機(jī)帶來個(gè)性。
以下是文章主要內(nèi)容:
在谷歌總部,幾位作家在圍著一塊寫著各種想法的白板。它們看起來像是骷髏杰克(Jack Skellington)可能會(huì)寫下的那種東西:“萬圣節(jié)求生背包”,“如何打敗怪獸。”對于37歲的萊恩·杰米克(Ryan Germick)來說,有個(gè)想法尤其搶眼?!叭ツ耆藗儾幌矚g‘聞我的腳’,”他笑道。他的同事艾瑪·科茨(Emma Coats)解釋道:
“這是‘不給糖就搗蛋’的小游戲,其中一個(gè)回應(yīng)是‘聞我的腳?!藗兌嘉直苤患??!?/p>
那個(gè)下午,杰米克一直處在像這樣的頭腦風(fēng)暴會(huì)議當(dāng)中。期間,谷歌員工們討論生活中的一些重大問題,比如冒泡的大汽鍋的聲音和遠(yuǎn)處傳來的嚎叫聲哪個(gè)更加嚇人。這些都是他作為谷歌語音助手Google Assistant首席個(gè)性設(shè)計(jì)師的職責(zé)的一部分。該語音助手服務(wù)已經(jīng)出現(xiàn)惡劣各式各樣的智能手機(jī)上,同時(shí)也登陸了谷歌去年秋季開售的Home智能音箱。
創(chuàng)造個(gè)性
這時(shí)候是8月份,但杰米克的團(tuán)隊(duì)卻在考慮用戶在萬圣節(jié)可能會(huì)問谷歌什么問題,為什么會(huì)有那些問題。人們會(huì)問Google Assistant給些裝扮建議嗎?又或者,他們會(huì)想要聽到很合事宜的笑話嗎?Google Assistant的創(chuàng)造者們認(rèn)為,回答這些種類的問題的關(guān)鍵在于,不要像我們大多數(shù)人那樣看待谷歌,即把它看作不帶感情的信息提供者,而應(yīng)當(dāng)把它看作一個(gè)充滿活力的角色。Google Assistant產(chǎn)品管理主管莉蓮·林孔(Lilian Rincon)表示,“簡單來說,就是我跟谷歌說話能不能就像我現(xiàn)在跟你說話那樣?”
這項(xiàng)任務(wù)實(shí)際上比它聽上去要更加困難。在過去幾年里,開發(fā)聲控設(shè)備已經(jīng)成為硅谷競爭最激烈的科技競賽之一。Google Assistant進(jìn)入三星、LG等Android手機(jī)廠商的產(chǎn)品。亞馬遜在它頗為流行的Echo智能音箱上提供它的語音助手Alexa。蘋果已經(jīng)將Siri整合到各款iOS設(shè)備當(dāng)中。微軟也將它的語音助手服務(wù)Cortana推向從筆記本電腦到恒溫器的各式設(shè)備。
雖然有如此之多的公司在爭相打造各種支持傾聽和對話的設(shè)備,但要具體預(yù)估該類技術(shù)多快會(huì)成為市場主流并非易事。但根據(jù)市場研究公司eMarketer的數(shù)據(jù),今年,有6050萬美國人每月至少使用一次Alexa、Google Assistant或者其它的虛擬助手。Gartner的分析師預(yù)計(jì),到2021年,全球智能音箱銷售額將達(dá)到35.2億美元,較2016年增長近400%。許多科技行業(yè)專家都認(rèn)為,語音是人機(jī)交互的下一個(gè)重大轉(zhuǎn)變。“這將成為一種全然不同的互動(dòng)方式,”艾倫人工智能研究所CEO奧倫·埃齊奧尼(Oren Etzioni)指出,“當(dāng)你能夠跟像酒店禮賓員那樣的虛擬助手對話的時(shí)候,這真的會(huì)引發(fā)巨大的變革?!?/p>
但對著計(jì)算機(jī)喊出指令,跟與之進(jìn)行對話完全是兩回事——這讓谷歌處在不同尋常的位置。該公司開發(fā)的技術(shù)能夠索引海量的網(wǎng)絡(luò)信息,做到人類無法做到的事情,它也由此成為全球最具價(jià)值的企業(yè)之一。現(xiàn)在,它的未來前景可能取決于它能否教導(dǎo)機(jī)器執(zhí)行一項(xiàng)對于大多數(shù)人而言再簡單不過,但對于計(jì)算機(jī)極其困難的任務(wù):閑聊。為此,該公司寄望于一個(gè)不在它平常的招聘范疇內(nèi)的左腦型創(chuàng)意人才團(tuán)隊(duì):小說作家,制片人,視頻游戲設(shè)計(jì)師,共情專家,喜劇演員。如若他們成功的話,那他們就將給谷歌帶來某種它以前從未有過的東西:個(gè)性。
讓Google Assistant變得像人
數(shù)字助手算不是什么新鮮技術(shù)。1952年,貝爾實(shí)驗(yàn)室的Audrey計(jì)算機(jī)能夠識(shí)別口頭說出的數(shù)字,但它要消耗大量的計(jì)算能力,無法理解所訓(xùn)練的語音。1990年,Dragon Systems推出Dictate,該軟件擁有3萬術(shù)語詞匯量,但需要說話人每說出一個(gè)詞都要停頓一下。1997年,該領(lǐng)域迎來了一個(gè)典型的失敗案例。那一年,微軟推出Clippy卡通紙夾,該產(chǎn)品旨在預(yù)測Office用戶的需求和回答問題。但實(shí)際上,Clippy比C-3PO更加糟糕,時(shí)不時(shí)彈出造成干擾,幫倒忙。(幸好它不會(huì)說話。)該功能成了笑柄,最終在2007年徹底退出歷史舞臺(tái)。
直到6年后,Clippy背后的那個(gè)好點(diǎn)子——預(yù)測你接下來可能需要的信息,適時(shí)提供合適的貼士——在蘋果Siri上成形。它可理解特定語境中的問題,經(jīng)過一定的智能技術(shù)處理后會(huì)大聲作出回答。此外,它相當(dāng)風(fēng)趣幽默。很快,蘋果的各家競爭對手紛紛效仿,爭相開發(fā)類似的技術(shù)。
谷歌Google Assistant團(tuán)隊(duì)成員沒有忽視數(shù)字助手的這段失敗史。曾在萬圣節(jié)將自己打扮成Clippy的杰米克指出,未來的數(shù)字助手得不僅僅是問答機(jī)器。畢竟,谷歌搜索在那方面已經(jīng)做得非常出色?!拔覀兿M隳軌蚋@種角色建立連接,”他說,“它部分要做的就是理解人類的經(jīng)歷和人類的需求,它不僅僅要能夠提供信息,還要懂得如何與人們建立聯(lián)系。”
情感聯(lián)系
讓那種角色變得合理的任務(wù)落在谷歌個(gè)性團(tuán)隊(duì)身上,他們一直在致力于將Google Assistant變成像是人類而不是假裝是人類的數(shù)字助手。(那是Google Assistant沒有取像Siri或者Alexa這樣的擬人名稱的部分原因。)作為個(gè)性團(tuán)隊(duì)的角色負(fù)責(zé)人,科茨擁有數(shù)年的虛擬角色開發(fā)經(jīng)驗(yàn)。她在皮克斯動(dòng)畫工作室供職了5年,曾參與《怪獸大學(xué)》(Monsters University)?、《勇敢傳說》(Brave)、《頭腦特工隊(duì)》(Inside Out)等電影的制作?!耙ê芏嗟男乃既ニ伎汲嗣娌勘砬橐酝猓€可以利用哪些其它的工具來進(jìn)行情感聯(lián)系?!?/p>
科茨談到了谷歌在琢磨生動(dòng)但不會(huì)引起誤導(dǎo)的回答時(shí)會(huì)考慮的問題。當(dāng)中包括:用戶希望從互動(dòng)中得到什么?谷歌能夠如何以一種積極正面的態(tài)度作出回答?如何能夠讓對話進(jìn)行下去?科茨舉了一個(gè)例子:被問到是否怕黑的時(shí)候,Google Assistant不會(huì)給出表明它怕黑的回答。相反,它會(huì)說,“我喜歡天黑,因?yàn)樘旌诹诵切菚?huì)出來。沒有星星的話,我們就無法了解行星和星座?!笨拼慕忉尩?,“這是一項(xiàng)來自谷歌的服務(wù)。我們想要它變得盡可能地健談,而不去偽裝成別的東西。”
這往往涉及先分析某人詢問特定問題的言外之意。被問到“你愿意嫁給我嗎?”的時(shí)候——谷歌稱這個(gè)問題被問了成千上萬遍——Google Assistant不會(huì)直接給出回答,而是轉(zhuǎn)而說它很高興主人想要得到更多的承諾。
像這樣的問題要么是問著玩的俗套問題,要么是發(fā)自于復(fù)雜的情感。雖然任何向Google Assistant求婚的人都不大可能想要得到一個(gè)認(rèn)真的回復(fù),但該公司正在試圖系統(tǒng)性地理解提問者的情感狀態(tài)有多大的不同。在谷歌擔(dān)當(dāng)共情設(shè)計(jì)師的丹妮爾·克蕾特克(Danielle Krettek)的職責(zé)就是幫助創(chuàng)意作家理解那一點(diǎn)??死偬乜说慕巧苋菀妆灰曌魇乔楦薪庾x者。坐下來跟她交談沒多久后,我就明白為什么會(huì)這樣:她熱情奔放,充滿活力,任何時(shí)候看她的面部表情,就能知道她的情緒狀態(tài)?!坝械臇|西人們是能夠感覺和表達(dá)出來的,有的東西則表達(dá)不出來?!彼f,“我解讀那些東西的能力就是我對這個(gè)團(tuán)隊(duì)的貢獻(xiàn)?!?/p>
克蕾特克從人體驗(yàn)情緒的不同方式的角度來談?wù)撍母魑煌拢绕涫悄切┫嗨频菀赘慊斓那榫w。她可能會(huì)鉆研失望情緒會(huì)憤怒情緒有多大的不同,又或者為什么放松自如的感覺會(huì)跟滿足的感覺不一樣。這應(yīng)當(dāng)有助于作家們想出帶來共鳴感的回答。以Google Assistant對于“我覺得身心俱?!钡幕卮馂槔貜?fù)道,“你覺得很心煩吧。怎么才能幫到你?”克蕾特克說道,“那種理解會(huì)讓人覺得自己的感受被看見,自己的需要被聽見。它就像是一種眼神接觸?!?/p>
谷歌的個(gè)性設(shè)計(jì)師有時(shí)候從意想不到的地方獲得靈感。據(jù)科茨和杰米克透露,即興劇是最重要的靈感來源之一。那是因?yàn)榧磁d劇需要推進(jìn)會(huì)話,鼓勵(lì)參與者不斷相互接話——被稱作“是的,而且”(yes and)的原則。杰米克表示,谷歌個(gè)性團(tuán)隊(duì)的幾乎所有成員都曾做過即興劇。
從問Google Assistant它最喜歡的冰淇淋口味的例子中,你就會(huì)了解到“是的,而且”原則?!拔覀儾粫?huì)說,‘我不吃冰淇淋,我身子都沒有。’”杰米克解釋道,“我們也不會(huì)說,‘我喜歡巧克力冰淇淋,我每個(gè)星期二都會(huì)跟妹妹一起去吃,’因?yàn)槟且彩遣粚?shí)的?!痹谶@些情況中,作家們會(huì)思索普通的回答來讓用戶繼續(xù)對話。例如,對于那個(gè)冰淇淋問題,谷歌會(huì)回答像這樣的話,“選三色冰淇淋錯(cuò)不了,它總有適合你的味道?!?/p>
不過,讓對話進(jìn)一步展開對于Google Assistant而言仍然十分困難。問它三色冰淇淋中的特定口味,比如香草味或者草莓味,它會(huì)被難倒。谷歌的數(shù)字助手也難以應(yīng)對對話中的一些常見情況,比如理解措辭上不同于系統(tǒng)所輸入的問題的特定請求。另外,谷歌能夠用來理解用戶需求或者他們的情緒狀態(tài)的工具相當(dāng)有限。例如,它無法光根據(jù)用戶的語調(diào)來分辨他們是喜是憂,是不是很疲倦。它也肯定無法覺察用戶的面部表情變化。
對于用戶,谷歌目前要解決的最佳特征是他們的歷史記錄。通過了解用戶以往問了哪些問題,最常使用哪些功能,它能夠試著去避免給出重復(fù)性的回答。未來,谷歌希望根據(jù)用戶與Google Assistant的互動(dòng)方式來更加廣泛地理解他們的偏好?!拔覀冞€沒有完全做到那一點(diǎn),”杰米克說道,“但我們將能夠開始理解,特定的用戶是那種喜歡開玩笑的用戶,還是那種嚴(yán)肅的用戶。對我來說,圣杯就是我們能夠真正理解人的語言,達(dá)到我說出的任何話幾乎都可以理解的地步,”他說,“即便我在情感上有弦外之音,又或者涉及某種習(xí)語?!?/p>
那具體會(huì)在什么時(shí)候?qū)崿F(xiàn),還是未知之?dāng)?shù)。問遍硅谷從事語音技術(shù)的人,包括谷歌的人才,他們基本都是給出像“現(xiàn)在還言之尚早”這樣的回答,也就是說“沒有人知道答案。”
研究音調(diào)的細(xì)微變化
與此同時(shí),谷歌在專注于研究音調(diào)的細(xì)微變化。Google Assistant告訴你天氣狀況的時(shí)候,它會(huì)著重強(qiáng)調(diào)像“基本”這樣的詞語。又或者,你可能會(huì)注意到,當(dāng)它在句子開頭說“不”的時(shí)候,它的聲音聽上去略有上揚(yáng)。那些細(xì)微的音調(diào)變化是有意而為的,它們可能就是詹姆斯·吉安哥拉(James Giangola)正在做的事情。作為谷歌對話和個(gè)性設(shè)計(jì)主管,他是語言學(xué)和韻律學(xué)(研究語言的抑揚(yáng)頓挫)的專家。
在我會(huì)見的所有谷歌個(gè)性團(tuán)隊(duì)成員里,吉安哥拉是最像工程師的那一個(gè)。他來與我會(huì)面的時(shí)候準(zhǔn)備了筆記和談話要點(diǎn)。他非常嚴(yán)肅,但也很興奮地告訴我,做好語音交互對于科技公司來說為什么會(huì)那么重要?!罢Z音用戶界面至關(guān)重要,因?yàn)槁曇艉艽蟪潭壬鲜莻€(gè)人社會(huì)身份的一個(gè)標(biāo)記?!彼f。跟很多其他的Google Assistant團(tuán)隊(duì)成員一樣,吉安哥拉在交談中也常常將語音用戶界面簡稱為“VUI”?!昂悺P勒(Helen Keller),”他表示,“聲音代表你在社會(huì)中的位置?!?/p>
他的職責(zé)還包括選派和指導(dǎo)谷歌聘來的演員給Google Assistant配音。在供職于谷歌之前,吉安哥拉曾在蘋果參與Siri初始版本的開發(fā)。他給我播放了一段他在工作室與Google Assistant配音員共事,指導(dǎo)她進(jìn)入角色的視頻。(谷歌拒絕透露配音員的身份。)在該特定的場景中,吉安哥拉扮演經(jīng)理的角色,詢問谷歌最近與一位應(yīng)聘者的面談進(jìn)行得怎么樣。Google Assistant目前還無法幫助處理該類任務(wù),但未來或許可以。
Google Assistant配音員以一種似乎很有谷歌特色的方式回答道,“他準(zhǔn)時(shí)出現(xiàn),佩戴了一條漂亮的領(lǐng)帶?!闭f的沒錯(cuò),聽上去很正面。她的聲音跟她飾演的那個(gè)無生命的管家的聲音幾乎無法分辨,就只是她說“領(lǐng)帶”(tie)一詞時(shí)略有破音才讓我想到說話的是個(gè)人。那也讓我想到,如果Google Assistant無法理解口語的微妙之處,那它的聲音不管聽上去再真實(shí),也無補(bǔ)于事。跟Google Assistant說“我很孤獨(dú)”,它會(huì)背誦出克蕾特克等人幫助精心設(shè)計(jì)的、帶有同理心的回答。但跟它說“我覺得沒人喜歡我”,它會(huì)回答它聽不懂。
重重挑戰(zhàn)
對于谷歌和它的競爭對手來說,它們要處理一些比解讀語音基本元素更加基本的問題。先吸引用戶便是一個(gè)很重要的問題。谷歌通常都不公開Google Assistant的用戶使用數(shù)據(jù),但根據(jù)市場研究機(jī)構(gòu)Creative Strategies去年的一項(xiàng)調(diào)查,人們說他們很少或者有時(shí)候使用語音功能:70%使用Siri,62%使用Google Assistant。
*問題是另一個(gè)日漸加劇的隱憂。例如,今年早些時(shí)候,來自亞馬遜Echo智能音箱的周圍環(huán)境錄音在阿肯色州的一起謀殺案審訊中作為證據(jù)被提交上去,這是由人工智能驅(qū)動(dòng)的設(shè)備記錄的數(shù)據(jù)第一次被用于美國法庭。像Echo和谷歌Home這樣的設(shè)備一直在收聽,但不會(huì)將信息發(fā)送回開發(fā)商,除非它們有被喚醒——以Google Assistant為例,就是有人說“O.K., Google”的時(shí)候。但考慮到像亞馬遜和谷歌這樣的公司是通過盡可能了解你來賺錢的,在家中放置聯(lián)網(wǎng)的傳聲器的主意會(huì)讓很多人感到不安。谷歌表示它有在它的網(wǎng)站上明確列舉它從其設(shè)備收集的數(shù)據(jù)類型,還指出它的Home音箱上方有指示它處于收聽狀態(tài)的提示燈。
然后,谷歌還面臨一個(gè)根本性的難題。計(jì)算機(jī)還遠(yuǎn)未能夠在人們發(fā)出請求或者提問的時(shí)候察覺可能反映他們的感受的線索。要做到這一點(diǎn),Google Assistant需要從大量描繪用戶在不同情緒狀態(tài)下的聲音的數(shù)據(jù)當(dāng)中進(jìn)行學(xué)習(xí)。“訓(xùn)練數(shù)據(jù)通常都包括相對平靜的環(huán)境中的普通聲音。”卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)科學(xué)學(xué)院語音技術(shù)研究所主任杰米·卡博內(nèi)爾(Jaime Carbonell)指出,“通常來說你無法讓處在巨大壓力下的人提供數(shù)據(jù),在所有的這些狀況下收集聲音數(shù)據(jù)極其困難。”
讓更多的設(shè)備進(jìn)入家家戶戶會(huì)帶來幫助。10月4日,谷歌發(fā)布了兩款新的Home智能音箱,包括一個(gè)相對小巧便宜的版本和一個(gè)高端版本。但亞馬遜在該領(lǐng)域仍遙遙領(lǐng)先。據(jù)eMarketer估計(jì),2017年,亞馬遜Echo音箱將占據(jù)聲控音箱市場70.6%的份額,谷歌將僅占23.8%。
不過,杰米克對此并不擔(dān)心。他也對Google Assistant的缺點(diǎn)毫不諱言。我問他他希望Google Assistant變成哪一種科幻片AI產(chǎn)品,他沒有選擇像《鋼鐵俠》(Iron Man)電影中的Jarvis或者《她》(Her)中的Samantha那樣超級先進(jìn)的、無所不知的品種。他說,他希望讓Google Assistant變得像Netflix的情景喜劇《我本堅(jiān)強(qiáng)》(Unbreakable Kimmy Schmidt)中艾麗·坎伯爾(Ellie Kemper)扮演的角色Kimmy。雖然被邪教綁架關(guān)在地牢15年之久,還遭到了愚弄,Kimmy卻仍能夠看到積極的一面。
“我們常常討論她令人難以置信的樂觀,”杰米克說道,“就像她從地下室出來的時(shí)候那樣,我們并不是總能夠理解語境,但我們會(huì)嘗試保持積極樂觀?!眰€(gè)性就是這樣:古怪也能成為個(gè)性魅力的一部分。



