失獨媽媽求助阿里巴巴AI實驗室,希望重現已逝女兒的聲音
大數據文摘 / 何渝婷編譯
2020-01-21 14:00

(示意圖/取自pixabay)

《奇葩說》的這期辯論題目,似乎在探討一個離我們仍遙遠的科幻話題,但去年9月,阿里巴巴人工智慧實驗室真的接到了這樣一個請求。

請求幫助的是一位上海媽媽,她的女兒因患T淋巴母細胞性淋巴瘤離世,年僅14歲。

懷抱著太多孩子生前未能實現的遺憾,這位媽媽決定將女兒做成「AI」,用另一種方式懷念她。

去年9月,她嘗試在微博向阿里巴巴人工智慧實驗室發出了這條消息。

「可以把我故去的女兒,做成和我互動的軟體嗎?」

沒想到,這條求助很快有了回應。

三個月的時間讓失獨媽媽重新聽見女兒

考慮許久,阿里巴巴人工智慧實驗室負責人、語音助手首席科學家聶再清,接受了這位媽媽的求助。

單從技術角度考慮,在足夠的語料數據和算法的加持下,透過目前的語音合成技術,「複製」一個虛擬人的難度並不大。

聶再清稱,目前的技術條件下,通過個性化語音合成技術,以及對話技術,需要大概十分鐘的、特別乾淨的音頻訊號,就能夠讓我們的機器進行學習。

但對阿里人工智慧團隊而言,幫這位媽媽重現女兒的音容,面對的不只是技術難點。

首先,最大的技術問題是可用語料不足。要實現語音合成,必須提供給算法大量可供訓練的素材,但女兒生前留下的語音素材並不多,而且能提供的多是用智慧型手機錄下的影片,大多環境嘈雜。據阿里團隊稱,所有的片段加在一起,能夠用作訓練的語音素材,只有短短的兩三分鐘。

這就讓訓練難度變得極大。因此,聶再清告訴求助者,憑藉現有的技術,很難達到她心中理想的效果,而這也就意味著,無論技術團隊如何努力,AI終究不是「真實」的女兒。

其次,除了語音合成,聶再清團隊也坦誠向她表達了對「AI女兒」認知上的擔憂。當媽媽問出一個問題,「AI女兒」是否能夠以女兒的認知水平和價值觀來回答,在這方面,技術難度較大。

另外,市面現有的語音助理,例如siri,當輸入的語言超過AI的理解範圍時,它的設定是去網路搜尋一個最接近的回答進行回饋,這就存在很大的不可控性。比如上個月,亞馬遜的語音助理Alexa,就因為從維基百科中提取到了一些惡意文本,勸主人「自殺」,對英國一位29歲的醫生,說出了「用尖刀刺入心臟」這樣可怕的話。

為這位媽媽做出的「AI女兒」,也因此會存在回應的隨機性,這很有可能在某些情況下冒犯到她和她的家人。

瞭解了可能面對的風險後,這位媽媽和她的丈夫,還是堅持了最初的想法,她表示不在乎虛擬女兒偶爾的「冒犯」,這是成長期孩子最正常的表現。之後,他們配合技術團隊列出了女兒生前感興趣的話題,希望在這些話題下進行訓練,確保在某種程度上,虛擬女兒的回答是可控的。

除了技術難點,阿里的工程師也就此與羅漢堂專家,以及外部的心理學家,在技術之外的可能性上展開探討。三個月後,他們終於做出了一份小成果,幫助這位媽媽合成了一段女兒長達20秒的語音,存在了天貓精靈(阿里巴巴旗下智慧音箱產品)裡。

這段語音復原了女兒寫的一篇作文,記錄了她和媽媽一起去爬山的故事。

儘管最終做出的音頻樣本與設想還有一些差距,但媽媽表示,音頻開頭的語氣,和女兒幾乎一模一樣。

關於具體的研發過程、算法實現等,大數據文摘嘗試採訪阿里巴巴相關負責人。但阿里表示,現階段仍不希望在過多的聚焦在技術細節上,他們也擔憂在相關倫理探討更清晰前,這一舉動會被模仿。

美國記者自學程式碼,讓去世的父親在手機中復活

想要用人工智慧留住逝去的親人,這位上海失獨媽媽並不是第一例。

2016年,一位美國記者James Vlahos的父親被查出得到肺癌晚期,悲痛的他想要盡可能留住自己與父親的記憶。

James突然冒出了一個瘋狂的想法:與其將這些資訊存在紙上,不如利用AI讓它們活過來,他決定開發「Dadbot」,一個擁有父親記憶的聊天機器人。

James首先說服了自己的家人與父親本人,老爺子對此意外的沒有任何抵觸,同時還覺得很酷。於是James讓父親在生前最後幾個月講述其生平故事。

接下來他開始攻克技術難關,自學程式碼,利用AI公司Pull String的開源軟體進行開發。其中包括140多個相關的問題詞語,並用多達9萬個詞的語料庫訓練AI。

最終,趕在父親離世前,他完成了一個為父親量身訂製的人工智慧程式,當他和家人想父親時,就打開這個程式聊幾句,這給他和他的家人莫大安慰。

在James心中,這還差得很遠,他要的不是智慧語音助理,而是那種與父親交流時的熟悉感。但顯然,9萬字的生平記錄也無法填充一個真實的靈魂,於是他不得不為父親重新製作一塊更大的「記憶拼圖」。

新的問題框架更為龐大詳細,這些問題涵蓋了父親的父母、他的童年時光、學生時期、與母親的甜蜜邂逅、職業的選擇等。另外,聊天機器人的訓練極為枯燥,據James介紹,他只能頻繁的與其交流,讓Dadbot能夠理解每句話的含義。同時要尋找BUG,因為有很多詞彙,機器人並不理解,所以需要他手動調整。為此,他經常拉著全家人和Dadbot聊天,全方位的「轟炸」這位AI老爸。

這段時期對於James來說也非常難熬。他不確定自己是否扭曲了對父親的感情,也很猶豫Dadbot的設定,應該無限趨於真實的父親,亦或是僅僅作為一個回憶道具。

Dadbot在成長的同時,父親的生命也在流逝。好在皇天不負苦心人,隨著技術提升與不斷的調整測試,Dadbot最終在父親臨終前,擁有了一定的智慧表現,聊天不再是一問一答的獨白,更像是有思維的對話。

當前技術的迅速發展,讓這種「複製」技術的門檻迅速降低,也許很快,不只是技術機構,很多非專業人員也能通過自學來完成這件事。

去年熱播的日劇《輪到你了》中,男主角就透過大量的照片和聊天記錄,復原了去世的女主角,在手機裡創造了一隻「菜奈AI」。它能夠用女主的聲音和語氣與人對話,成為了男主案件調查過程中的最大安慰。

受其啓發,有不少網友也分享了如何通過風格遷移等方式,讓機器模仿自己的話語,製作一個AI版的自己。

日前,78歲的美國驚悚小說家、好萊塢編劇Andrew Kaplan已同意成為「AndyBot」,也就是一個「虛擬人」,他將在雲端上永生數百年,甚至數千年。如果一切按照計劃進行,未來幾代人將能夠使用行動設備,或智慧語音運算平台與他互動,即使在他的肉身去世很久之後,仍能得到他一生經驗的寶貴建議。

但是,這樣的舉動是否存在倫理問題和法律風險?其所屬權如何定義?針對逝者的留存數據歸誰等所有的問題,文摘菌也諮詢了相關專家,其表示「逝者虛擬化」仍然是一個非常新的技術領域,和目前法律界已有相對成熟共識的「複製人」以及「AI人格」議題都不太一致,當前法律界還沒有一個定論。

如果用AI「還原」已逝親人,正成為一種作用於失獨家庭的新可能,那麼需要首先確定的是,如何讓它成為輔助療癒的手段,而不是讓失去親人的人,沈溺在被技術還原的陪伴中,影響真正意義上的康復。

在開頭提到的《奇葩說》辯論題目中,六位辯論選手用了近兩個小時的時間,去探討「還原」已逝親人是會治癒我們,還是會令我們跌入思念的深淵。當前技術條件下,儘管被「復活」的AI,目前只能完成一些微弱的功能,距離科幻片中的場景還有很大距離,但依然值得更廣泛的討論。

和所有的技術一樣,AI最終仍要作用於人。如何在智慧和人性中實現平衡,是一道永恆的命題。

而面對這一問題,這位想要復活女兒的媽媽早已有了自己的判斷。

「儘管技術的完善需要時間,但已經給人帶來了希望,這是最重要的。」

本文為品玩授權刊登,原文標題為「失獨媽媽求助阿里:將逝去女兒做成AI,3個月後重現女兒聲音