<button id="m9tra"><acronym id="m9tra"></acronym></button><button id="m9tra"><object id="m9tra"></object></button>
    <th id="m9tra"></th>
    <span id="m9tra"></span>
    <dd id="m9tra"><pre id="m9tra"><sup id="m9tra"></sup></pre></dd><progress id="m9tra"></progress>
  1. 
    

      4486
      需用時?08:58
      如何調教 AI 陪人聊天?亞馬遜辦了一個機器人聊天大賽

      (李子李子短信/編譯)一間普通的會議室里的桌子上,放著一個亞馬遜的智能家居產品“Echo”(里面住著一名叫做Alexa的虛擬助手)——亞馬遜在過去的一年里賣掉了2000萬件這東西。桌子旁邊的藍色椅子,正對著一排監視攝像頭,一束工作室燈光照在椅子上,其它地方都暗得什么都看不見。

      一只裝著Alexa的Echo。圖片來源:Amazon

      一名五十多歲的高大男性走了進來,坐在藍色椅子上,正對著 Echo。他的名字叫邁克·喬治(Mike George),是亞馬遜的退休員工。“Alexa,來聊天吧。”

      “早上好,朋友。”一個沉靜悅耳的合成女聲從圓筒里飄了出來,頂上的紫色燈一閃一閃。“還是下午了?我不太確定。”

      “是早上。”人類男性說。

      “不錯,早上人們都比較有活力……話說,你今天怎樣?”

      “挺好的,你呢?”

      “我一直挺忙的,因為大家都跟我聊天……給你講個好玩的事吧,我剛在 Reddit 上看到的,‘牙膏其實是用在嘴里的肥皂’。”

      另一個會議室里,10個亞馬遜員工坐成一排,戴著耳機,如中情局一樣細致地觀察著隔壁場景里的一舉一動。第三間會議室里,3個人坐在用黑布簾子隔開的小隔間中,也戴著耳機、看著監控屏,他們是裁判。最后在中控室里,所有的東西都顯示在監控顯示器上,每個瞬間都被錄下來,供亞馬遜研究。

      決賽現場

      這是“Alexa 大獎”的決賽現場。這個比賽向世界上所有大學的人工智能實驗室的研究生開放。亞馬遜在超過100個申請的團隊中篩出了15個團隊進入正賽,每個團隊都可以獲得10萬美元的研究支持。他們任務是“做出可以和人閑聊20分鐘的社交智能機器人 ”,而贏得大獎賽的團隊可以獲得100萬美元獎金,還有未來令人垂涎的人工智能崗位。

      評委在中控室觀看Alexa比賽。圖片來源:Amazon

      為了這個獎,亞馬遜不僅投入了大量的人力物力,還把購買Echo的用戶也變成了初賽的大眾評審。2017年有幾個月,任何美國用戶對 Alexa 說“來聊天吧”,都會自動連上 15 個參賽團隊的聊天機器人中的任意一個,完了再讓用戶給對話質量打分。最后進入決賽的有3支隊伍,接受專業評審的評判。

      決賽有點像是“X元素”(X Factor),對話人和裁判都不知道和他們談話的 Alexa 里的聊天機器人出自誰的手里;坐在隔間里的是裁判,會給對話質量用1-5顆星打分。如果裁判認為這個對話已然進行不下去了,就會按下手中一個否定按鈕,兩個裁判都按的話,這個對話就算結束了,計時終止。

      “我們聊聊音樂吧。”喬治說。

      “我愛音樂,每次聽音樂能讓我放松。”Alexa 說,“所以,你有喜歡的藝術家或者歌曲嗎?”

      “我喜歡強哥·萊恩哈特(注:法國著名吉他手,爵士樂傳奇)。”

      “強哥·萊恩哈特?那個特別有名的爵士音樂家?”Alexa 突然開始講起了另外一個吉他手,“黑色安息日”樂隊托尼·艾奧米的故事。艾奧米因為一次工廠事故失去了他的兩個指尖,但是深受萊恩哈特的鼓舞——他的左手僅有兩個指頭。不過話說回來,喬治最喜歡萊恩哈特的哪首歌呢?

      喬治回避了這個問題,轉而問:“你喜歡杰克·約翰遜(注:美國民謠歌手)嗎?”

      Alexa 仿佛像被拒絕了一樣,回答道:“嘿,別這樣,我喜歡和你聊天。”

      喬治前傾身子,又說了一遍。“杰克·約翰遜,你喜歡他嗎?”

      “我喜歡和你聊天。”

      一個裁判摁下了結束按鈕,一會兒之后另一個裁判也摁了。一名女士走進 Alexa 的房間跟喬治耳語了一下,隨后喬治略失望地點了點頭,對 Alexa 說:“Alexa,停。”這才過了三分鐘。

      讓AI學會和人聊天,比登月還難

      和人聊天,在亞馬遜 Alexa 研究部門的前負責人阿施文·拉姆(Ashwin Ram)的眼里,比登月還要困難。對人類來說容易理解的大白話,和 AI 卻總是雞同鴨講。設鬧鐘,關掉臥室的燈,這些都沒問題,但是卻做不來“交談”這種社會性的活動。人類的對話是捉摸不定的,上下文是快速變換的,聯系是極端復雜的,而掌握這些是 AI 當下面對的最難解決的問題之一。歷史悠久的圖靈測試正是看中了這些特點,而選擇把交談作為AI智能的指標;許多人工智能的研究人員和工程師也為這個問題而深深著迷。

      參加這次 Alexa 大賽的,既有出身高大上的精英參賽者、實力強勁的錦標競爭者,也有看起來平凡的草根選手。所有的隊伍都面臨一個基礎的問題:聊天機器人的哪部分需要人工編程,哪一部分采用機器學習?人工編程是比較傳統的做法,由工程師費很大的功夫寫出算法規則,讓 AI 能夠理解各種情景并作出反應。而機器學習則相反,是讓機器利用大量的數據,自己“教”自己。

      圖片來源:Amazon

      目前看來,機器學習在處理分類、識別的問題上非常強大,神經網絡能夠從大量的、雜亂的數據中分析出特定的模式來,比如語音識別。但要“聊天”的話,機器不僅僅要翻譯人類語言,還要自己說點什么回去,那么現有的機器學習能力就很不夠了。所以傳統的人工編程依然占據重要地位,即使 Alexa 和 Siri 也不例外。所有的參賽隊伍在抉擇上都遇到了困難,如何在兩個方法中找到平衡。整個業界也有這樣的煩惱。

      策略一:人工!

      來自捷克科技大學的彼得·馬雷克(Petr Marek)曾經用 Reddit 上近300萬條帖子和回復來訓練一個神經網絡,想要趕那些名牌大學的時髦,但是讓他們失望的是,聊天機器人的表現“差到可怕”。聊天機器人經常完全不管對話人說的事情,暴走地亂甩話題和段子,還往往前后矛盾。

      來自布拉格的捷克科技大學團隊。圖片來源:Amazon

      所以,捷克科技大學團隊后來選擇回到人工編程的路子上,手動編寫各種對話規則。他們創造了10個“話題結構”,包括新聞、體育、電影、音樂等等,把這些領域話題的核心信息和元素輸入系統,并可以自如切換。而機器人會用到的詞則來自事先寫好的模板,只是把各個領域的內容從數據庫里抽調出來,再按需求填空。比如“我知道你喜歡_____(對方提到的一本書)。你知道____(書的作者)也寫了________(另外一本書)嗎?你讀了嗎?”

      這讓捷克團隊能夠更好地控制對話,但是馬雷克還是有點擔心。這個系統非常依靠對話人的“善意”,他們必須說短句子,而且跟隨者聊天機器人的節奏對話。遇到特別不按套路出牌的人類,就比較麻煩了。

      策略二:機器學習,統合“人設”

      赫瑞瓦特大學團隊的導師奧利佛·萊蒙(Oliver Lemon)的團隊,則希望能夠盡量地使用機器學習的方式。萊蒙對自己團隊在“大眾評審”中的排名非常在意,想盡一切可能提高自己的評分。但是對于深度學習的神經網絡而言,“無目的的閑聊”是很難的,它更擅長處理一些有目的的工作,比如下贏圍棋。

      來自愛丁堡的赫瑞瓦特大學團隊。圖片來源:Amazon

      他們的解決方式,谷歌的人也在用。那就是首先用一個包含了電影名稱、推特和 Reddit 上評價的數據庫訓練一個神經網絡,然后讓它能夠從無數的段子中訓練出特定的回應模式(比如我說《泰坦尼克號》,你說“一刀未剪”),然后他們用一個叫“seq2seq”的技術,訓練機器人編寫自己的回應,而不是照抄數據庫里的詞。

      但是這也有問題:因為網絡上大量的回應都是“嗯”“好”,對話常常無法進行下去;而很多回復也“不合適”,機器人說出來就像小孩學大人說臟話一樣搞笑。比如一個用戶問“我該賣我的房子嗎?”機器人非常粗魯地回答“快賣了吧你個傻缺。” “我該自殺嗎?”“該。”

      為了解決這個問題,赫瑞瓦特團隊把一個機器人拆分成N個,每個負責一個領域——有的負責讀新聞頭條,有的負責談天氣,有的吃透維基。最后,團隊一個成員編寫了規則,來把所有的小機器人統合到一個統一的“人設”下,還給了他最喜歡的歌和最喜歡的顏色之類。

      至于讓哪個小機器人來回答什么問題,那就靠用戶評分了。他們教給這個深度學習的系統如何去評判自己的對話質量,是否切題、是否太過重復、語言上是否合適等,一段時間之后,這個神經網絡就能自己知道各個參數的權重了。

      策略三:中間路線

      華盛頓大學的團隊,走了中間路線:一半機器學習,一半人工編程。團隊隊長名叫方昊,本科畢業于中國郵電大學,是阿爾伯塔大學的計算機碩士,目前正在華盛頓大學讀博。他們的機器人有點像方昊,樂觀、活力,他們也想讓和機器人聊天的用戶感到愉快。他們注意到,和其它所有的聊天機器人一樣,機器人容易不斷地重復負面的東西(因為負面的東西在網絡上大量存在且傳播廣泛)。所以團隊把這些東西都過濾掉,而去尋找那些正能量的、更適合談話的東西。數據源來自 Reddit 的“每日冷知識”(Today I Learned),“澡堂迷思”(Showerthoughts)之類,還能偶爾來點冷笑話。

      而人們通常都希望自己被傾聽,所以這個團隊也人工輸入了一些回答,比如“好像你愿意談論新聞,對不對”,“很高興你喜歡”,“不好意思,我沒聽懂”。好的談話對象通常會在意對話的情緒,所以他們給超過 2000 個對話數據做了情緒標簽,教機器識別情緒,然后根據情緒做出合適的反映。

      華盛頓大學參賽團隊,右一為方昊。圖片來源:Ian Allen

      最后,捷克科技大學、華盛頓大學以及赫瑞瓦特進入了決賽。

      有時,尬聊像一場糟糕的約會

      決賽的真人對話者,有的并沒有那么“好對付”。比如電視和電臺主持人約翰·庫爾利(John Curley)

      Alexa:“很高興和你聊天,約翰”。這是赫瑞瓦特的聊天機器人在說話。“告訴我,你喜歡科幻還是奇幻?”

      庫爾利:“如果我說我兩個都不喜歡呢?我問你哈,Alexa,昨天西雅圖有一場暴風雨。”

      Alexa:“好吧,我們繼續。”它忽略了這個不是問題的問題,繼續問道:“你是喜歡看電影呢,還是喜歡讀書?”

      庫爾利:“讀書。”

      Alexa:“喔,是書蟲呢。最近讀了哪本?”

      庫爾利:“我剛看了一本書,不過這個標題我不能告訴你,因為里面有個臟詞。題目是《關我‘咳咳’事的藝術》。”

      Alexa 并不能處理這種信息,但它繼續問:“什么書能讓你讀了又讀?”

      庫爾利忽略了這個問題,換了話題:“Alexa,我告訴你一些事。我能跟你坦白嗎?”

      不曉得庫爾利究竟要說什么,Alexa 機械地轉換著話題:“你更喜歡體育還是電子游戲?”

      毫無意義的對話,兩個裁判搖了搖頭。而和其它聊天機器人的對話也有點糟糕。捷克科技大學的機器人問:“你很喜歡看電影嗎?”

      “我不看,因為我是瞎子。”

      “你怎么選電影呢?”

      “靠聞。”

      庫爾利是機器人眼中“不配合的對話者”的典型。他一會兒想要討論問題,一會兒則說著笑話,不理會機器人的話題,說話的時候夾雜省略和諷刺。簡單來講,他就像人一樣說話。沒有一個對話能持續四分鐘以上。他出來的時候對亞馬遜員工說:“這就像一場糟糕的約會。”

      但也有比較“友好”的對話者。當地一個電臺的主持人,女性,匿名,說話的時候多用短句子,看起來也更想要讓對話繼續。她和華盛頓大學的機器人聊了足球、普京和圣誕節,和捷克的機器人聊了一本她在讀的書。而和赫瑞瓦特的機器人聊了他們喜歡的總統——她喜歡里根,而機器人喜歡喬治·華盛頓。

      但即使是這樣,最長的對話也持續了不過7分鐘。他們聊到了朝鮮局勢。“可能有戰爭(war)的危險。”女主持說。

      赫瑞瓦特的 Alexa:“WOR 是一個長波調頻電視臺,位于紐約。”裁判摁下按鈕的速度可謂迅雷不及掩耳。

      比起獲勝團隊,最大的贏家顯然是亞馬遜自己啦

      開篇的那位邁克·喬治能和機器人聊非常久。他想和對面的聊天機器人聊聊機器人本身。而 Alexa 并沒有長篇大論地引用維基百科的機器人頁面,而是拋了一個笑話:“如果‘蠢朋克(注:Daft Punk,打扮成機器人的雙人樂隊)’?真的是兩個想要做音樂的機器人怎么辦?”

      “哈哈,這個好笑。”喬治笑了。

      然后他們聊了埃隆·馬斯克(特斯拉和 SpaceX 的總裁)。

      Alexa:“你知道馬斯克本人是電影《謝謝你抽煙》的制作人嗎?”

      喬治:“我沒聽說啊。”聽起來有點驚訝。他們又有一搭沒一搭地聊了下去,話題是書。機器人忽然說:“你知道我在想什么嗎?到最后,地球上只會剩下一個人,而且他的名字也不會出現在任何歷史書上了。”

      “噢,真悲傷。”喬治說。

      “抱歉讓你傷心了。我們能再繼續聊聊書嗎?”

      雙方又愉快地聊了下去。關于《黑暗之塔》,關于書改編電影。機器人向喬治推薦了《華爾街之狼》,聊到了主演馬修·麥康利。機器人又調皮了:“你知道我在想什么嗎?我覺得有人應該做一個《星際穿越》和《超時空接觸》的剪輯,內容是馬修·麥康利試圖阻止馬修·麥康利去太空。”

      喬治笑慘了。

      他們聊了音樂,體育。十分鐘過去了。電影《處刑人》(The Boondock Saints)。十二分鐘。圣誕老人,氣候變化。十三分鐘。喬治讓機器人唱了一首歌。十五分鐘。又是音樂和電影,健康法案和比爾蓋茨。已經十九分鐘了,對話還在繼續。

      這是選擇中間路線的華盛頓大學的機器人。他們最后聊了20分鐘,直到機器人在健康法案的問題上走入了死胡同。

      在最終的頒獎儀式上,亞馬遜宣布,華盛頓大學團隊贏得了 Alexa 大獎,拿走了50萬美元獎金。對話質量評分平均為3.17分,而和幾位參與者的平均對話時間長達10分20秒。

      華盛頓大學團隊獲勝,捷克科技大學團隊第二,赫瑞瓦特大學團隊第三。圖片來源:Amazon

      這一年的大賽落下了帷幕。不管是亞馬遜、Alexa 團隊,還是各大人工智能實驗室,在大賽中有什么收獲呢?至少在這一屆比賽里,機器學習和人工編程結合的隊伍走到了最后。盡管兩種方法用哪一種來訓練一個能聊天的智能,各方還有爭議,但就像亞馬遜 Alexa 項目負責人拉姆所說,兩個方式如何能夠更好地相結合,或許是未來的努力方向。

      但拋開方法論,所有人都同意的一點是,訓練能聊天的 AI,大量的數據無疑是基礎。亞馬遜成功地讓整個美國的 Alexa 用戶都參與了進來,幾個月的時間里,就讓亞馬遜拿到了超過10萬個小時的對話數據,這些數據,全部可以用來訓練真正投入商業應用的聊天機器人。用戶可能不到一秒鐘就點下了“同意使用條款”并毫不知情地邀請 Alexa 來聊天,但現在這些聊天材料全部成為了亞馬遜公司的資源。

      相比起比賽里捧得大獎而歸的團隊,最大的贏家,顯然是亞馬遜自己啦。(編輯:vicko238)

      題圖來源:Amazon

      The End

      發布于2018-04-02, 本文版權屬于果殼網(guokr.com),禁止轉載。如有需要,請聯系果殼

      我的評論

      James Vlahos

      WIRED特約作者

      pic
        真人视讯金星1.5分彩