china0114.com-日韩欧美中文免费,免费视频一区,免费视频一区,国产精品色网

公眾號
關注微信公眾號
移動端
創頭條企服版APP

谷歌開放全新自然語言數據集:多元化場景更詳細標注,讓AI助手更懂人類

5050
網絡大數據 2019-09-10 20:25 搶發第一評
近日,谷歌宣布開放兩個新的自然語言對話數據集,分別是 Coached Conversational Preference Elicitation(CCPE)和 Taskmaster-1。

近日,谷歌宣布開放兩個新的自然語言對話數據集,分別是 Coached Conversational Preference Elicitation(CCPE)和 Taskmaster-1。這兩個數據集旨在對更接近人類對話的數據進行更詳細的標注,并提供到自然語言處理相關研究者更符合生活實際的數據內容。谷歌發布了相關內容詳細介紹該開放數據集,編譯如下。

?

?

數據集背景

目前,智能助理能夠完成多類任務并返回多個主題的個性化結果,例如:電影列表、餐廳預訂和旅行計劃等。然而,盡管近年來,我們在這方面取得了巨大進步,但智能助理依舊未能達到人類理解的水平。

產生這樣的結果,一部分是由于智能助理缺乏高質量的訓練數據;而這些數據恰好能夠準確地反映人們向智能助理表達的需求和偏好方式。

正是因為這些系統的局限性會影響我們表達的「我們希望得到理解」的內容,因此我們常常選擇調整自己的言辭,而反過來去適應智能助理所能理解的內容。換言之,現在的智能助理對話理解能力,遠遠沒有達到人類所需的對話復雜程度。

更自然的對話框數據集

為了解決這個問題,我們發布了 Coached Conversational Preference Elicitation(CCPE)和 Taskmaster-1 對話框數據集。兩個集合都使用了 Wizard-of-Oz 平臺(https://en.wikipedia.org/wiki/Wizard_of_Oz_experiment),該平臺能夠將兩個進行口語對話的人匹配,就像那些想要擁有真正有效的智能助理的人一樣。

對于這兩個數據集,Wizard-of-Oz 平臺內部的設計旨在獨特地模仿現在基于語音的智能助理,在自動化系統的環境中保留口語對話的特征。

由于「人類助理」可以準確地理解用戶所要求的內容,因此我們能夠捕捉用戶如何將自己真實地表達給「完美」的智能助理,以便我們可以繼續改進這樣的系統。

?

?

CCPE 數據集

CCPE 全稱為 Coached Conversational Preference Elicitation,它是我們提出的一種在對話中獲得用戶偏好的新方法,即它允許收集自然但結構化的會話偏好。通過研究一個領域的對話,我們對人們如何描述電影偏好進行了簡要的定量分析;并且向社區發布了 CCPE-M 數據集,該數據集中有超過 500 個電影偏好對話,表達了 10,000 多個偏好。

具體而言,它由 502 個對話框組成的數據集,在用戶和助理之間用自然語言討論電影首選項時有 12,000 個帶注釋的發音。它通過兩個付費人群工作者之間的對話收集,其中一個工作人員扮演「助手」的角色,而另一個工作人員扮演「用戶」的角色。「助手」按照 CCPE 方法引出關于電影的「用戶」偏好。

助理提出的問題旨在盡量減少「用戶」用來盡可能多地傳達他或她的偏好的術語中的偏見,并以自然語言獲得這些偏好。每個對話框都使用實體提及、關于實體表達的首選項、提供的實體描述以及實體的其他語句進行注釋。

偏好啟發

在面向電影的 CCPE 數據集中,冒充用戶的個人對著麥克風講話,并且音頻直接播放給冒充數字助理的人。「助手」則輸出他們的響應,然后通過文本到語音向用戶播放。

這些雙人自然對話包括在使用合成對話難以復制的雙方之間自發發生的不流暢和錯誤。這創建了一系列關于人們電影偏好的自然且有條理的對話。

在對這個數據集的觀察中,我們發現人們描述他們的偏好的方式非常豐富。該數據集是第一個大規模表征該豐富度的數據集。我們還發現,偏好也稱為選項的特征,并不總是與智能助理的方式相匹配,或者與推薦網站的方式相匹配。換言之,你最喜愛的電影網站或服務上的過濾器,可能與你在尋求個人推薦時描述各種電影時使用的語言并不匹配。

有關 CCPE 數據集的詳細信息,請參閱我們的研究論文(https://ai.google/research/pubs/pub48414),該論文將在 2019 年話語與對話特別興趣小組(https://www.aclweb.org/portal/content/sigdial-2019-annual-meeting-special-interest-group-discourse-and-dialogue-call-special)年會上發布。

Taskmaster-1 數據集

在 Taskmaster-1 的對話框數據集中,已經累計了 13215 個基于任務的對話框,包含 7708 個書面表達以及 5507 個口語表達數據。該數據集內容覆蓋了六個生活領域,包括:訂購披薩,創建汽車維修預約,設置租車,訂購電影票,訂購咖啡飲料和預訂餐廳。

面向任務的對話框

該數據集通過兩個程而創建,每個程序都具有獨特的優勢。第一個涉及兩個人口頭交流的「Wizard-of-Oz」方法,其中受過訓練的智能體和人互動以完成任務;而第二個是「自我對話」,其中由單人書面技術增加語料庫大小和說話者多樣性,包含了大約 7700 寫入「自我對話」條目和約 5500 個雙人口語對話。

對于書面對話,我們讓人們根據每個任務概述的場景自己創建完整的對話,從而扮演用戶和助手的角色。因此,雖然口語對話更接近地反映了會話語言,但書面對話既適當豐富又復雜,但更便宜且更容易收集。

我們不會將工作者限制在詳細的腳本或小型知識庫中,因此我們觀察到與現有數據集相比,這一數據集包含更真實和多樣化的對話。

我們還提供了幾種基線模型,包括具有基準性能的最先進神經機器翻譯架構以及定性人體評估。對話框標有 API 調用和參數,這是一種簡單且經濟有效的方法,可避免復雜注釋模式的要求。對話模型和服務提供者 API 之間的抽象層允許給定模型與提供類似功能的多個服務交互。

與傳統的,詳細的策略相比,我們只關注每種類型的會話的 API 參數,而不僅僅是執行事務所需的變量。例如,在關于安排乘坐共享的對話框中,我們將「到」和「從」位置標記為汽車類型(經濟、豪華、帶游泳池等)。對于電影票,我們標記電影名稱、劇院、時間、票數,有時還有屏幕類型(例如 3D 或標準)。語料庫版本中都包含了完整的標簽列表。

Taskmaster-1 數據集(https://ai.google/research/pubs/pub48484)相關內容,在 2019 年自然語言處理經驗方法會議(https://www.emnlp-ijcnlp2019.org/)上出現的研究論文中進行了詳細描述。

我們希望這些數據集對于研究界在對話系統和會話推薦中的實驗和分析都是有用的。

?

?

文章鏈接

https://ai.googleblog.com/

CCPE 數據集下載相關:

https://storage.googleapis.com/dialog-data-corpus/CCPE-M-2019/data.json

Taskmaster-1 數據集下載相關:

https://storage.googleapis.com/dialog-data-corpus/TASKMASTER-1-2019/landing_page.html

分享到:0收藏

上一篇:一圖看懂大數據市場與投資價值 官方倒計時:Python2的壽命還剩113天,逾期停止維護下一篇:

聲明:該文章版權歸原作者所有,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責。如涉及作品內容、版權和其它問題,請在30日內與本網聯系。
您閱讀這篇文章花了0
轉發這篇文章只需要1秒鐘
喜歡這篇 0
評論一下 0
凱派爾知識產權全新業務全面上線
相關文章
評論
試試以這些內容開始評論吧
登錄后發表評論
凱派爾知識產權全新業務全面上線
寧波城市站
金華城市站
×
#熱門搜索#
精選雙創服務
歷史搜索 清空

Tel:18514777506

關注微信公眾號

創頭條企服版APP

china0114.com-日韩欧美中文免费,免费视频一区,免费视频一区,国产精品色网
青青草97国产精品免费观看| 国产麻豆成人精品| 久久99精品久久久久| 不卡视频在线观看| 欧美www视频| 精品美女被调教视频大全网站| 一区二区三区欧美久久| 国产一区美女在线| 欧美日本一区二区三区| 中文字幕在线免费不卡| 国产麻豆一精品一av一免费| 91精品国产综合久久国产大片| 亚洲免费色视频| 国产福利一区二区三区视频| 日韩欧美资源站| 亚洲va中文字幕| 日本精品免费观看高清观看| 国产精品理伦片| 国产不卡在线一区| 精品福利在线导航| 蜜臀av一区二区在线观看| 欧美午夜不卡视频| 亚洲靠逼com| 91美女蜜桃在线| 欧美一区二区视频免费观看| 亚洲国产视频a| 在线观看一区日韩| 亚洲男同性恋视频| av一区二区三区| 国产精品麻豆久久久| 国产成人夜色高潮福利影视| 久久综合丝袜日本网| 国产主播一区二区三区| 欧美成人精品高清在线播放| 日韩av中文在线观看| 欧美日韩一区在线观看| 亚洲一区二区黄色| 色吊一区二区三区| 一区二区在线电影| 99精品视频在线观看免费| 中文字幕乱码久久午夜不卡| 国产乱子伦一区二区三区国色天香 | 国产成人精品影视| 亚洲精品在线免费观看视频| 麻豆精品新av中文字幕| 99久久综合色| 中文字幕在线免费不卡| 99视频精品免费视频| 中文字幕欧美一| 92精品国产成人观看免费| 国产精品电影院| 9久草视频在线视频精品| 亚洲人吸女人奶水| 91黄色小视频| 香蕉影视欧美成人| 欧美一区二区女人| 欧美一区日本一区韩国一区| 日产精品久久久久久久性色| 制服丝袜日韩国产| 另类中文字幕网| 久久精品欧美一区二区三区不卡| 成人午夜伦理影院| 1区2区3区欧美| 欧美日韩综合不卡| 蜜桃传媒麻豆第一区在线观看| 欧美变态tickle挠乳网站| 国产一本一道久久香蕉| 国产精品久久久久一区| 91久久精品一区二区| 五月婷婷激情综合网| 欧美成人午夜电影| 成人免费高清视频| 亚洲精品欧美综合四区| 777奇米成人网| 国产原创一区二区三区| 最新中文字幕一区二区三区| 欧美体内she精高潮| 久久国产尿小便嘘嘘尿| 国产精品色一区二区三区| 欧美性大战久久久久久久蜜臀| 美腿丝袜亚洲三区| 91精品国产综合久久久蜜臀图片| 久久精品噜噜噜成人av农村| 国产亚洲女人久久久久毛片| 91丨九色丨尤物| 天堂av在线一区| 久久久99精品久久| 91极品美女在线| 麻豆国产一区二区| 国产精品色婷婷久久58| 欧美日韩dvd在线观看| 久久99国产精品免费| 欧美一级午夜免费电影| 国产成人av电影在线观看| 亚洲精品日韩专区silk| 精品国产sm最大网站免费看| 97se狠狠狠综合亚洲狠狠| 亚洲视频在线观看三级| 欧美精品久久99久久在免费线 | 色综合久久综合中文综合网| 日本aⅴ免费视频一区二区三区 | 大美女一区二区三区| 亚洲国产日日夜夜| 久久久久久久免费视频了| 欧美自拍丝袜亚洲| 国产精品一二三区在线| 亚洲成人在线网站| 国产精品网站在线播放| 欧美一区二区三区四区在线观看| 波多野结衣中文字幕一区二区三区| 五月婷婷综合网| 免费成人在线影院| 久久久欧美精品sm网站| 欧美片在线播放| 成人午夜av电影| 日本最新不卡在线| 亚洲欧美日韩一区二区| 2024国产精品| 久久福利资源站| 国产精品不卡在线观看| 日韩一本二本av| 91黄色激情网站| 国产成人精品免费在线| 日韩影院在线观看| 亚洲精品伦理在线| 国产三级欧美三级日产三级99 | 亚洲国产欧美在线| 欧美国产成人精品| 日韩片之四级片| 99久久精品免费| 国产精品系列在线观看| 午夜不卡av免费| 亚洲欧美日韩久久| 国产色产综合色产在线视频| 日韩欧美亚洲国产另类| 欧美日韩一区在线观看| 一本久久精品一区二区| 丰满岳乱妇一区二区三区| 久久99精品久久只有精品| 婷婷开心激情综合| 夜夜嗨av一区二区三区网页| 国产精品高潮呻吟久久| 久久这里只精品最新地址| 欧美一级久久久| 精品美女在线播放| 欧美精品自拍偷拍| 欧美亚洲综合一区| 91亚洲大成网污www| 成人午夜精品一区二区三区| 国内成+人亚洲+欧美+综合在线| 奇米影视一区二区三区小说| 亚洲国产综合视频在线观看| 亚洲男人都懂的| 自拍偷在线精品自拍偷无码专区 | 亚洲欧美偷拍三级| 国产免费观看久久| www国产成人| 欧美mv和日韩mv国产网站| 欧美一区二区在线视频| 欧美性一二三区| 欧美亚洲国产一区在线观看网站| 色综合视频在线观看| 色综合久久综合网97色综合| 91蜜桃传媒精品久久久一区二区| 99久久精品费精品国产一区二区 | 国产精品素人视频| 日本一区二区成人在线| 欧美激情一区不卡| 欧美国产精品专区| 国产精品毛片久久久久久| 欧美国产日韩一二三区| 在线观看日韩电影| 在线观看国产精品网站| 在线免费亚洲电影| 欧美亚洲丝袜传媒另类| 欧美精品亚洲二区| 欧美一卡在线观看| 欧美电视剧免费观看| xfplay精品久久| 国产人成一区二区三区影院| 久久久精品免费网站| 国产精品私人影院| 亚洲欧美日韩在线播放| 亚洲一区二区在线播放相泽| 91精品国产欧美日韩| 日韩午夜电影在线观看| 亚洲精品一区二区三区精华液 | 爽好多水快深点欧美视频| 午夜影院在线观看欧美| 日韩av中文在线观看| 九九视频精品免费| 国产成人精品一区二| 91免费小视频| 欧美天堂亚洲电影院在线播放| 欧美久久一二区| 精品免费日韩av| 中文无字幕一区二区三区| 亚洲乱码国产乱码精品精98午夜| 亚洲高清久久久| 卡一卡二国产精品|