9月 21 日,2019 達觀杯”文本智能信息抽取挑戰賽在北京長峰假日酒店順利舉行。經過兩個月的激烈角逐,實力卓群的 10 強決賽隊伍從近3000名參賽選手中脫穎而出并在頒獎典禮上進行了方案匯報,最終由tonyxu戰隊贏得冠軍,獲得三萬元現金大獎等豐厚獎勵。
(圖 2019達觀杯”文本智能信息抽取挑戰賽頒獎典禮全體合影)
大賽背景
自2017年以來,由達觀數據主辦的“達觀杯”系列算法大賽至今已經舉辦了三屆,在全國范圍內引起極大關注的同時也陪伴和見證了中國NLP愛好者們的成長。第一屆的賽題為“個性化推薦”,第二屆的賽題為“文本分類”;今年的“達觀杯”文本智能信息抽取挑戰賽以“信息抽取”為題,賽題同樣來源于達觀的真實業務數據。比賽給定一定數量的標注語料以及海量的未標注語料,評估選手在預測集上識別三個字段的能力。
信息抽取是目前人工智能領域許多應用的基石,對產業界有著重要的實用意義。達觀數據作為中文自然語言處理的領軍企業,已經將信息抽取技術應用于金融、制造、通信、法律、審計、媒體、政府等多種文字密集型行業。
通過提供業務場景、真實數據、專家指導,達觀數據秉承初衷,期待能通過每年一屆的“達觀杯”算法大賽帶動產學研融合,為業界選拔和培養更多卓越人才,見證更多的前沿研究成果落地。
大賽自6月28日在Biendata平臺上線以來,共吸引選手近3000人,組成1258支隊伍參賽。參賽選手來自國內外各大高校、科研機構及企業,其中來自985、211的選手占報名人數的40%,BATT等多個知名企業均有代表參與。
頒獎現場
一等獎
【tonyxu】
來自南京的徐恒以單人身份參賽,憑借出色的技術和106次提交的毅力斬獲冠軍榮譽。
二等獎
【sixcluster】
這是一只來自浙江大學的戰隊,由在讀及已畢業的五位博士及碩士研究生組成,他們是:姜興華、黃穎驊、嚴雨姍、錢煒、諸凱麗。
【xlx_444444】
以單人身份參賽的徐曉亮是湖南大學碩士研究生,目前主要從事文本分類、機器翻譯、實體識別等nlp相關工作。
三等獎
【whaido】
目前就職于太平洋保險集團的盧凌云,致力于NLP相關技術的研究及創新項目的孵化工作。
【poorman】
團隊成員馬文翔、王慧、付斌斌分別來自山東大學、中山大學和華南理工大學。“達觀杯”是這支團隊第一次參加算法競賽。
【西南交大一枝花】
是來自于西南交通大學信息科學與技術學院,計算機科學與技術專業的一支研究生團隊,成員有:劉赟、別勇、羅友恒、曾崳、馬敏博五人。
優勝獎
?
【Arrow】
羅懷芍是一名西南交通大學研究生。他的研究方向是情感分析,機器閱讀理解。
【大白】
團隊由梁少強、田佳來、魏強、王煦中四名隊員組成,在許多競賽中都有出色表現,這是本支隊伍第二次參加“達觀杯”并獲獎。
【sk2】
劉偉棠在日常工作中主要從事文本、警情、筆錄等公安行業文本挖掘工作。
【deja vu】
團隊的主要成員來自微軟,從事人工智能領域的相關工作,成員三人:黎彬、劉淑雯、崔慶才。
大咖對話
達觀數據創始人兼CEO陳運文博士,達觀數據聯合創始人、本屆“達觀杯”文本信息智能抽取挑戰賽命題人高翔,達觀數據北京辦公室總經理徐紅,大賽合作伙伴浦軟孵化器、浦軟創投項目部負責人易歡,以及在自然語言處理領域享有盛譽的學術界權威——清華大學長聘教授、博士生導師、中國中文信息學會語言與知識計算專委會主任李涓子應邀作為頒獎嘉賓并出席了本次活動。
達觀數據創始人陳運文發表開場致辭時表示,希望通過達觀杯比賽讓年輕朋友增長見識、積累經驗,在未來的職業發展當中取得越來越好的成績。未來NLP是大有可為的,達觀數據作為行業的領軍者,希望能夠聚攏大家、發揮智慧、共同攻克難題,相信未來會有越來越多的智能化系統發揮作用,改變人們的工作方式和生活方式。
本次活動同樣是一場學術界與產業界思想交流的盛宴,會上李涓子教授發表了題為《知識圖譜與表示學習》的演講,從第三代人工智能和知識圖譜的關系出發,為現場來賓和參賽選手分享了團隊研究領域的前沿成果。并介紹了在”數據-信息-知識-智能”的時期,知識圖譜作為實現智能系統的一個基礎設施,如何通過知識引擎,去構建從數據到知識的轉化,去實現機器智能的研究進展。
達觀數據技術帶頭人之一,本屆“達觀杯”出題人高翔帶來了《自然語言處理的應用和實踐》主題演講,與現場眾多的年輕參賽者進行了交流。在分享中,高翔對賽題和智能文本信息抽取技術進行了深入解讀,總結并點評了獲獎選手的方案選用策略。最后,他結合實際工作場景分享了算法選擇建議。他強調,技術的價值在于服務客戶,無論小業務還是大場景,無論是底層還是上層,信息抽取技術都是無法繞開的重要環節,對產業界有重要的意義。