2022國際大數據競賽開賽,教AI當好「一帶一路」翻譯官

陝西消費網 發佈 2022-08-11T09:31:36.496490+00:00

8月10日, 聯合國國際教科文組織國際工程科技知識中心第四屆「一帶一路」國際大數據競賽暨第八屆百度&西安交大大數據競賽正式啟動,本屆賽題聚焦「低資源語言機器翻譯」行業難題,向全球開發者發出邀請。

8月10日, 聯合國國際教科文組織國際工程科技知識中心(IKCEST)第四屆「一帶一路」國際大數據競賽暨第八屆百度&西安交大大數據競賽(以下簡稱「國際大數據競賽」)正式啟動,本屆賽題聚焦「低資源語言機器翻譯」行業難題,向全球開發者發出邀請。

百度發布稀缺語種任務 挑戰機器翻譯難題

截至今年5月,我國簽署的「一帶一路」合作文件已涉及110多種語言,沿線國家和地區在經濟發展、民生改善等方面的合作日趨深入,對多語言翻譯的需求快速增長。

本屆大賽賽題——「一帶一路」低資源語言翻譯,重點關注法、俄、泰、阿與中文的互譯,突破了國際機器翻譯以英文為中心的評測慣例,旨在鼓勵全球青年挑戰低資源機器翻譯任務,融入「一帶一路」建設。

「幫助人們跨越語言鴻溝,與世界自由溝通」是百度翻譯一直以來的願景。自2010年開始研發機器翻譯以來,百度在多語言翻譯、多模態機器翻譯等核心技術以及產品方面持續創新。如今,百度翻譯已經支持超過200種語言互譯,可以支持文本、語音、圖片與文檔翻譯,每日翻譯超過千億字符,服務全球用戶。百度技術委員會主席吳華表示,「百度翻譯致力於幫助人們與世界自由溝通」,這正是本屆賽題的技術基因。

頂級賽事 邀請逐夢青年推動全球互聯互通

國際大數據競賽於2015年由百度和西安交通大學聯合創辦,鼓勵選手用AI技術解決現實問題。2019年,百度與IKCEST、西安交通大學、絲綢之路大學聯盟合作,將大賽升級為國際賽事。


啟動儀式上,中國工程院國際合作局局長、IKCEST常務副主任田琦指出,本屆大賽致力於提升「一帶一路」重要語言的機器翻譯質量,意義重大,他期待越來越多逐夢青年加入到推動全球互聯互通、創新發展的行列中來。

印度科學院院士、IKCEST理事會成員N.巴拉克里斯南(Narayanaswamy Balakrishnan)表示,「這次比賽將讓全球更加靠近『類人機器翻譯』的目標。」

回顧大賽8年曆程,西安交通大學常務副校長鄭慶華教授以「三個飛躍」概括:從國內競賽到全球大賽的級別飛躍,從幾十所高校到上萬支隊伍的規模飛躍,從單一的人工智慧大數據算法到綜合型、創新型、設計型的內容飛躍。

以賽促創 產學研合力完善AI人才培養生態

本屆大賽採用機器翻譯主流的BLEU評價指標。初賽階段,選手們將得到中法、中俄、中泰各10萬句對作為訓練數據。複賽階段,以中阿5萬句作為訓練數據。複賽排名前16的隊伍,進入決賽,現場答辯。


百度將為選手提供基於「PaddlePaddle」的基準模型以及免費、高性能算力支持,由國內知名語言服務解決方案提供商譯馬網提供部分語料數據。本屆大賽的所有數據集均會於賽後在「千言開源數據集」平台(https://www.luge.ai/#/)持續開放,助力更多AI人才投入產業研發,促進技術進步。

國際大數據競賽初賽報名截止時間為2022年9月30日,詳情請登錄競賽官網(https://www.ikcest.org/bigdata2022)。




關鍵字: