計算機視覺方向的頂級學術會議之一國際計算機視覺大會(ICCV)近日在韓國首爾落幕。會議期間舉辦的視頻描述競賽(VATEX Captioning Challenge)結果也同時揭曉。中科院自動化所視頻內容安全團隊和人民中科智能技術有限公司組成的聯(lián)合團隊在中英文描述兩個賽道均獲冠軍。
“人民中科”是人民網(wǎng)與被稱為“人工智能國家隊”的中科院自動化所強強聯(lián)合,共同發(fā)起設立的人工智能科技公司。人民中科融合了人民網(wǎng)的內容風控能力和中科院自動化所的人工智能技術儲備,人民中科作為人民網(wǎng)的“人工智能技術引擎”,將圍繞“人工智能+內容安全”,深耕行業(yè)需求,攻克核心關鍵技術,研發(fā)一系列內容風控產品。
據(jù)了解,ICCV會議由電氣和電子工程師協(xié)會(IEEE)主辦,每兩年召開一次,被中國計算機學會等機構評為最高級別學術會議,在業(yè)內具有極高的評價。本次比賽由國際計算機視覺大會ICCV和美國加州大學圣巴巴拉分校UCSB聯(lián)合舉辦,分為中文描述和英文描述兩個賽道,吸引了來自美國、歐洲、亞洲等世界各地20多支代表隊,包括英國帝國理工大學、澳大利亞阿德萊德大學、北京大學、人民大學等知名高校都派出代表隊參賽。
冠軍聯(lián)隊由中科院自動化所研究員、人民中科首席科學家胡衛(wèi)明,中科院自動化所研究員、人民中科董事長李兵,以及中科院自動化所副研究員原春鋒帶隊指導,團隊成員包括研究生張子琦、史雅雅和魏久桐。
“視頻描述,簡單來講就是給出一段視頻,讓機器自動用文字進行描述,類似于‘看視頻說話’。”李兵告訴人民網(wǎng)記者,視頻描述涉及到計算機視覺和自然語言處理兩個領域,而且視頻中有表觀、運動、語義屬性甚至語音等多個模態(tài)。“因此如何更好地融合多模態(tài)信息,成為本次比賽的最大挑戰(zhàn)。此外,在沒有大量樣本訓練的前提下,還需要采取恰當?shù)挠柧毞绞健?rdquo;
李兵說,團隊堅實的技術積累是獲勝的重要基礎。他表示,視頻內容安全團隊是中國科學院自動化研究所模式識別國家重點實驗室中以互聯(lián)網(wǎng)內容理解與安全為主要研究方向的研究組。團隊深耕視頻理解與內容安全近20年,已在人工智能權威國際學術期刊和會議上發(fā)表論文200余篇。近年來作為第一完成單位獲得北京市科學技術一等獎、北京市發(fā)明專利一等獎、吳文俊人工智能科學技術獎一等獎等多項獎勵。主持了國家自然科學基金重點項目、重大國際合作項目、聯(lián)合基金重點支持項目、國家杰出青年基金項目,國家863重點專項項目、北京市自然科學基金重點項目等三十余項重大科研項目。(趙竹青)