1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. 人工智能
  4. 正文

搜狗搜索“CIPS-SOGOU問答比賽”賽程加碼 正式啟動“非事實類問答子任務(wù)”

 2018-05-22 11:25  來源:互聯(lián)網(wǎng)  我來投稿 撤稿糾錯

  阿里云優(yōu)惠券 先領(lǐng)券再下單

構(gòu)建開放域智能問答系統(tǒng)是人工智能研究領(lǐng)域的一項重要前沿課題。近日,由搜狗搜索聯(lián)合中國中文信息學(xué)會共同舉辦的“CIPS-SOGOU問答比賽”,正式啟動了“非事實類問答子任務(wù)”。搜狗搜索將公開百萬級真實用戶問答數(shù)據(jù)集,為參賽者提供一展身手的舞臺,從而促進學(xué)術(shù)界及業(yè)界交流,提升智能問答領(lǐng)域的研究水平,推動智能問答系統(tǒng)更加廣泛地面向公眾提供信息服務(wù)。

“CIPS-SOGOU問答比賽”,是國內(nèi)首檔基于大規(guī)模真實用戶問答數(shù)據(jù)集的問答評測任務(wù)。大賽根據(jù)問題類型將比賽任務(wù)分為“事實類問答子任務(wù)”和“非事實類問答子任務(wù)”,分別對應(yīng)事實類問題和非事實類問題。去年9月,該大賽伴隨著“事實類問答子任務(wù)”的啟動已正式開賽。

而于近日啟動的“非事實類問答子任務(wù)”,無疑又為大賽注入新機,將賽事推向高潮。相較于“事實類問題”,“非事實類問題”包括更廣泛的問答內(nèi)容形式,包括列舉(list)、定義(definition)、方式(how)、原因(why)、假設(shè)(hypothetical)等等。

根據(jù)賽制,基于搜狗搜索提供的問題,以及相對應(yīng)的若干候選答案篇章,參賽者需設(shè)計算法從候選篇章中抽取合適的詞語、短語或句子,形成一段正確、完整、簡潔的文本,作為預(yù)測答案,以正確、完整、簡潔地回答該問題,答案文本長度限定在500字內(nèi)。

針對大賽中的每個問題,參賽者只需提供一個預(yù)測答案。“非事實類問答子任務(wù)”將針對該預(yù)測答案與標(biāo)準(zhǔn)答案計算ROUGE-L和BLEU值,再以測試集上兩個指標(biāo)的平均值作為最終指標(biāo)。此次比賽將在2018年11月CIPS年會上舉行頒獎儀式,授予獲勝者獎金和榮譽證書。

(圖:CIPS-SOGOU問答比賽任務(wù)說明)

值得期待的是,此次“非事實類問答子任務(wù)”中,搜狗搜索將公開百萬級真實用戶問答數(shù)據(jù)集。包含10萬個非事實型問題, 代表了最真實廣泛的網(wǎng)民信息需求;以及100萬個對應(yīng)問題的候選篇章及答案標(biāo)注 (每個問題對應(yīng)給出10個候選答案篇章),候選篇章都是從搜索引擎檢索真實網(wǎng)頁結(jié)果中抽取的文本。

實際上,搜狗搜索在此次任務(wù)中提供百萬級真實用戶數(shù)據(jù)集,除了促使大賽正常開展外,更有意義的是,此舉為構(gòu)建開放域智能問答系統(tǒng)的研究提供了剛需的數(shù)據(jù)支撐,有助于促進智能問答領(lǐng)域技術(shù)的發(fā)展和應(yīng)用,從而推動智能問答系統(tǒng)更加廣泛地面向公眾提供信息服務(wù),讓用戶更加便捷地獲取信息和知識。

作為國內(nèi)第二大搜索引擎,搜狗搜索憑借自身數(shù)據(jù)優(yōu)勢及在人工智能領(lǐng)域研究的持續(xù)大力投入,已經(jīng)在智能問答領(lǐng)域處于領(lǐng)先地位,率先實現(xiàn)了“直接為用戶提供答案”。搜狗搜索已上線的“立知”智能問答系統(tǒng),就是其研發(fā)的面向未來的搜索。該系統(tǒng)能夠理解用戶搜索意圖,并直接提供答案。目前,“立知”智能問答系統(tǒng)在事實性問題、分析類問題、觀點類問題、數(shù)字類問題、隱式問題等方面,都能為用戶直接返回精確答案。

現(xiàn)在,作為智能問答領(lǐng)域的帶路黨,搜狗搜索開放技術(shù)能力,向?qū)W界及業(yè)界提供百萬級真實用戶問答數(shù)據(jù)集,助力行業(yè)向“非事實性問答”領(lǐng)域研究開拓,促進智能問答領(lǐng)域的學(xué)術(shù)交流。有興趣進行技術(shù)切磋,提升研究水平的高校師生及業(yè)內(nèi)研究人員,均可通過“搜狗實驗室”官網(wǎng) 提交報名信息參賽。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關(guān)標(biāo)簽
搜狗搜索
搜狗問答

相關(guān)文章

  • 未來5年,中國AI的“大洗牌”和“內(nèi)循環(huán)”

    我覺得我們AI的目標(biāo)是:從芯片設(shè)計到軟件生態(tài),全鏈路自主開發(fā),建立可控的世界級AI體系。所以這是俺對未來5年中國AI圈的展望和判斷。(1)2026年,英偉達造車、國產(chǎn)開車26年國產(chǎn)芯片會在推理和垂直場景上發(fā)力。以DeepSeek為代表,大多數(shù)AI大模型會以軟件彌補硬件不足,所以訓(xùn)練和推理分開,訓(xùn)練就

  • H20芯片開賣即叫停,英偉達如何解圍?

    文/道哥在深陷“后門”風(fēng)波、接受網(wǎng)信辦問詢之后,英偉達的“特供版”H20芯片,又有了新消息。近日,美國科技媒體《TheInformation》援引知情人士消息稱,英偉達已悄然向其關(guān)鍵供應(yīng)商——包括負責(zé)封裝的安靠科技、供應(yīng)高帶寬內(nèi)存的三星電子、以及承擔(dān)后端處理的富士康發(fā)出指令,要求暫停所有與H20AI

    標(biāo)簽:
    英偉達
  • 真正的「國產(chǎn)英偉達」來了

    文/二風(fēng)來源/節(jié)點財經(jīng)一場關(guān)于“中國芯”的IPO審議,正把投資者們的目光鎖定在上交所。根據(jù)上交所發(fā)布的公告,上市審核委員會已定于9月26日審議摩爾線程的科創(chuàng)板首發(fā)申請。作為中國半導(dǎo)體自主化浪潮中最受矚目的“考生”之一,包括其創(chuàng)始人顯赫的英偉達背景、高達80億元人民幣的募資雄心,以及在國產(chǎn)GPU領(lǐng)域取

    標(biāo)簽:
    英偉達
  • AI視頻生成賽道“分野”:小廠重產(chǎn)品,大廠重生態(tài)

    AI視頻生成賽道“分野”:小廠重產(chǎn)品,大廠重生態(tài)

    標(biāo)簽:
    騰訊
    阿里巴巴
    快手
  • 數(shù)據(jù)庫進入“內(nèi)存自由”時代!阿里云PolarDB發(fā)布全球首個CXL數(shù)據(jù)庫服務(wù)器

    技術(shù)的進步永無止境,繼創(chuàng)下TPC-C性能&性價比雙冠之后,阿里云PolarDB云原生數(shù)據(jù)庫再度實現(xiàn)關(guān)鍵突破。9月24日杭州云棲大會上,阿里云宣布推出全球首款基于CXL(ComputeExpressLink)2.0Switch技術(shù)的PolarDB數(shù)據(jù)庫專用服務(wù)器。在原有RDMA網(wǎng)絡(luò)的基礎(chǔ)上,Polar

  • 為AI時代云服務(wù)器量身定制 阿里云操作系統(tǒng)Alinux 4重磅發(fā)布

    2025年9月24日,在杭州舉辦的云棲大會上,阿里云正式發(fā)布全新一代服務(wù)器操作系統(tǒng)AlibabaCloudLinux4(簡稱Alinux4)。Alinux4基于Linux6.6內(nèi)核打造,是首個全面遵循龍蜥社區(qū)“開源生態(tài)合作倡議”規(guī)范的商業(yè)發(fā)行版。它不僅兼容主流開源社區(qū)生態(tài),更針對阿里云最新9代ECS

  • 阿里云重磅發(fā)布AI安全護欄 五項安全能力護航AI安全

    9月24日,杭州云棲大會技術(shù)主論壇上,阿里云重磅發(fā)布AI安全護欄,提供五項核心安全能力,護航AI安全。一方面為客戶提供融入AIAgent開發(fā)全鏈路的原生安全防護,另一方面持續(xù)用AI賦能安全產(chǎn)品智能化升級,打造Agentic-SOC安全運營,提升安全威脅檢測和響應(yīng)效率。在過去的一年,AIAgent正在

  • 魔搭社區(qū)國際版上線,并發(fā)布科學(xué)智能專區(qū)與AIGC創(chuàng)作引擎

    9月24日,魔搭社區(qū)舉辦了“全球協(xié)作?科學(xué)突破?創(chuàng)意無限”的專題論壇,并發(fā)布魔搭社區(qū)國際版、科學(xué)智能專區(qū)與AIGC創(chuàng)作引擎FlowBench,旨在連接全球開發(fā)者、加速科研范式創(chuàng)新、賦能創(chuàng)意表達。自2022年11月初成立至今,魔搭社區(qū)已成長為中國最大AI開源社區(qū),其模型數(shù)量已突破10萬,服務(wù)了全球20

  • 七連發(fā)!阿里多款重磅發(fā)布亮相云棲大會

    9月24日,2025云棲大會現(xiàn)場,阿里云CTO周靖人接連發(fā)布了七款大模型技術(shù)產(chǎn)品。七款技術(shù)產(chǎn)品覆蓋語言、語音、視覺、多模態(tài)、代碼等模型領(lǐng)域,在模型智能水平、Agent工具調(diào)用以及Coding能力、深度推理、多模態(tài)等方面均實現(xiàn)突破。在大語言模型中,阿里通義旗艦?zāi)P蚎wen3-Max全新亮相,性能超過G

  • 阿里云擴建全球基礎(chǔ)設(shè)施,將新增巴西、法國和荷蘭數(shù)據(jù)中心

    9月24日,阿里云在云棲大會上宣布新一輪全球基礎(chǔ)設(shè)施擴建計劃:將在巴西、法國和荷蘭首次設(shè)立云計算地域節(jié)點(region),并將擴建墨西哥、日本、韓國、馬來西亞和迪拜的數(shù)據(jù)中心,以便更好服務(wù)全球客戶日益增長的AI和云計算需求。目前,阿里云在全球29個地區(qū)運營91個可用區(qū),是中國最大、亞太第一的云服務(wù)商