出租车司机好大弄得我很舒服_呦女iuu极品资源一_黑人巨大40cm重口_就是鲁就要就是啪

當前位置: 新思界 > 產業 > 互聯網 > 聚焦 >

AI語料是AI系統開發和運作基礎 市場競爭持續加劇

2024-11-07 17:26      責任編輯:王昭    來源:pigqpi.cn    點擊:
分享到:

AI語料是AI系統開發和運作基礎 市場競爭持續加劇

  AI語料是指用于訓練、測試和優化各種人工智能(AI)系統和模型的的大量數據集合。AI語料涵蓋文本、圖像、音頻、視頻等多種數據類型,旨在幫助AI模型學習如何與人類進行交互、如何分析音頻內容、如何執行復雜任務等。

  為保障網絡信息安全,國內外均在積極采取措施來規范AI語料的收集與使用。2024年2月,全國網絡安全標準化技術委員會發布TC260-003《生成式人工智能服務安全基本要求》,該文件規定了生成式人工智能服務在語料安全、模型安全等在內的安全方面基礎要求,這為AI語料的規范化、安全化使用提供了法律指導。

  AI語料是AI系統開發和運作的基礎,在自然語言處理、語音識別、計算機視覺、圖像識別等環節均需要龐大的AI語料庫支持。隨著AI應用場景拓展,市場對高質量、多樣化的AI語料數據需求正不斷釋放。

  AI語料數據集建立流程涉及到數據采集、數據標注、數據清洗、模型測試、模型訓練、產品評估等環節。根據新思界產業研究中心發布的《2024-2028年中國AI語料行業市場供需現狀及發展趨勢預測報告》顯示,我國數據資源豐富,圖書出版、影視公司、網文平臺等領域已積累了豐富語料資源,為AI語料數據集建立提供了基礎。但我國數據挖掘力度不足,優質AI語料數據集較稀缺。

  文本語料、語音語料、視頻語料是AI語料的主要組成部分,其中又以文本語料最為常見。文本語料相關企業較多,包括中文在線、中國出版、中國科傳、果麥文化、中信出版、掌閱科技等企業;視頻語料相關企業包括中廣天澤、華策影視、上海電影等。

  掌閱科技是我國數字閱讀平臺龍頭,主要產品或服務包括掌閱APP、掌閱精選、掌閱課外書、掌閱文學等。掌閱科技主營業務盈利能力強,根據其年報數據顯示,2023年掌閱科技主營業務收入凈額為27.78億元,2024年中掌閱科技營收13.32億元,毛利率71.34%。

  新思界行業分析人士表示,AI語料直接影響著AI模型的理解能力、語言生成能力和任務執行能力,其高質量、多樣化發展對構建高效、準確的AI模型至關重要。AI語料市場激烈競爭,近年來,國內涌現出一大批AI語料企業,進一步加劇了市場競爭,同時也為AI語料多樣化、特色化發展提供了助力。

關鍵字: