">
記者從國家數據局獲悉:中文數據在國內大模型的訓練性能提升方面發揮著重要作用。國內多數模型訓練使用的中文數據占比已經超過60%,有的模型達到80%。中文高質量數據的開發和供給能力持續增強,推動我國人工智能模型性能快速提升。
在人工智能時代,Token(通常所說的詞元)是處理文本的最小數據單元。國家數據局局長劉烈宏介紹,2024年初,我國日均Token的消耗量為1000億,截至今年6月底,日均Token消耗量已經突破30萬億,1年半時間增長了300多倍,反映了我國人工智能應用規模的快速增長。
Copyright ? 2001-2025 湖北荊楚網絡科技股份有限公司 All Rights Reserved
互聯網新聞信息許可證 42120170001 -
增值電信業務經營許可證 鄂B2-20231273 -
廣播電視節目制作經營許可證(鄂)字第00011號
信息網絡傳播視聽節目許可證 1706144 -
互聯網出版許可證 (鄂)字3號 -
營業執照
鄂ICP備 13000573號-1 鄂公網安備 42010602000206號
版權為 荊楚網 www.vigoraudio.com 所有 未經同意不得復制或鏡像