(資料圖片)
10月14日凌晨,螞蟻集團(tuán)正式推出萬億參數(shù)思考模型Ring-1T,同時(shí)全面開源模型權(quán)重、訓(xùn)練配方。Ring-1T在9月30日開源的預(yù)覽版Ring-1T-preview基礎(chǔ)上,持續(xù)擴(kuò)展大規(guī)??沈?yàn)證獎(jiǎng)勵(lì)強(qiáng)化學(xué)習(xí)(RLVR)訓(xùn)練,進(jìn)一步激發(fā)萬億基座的自然語言推理能力,并通過 RLHF訓(xùn)練完善模型通用能力,在各項(xiàng)任務(wù)榜單上表現(xiàn)更加均衡。
據(jù)百靈團(tuán)隊(duì)透露,Ring-1T模型是其在萬億思考模型上的首次嘗試,螞蟻百靈團(tuán)隊(duì)會(huì)在后續(xù)的版本中繼續(xù)完善模型性能。目前,用戶可通過HuggingFace、魔搭社區(qū)下載模型,并通過螞蟻百寶箱等平臺(tái)在線體驗(yàn)。
最新資訊
關(guān)于我們 廣告服務(wù) 手機(jī)版 投訴文章:435 226 40@qq.com
Copyright (C) 1999-2020 www.tkjt8.cn 愛好者日?qǐng)?bào)網(wǎng) 版權(quán)所有 聯(lián)系網(wǎng)站:435 226 40@qq.com