幻方量化旗下的AI公司深度求索(DeepSeek)今日正式發(fā)布其最新模型DeepSeek-R1,并同步開源模型權(quán)重。官方表示,DeepSeek-R1在后訓(xùn)練階段大規(guī)模應(yīng)用了強(qiáng)化學(xué)習(xí)技術(shù),極大提升了模型的推理能力。尤其在數(shù)學(xué)、代碼和自然語言推理等任務(wù)上,性能已比肩OpenAI o1正式版。
值得一提的是,DeepSeek-R1蒸餾出的小模型超越了OpenAI o1-mini。此次發(fā)布的DeepSeek-R1-Zero和DeepSeek-R1兩個(gè)660B模型,以及通過DeepSeek-R1輸出蒸餾出的6個(gè)小模型,其中32B和70B模型在多項(xiàng)能力上實(shí)現(xiàn)了對(duì)標(biāo)OpenAI o1-mini的效果。
DeepSeek-R1 API服務(wù)定價(jià)為每百萬輸入tokens 1元(緩存命中)/4元(緩存未命中),每百萬輸出tokens 16元。此外,DeepSeek將模型開源License統(tǒng)一使用MIT,支持用戶進(jìn)行“模型蒸餾”,進(jìn)一步促進(jìn)技術(shù)的開源和共享。用戶可通過官網(wǎng)或App調(diào)用DeepSeek-R1完成各類推理任務(wù)。
免責(zé)聲明:本文內(nèi)容由開放的智能模型自動(dòng)生成,僅供參考,不構(gòu)成任何專業(yè)建議或決策依據(jù)。用戶應(yīng)自行核實(shí)信息的準(zhǔn)確性和可靠性,本站對(duì)用戶因使用或依賴本文內(nèi)容而產(chǎn)生的任何風(fēng)險(xiǎn)或損失不承擔(dān)任何責(zé)任。如有疑問或發(fā)現(xiàn)內(nèi)容有誤,請(qǐng)聯(lián)系本站進(jìn)行處理。