DeepSeek發文:成本利潤率達近5.5倍
DeepSeek於知乎平台首次發布《DeepSeek-V3/R1推理系統概覽》技術文章,公布模型推理系統優化細節,並披露成本利潤率關鍵訊息。
文章表示,假定GPU租賃成本為每小時2美元,每日總成本近8.71萬美元,如果所有tokens全部按照DeepSeek R1定價計算,理論上一日總收入約56.2萬美元,成本利潤率545%。
DeepSeek表示,DeepSeek-V3/R1推理系統優化目標是更大的吞吐,更低的延遲。文章主要內容為如何使用EP(即大規模跨節點專家並行)增大batch size(即批量大小,每個batch中的樣本數量),如何隱藏傳輸的耗時及進行負載均衡。(ta/w)~
阿思達克財經新聞
網址: www.aastocks.com