首頁 資訊 國內(nèi) 聚焦 教育 關注 熱點 要聞 民生1+1 國內(nèi)

商湯大語言模型應用“商量SenseChat”即日起全面向廣大用戶開放服務

來源:證券日報網(wǎng)?    發(fā)布時間:2023-08-31 19:10:43


(相關資料圖)

8月31日,商湯科技日日新大模型旗下自然語言應用“商量SenseChat”正式面向廣大用戶開放服務。

商湯“商量SenseChat”今年4月正式推出,是國內(nèi)最早的基于千億參數(shù)大語言模型之一,并不斷迭代更新。目前,基模型為商湯聯(lián)合多家國內(nèi)頂級科研機構(gòu)發(fā)布的書生·浦語InternLM-123B,擁有1230億參數(shù),在語言、知識、理解、推理和學科五大能力上均處于行業(yè)領先水平,并在全球51個知名評測集(包括MMLU,AGIEVAL,ARC,CEval,Race,GSM8K等)共計30萬道問題集合上測試成績整體排名全球第二,超過GPT-3.5-turbo以及Meta新發(fā)布的LLaMA2-70B等模型,在主要評測中12項成績超越GPT-4,排名第一。

商量SenseChat背后依托商湯AI大裝置SenseCore,其上線GPU數(shù)量由2023年3月底的27000塊提升至日前的約30000塊,算力規(guī)模提升20%至6ExaFLOPS,可有效支持語言大模型的訓練、升級迭代和服務。

在訓練數(shù)據(jù)方面,商湯每月可產(chǎn)出約2萬億token的高質(zhì)量數(shù)據(jù),支持更加強大的基模型的訓練,預計年底高質(zhì)量數(shù)據(jù)儲備將突破10萬億token。同時,商湯還投入了數(shù)百臺服務器搭載千卡GPU的計算資源,采用算法結(jié)合人工的方法對原始語料數(shù)據(jù)進行分門別類的精細化清洗,以確保數(shù)據(jù)的質(zhì)量、安全性和價值觀都符合要求。

截至目前,商湯商量在金融、醫(yī)療、汽車、地產(chǎn)、能源、傳媒、工業(yè)制造等眾多垂直行業(yè)與超過500家客戶建立了深度合作,通過提供多種靈活的API接口和服務,為客戶提供大模型的各項AI技術(shù)和服務,低門檻、低成本、高效率地實現(xiàn)各類生成式AI應用。

商湯“日日新SenseNova”大模型體系和生成式AI產(chǎn)品系列,包括商量、秒畫、如影、瓊宇、格物,分別對應著自然語言交互、AI文生圖、數(shù)字人、3D大場景重建、3D小物體生成這五個主流的生成式AI應用。未來,商湯將依托強大的基模型,以及在算力、數(shù)據(jù)、算法基礎上的積累和豐富Know-how,持續(xù)升級商湯日日新大模型體系下的多種生成式AI產(chǎn)品,滿足各類用戶的需求。

(編輯 李波)

關鍵詞:

頻道精選

首頁 | 城市快報 | 國內(nèi)資訊 | 教育播報 | 在線訪談 | 本網(wǎng)原創(chuàng) | 娛樂看點

Copyright @2008-2018 經(jīng)貿(mào)網(wǎng) 版權(quán)所有 皖ICP備2022009963號-11
本站點信息未經(jīng)允許不得復制或鏡像 聯(lián)系郵箱:39 60 29 14 2 @qq.com