商汤科技推出“日日新SenseNova”大模型体系

继百度、三六零、华为等巨头介绍各自AI大模型后,4月10日商汤科技在其举办技术交流日活动上,公布了“日日新SenseNova”大模型体系和语言大模型“商量SenseChat”,以及依托AI大装置SenseCore实现“大模型+大算力”融合的研发体系。另外,商汤表示向行业开发人员开放大量预训练模型及AI开发工具链,帮助客户提升开发效率。
商汤科技董事长兼CEO徐立表示:“在AI大模型时代,数据、算法和算力这三要素也在经历新的演变,大模型参数量将以指数级的速率提升,而数据量随着多模态的引入也将大规模增长,因此就必然会导致对算力需求的剧增。”

商汤科技
据称,商汤历时五年建设AI大装置,大装置上总共有2.7万块的GPU芯片卡,可以输出5.0 exaFLOPS的总算力。基于大装置,商汤目前构建了计算机视觉、自然语言处理、AI内容生成、多模态、决策智能等多个领域的大模型,持续演进能力并广泛支持各种应用。
据介绍,“日日新SenseNova”可以为政企客户提供了多种API接口和服务,包括图片生成,自然语言生成,视觉感知通用任务与标注服务。客户可根据实际应用需求,调用“日日新SenseNova”大模型的各项AI技术能力,实现各类AI应用。
在智能驾驶领域,基于视觉大模型,商汤实现了可识别3000类物体的BEV环视通用感知算法的实车量产,也构建了感知决策一体化的自动驾驶多模态模型,带来更强的环境、行为、动机解码能力。
“日日新SenseNova”也推出了商汤的语言大模型“商量SenseChat”。作为自然语言处理模型,“商量SenseChat”使用大量数据训练,并充分考虑了中文语境,能够更好地理解和处理中文文本。
其中,预训练大模型的自动化数据标注可实现相较于人工数据标注近百倍的效率提升;大模型并行训练和模型增量训练服务能够帮助客户快速利用自有数据训练模型。另外,模型推理部署服务可将大模型推理效率提高100%以上,降低用模型提供服务的成本。