6月28日,在火山引擎主办、英伟达合作举办的“V-Tech体验创新科技峰会”上,火山引擎发布大模型服务平台“火山方舟”,面向企业提供模型精调、评测、推理等全方位的平台服务。据悉,抖音集团内部已有十多个业务团队试用“火山方舟”,利用大模型能力促进降本增效。
降低大模型使用成本
中国科学技术信息研究所等机构发布的《中国人工智能大模型地图研究报告》显示,截至今年5月,国内已公开披露的大模型数量达到79个。
大模型密集涌现,企业面临“选择困难”。在火山引擎智能算法负责人吴迪看来,技术发展日新月异,国内大模型正在快速迭代,不同大模型在特定任务上各有千秋,企业不必急于绑定一家大模型,而是应该结合自身业务场景,综合评估使用效果和成本,在不同场景选用更具性价比的模型。“一个经过良好精调的中小规格模型,在特定工作上的表现可能不亚于通用的、巨大的基座模型,而推理成本可以降低到原来的十分之一。”
而“火山方舟”提供了丰富的模型精调和评测支持。吴迪介绍,企业可以用统一的工作流对接多家大模型,在不同业务场景里还可灵活切换不同的模型,实现最具性价比的模型组合。
首创安全互信计算
火山引擎总裁谭待介绍,“火山方舟”已上线了基于安全沙箱的大模型安全互信计算方案,利用计算隔离、存储隔离、网络隔离、流量审计等方式,实现了模型的机密性、完整性和可用性保证,适用于对训练和推理延时要求较低的客户。互信计算方案可以解决企业担心数据泄露以及模型生产方担心知识资产安全的问题。
未来 NVIDIA 和火山引擎团队将继续深化合作
会上,NVIDIA 开发与技术部亚太区总经理李曦鹏表示,NVIDIA 与火山引擎过往合作成果丰硕,包括共同合作的 GPU 推理库 ByteTransformer 在 IEEE 国际并行和分布式处理大会(IPDPS 2023)上获得最佳论文奖,双方还联合开源了高性能图像处理加速库 CV-CUDA,并在大规模稳定训练、多模型混合部署等方面的技术合作上取得成效。
未来 NVIDIA 和火山引擎团队将继续深化合作,包含在 NVIDIA Hopper 架构进行适配与优化、机密计算、重点模型合作优化、共同为重点客户提供支持,以及 NeMo Framework 适配等,携手助力大模型产业繁荣。
(来源:证券时报)