财联社2月16日电,近日,有消息称,微信正在灰测接入DeepSeek R1模型。对此,腾讯方面回应称,微信搜一搜在调用混元大模型丰富AI搜索的同时,近日正式灰度测试接入DeepSeek。在灰度测试范围的用户,可在对话框顶部搜索入口,看到“AI搜索”字样,点击进入后,可免费使用DeepSeek-R1满血版模型,获得更多元化的搜索体验。(中证金牛座)
4090显卡单枪匹马就能跑满血版DeepSeek-R1
清华团队突破大模型算力难题
据每日经济新闻,2月10日,清华大学KVCache.AI团队联合趋境科技发布的KTransformers开源项目迎来重大更新,成功打破大模型推理算力门槛。此前,拥有671B参数的MoE架构大模型DeepSeek-R1在推理时困难重重。推理服务器常因高负荷宕机,专属版云服务器按GPU小时计费的高昂成本让中小团队无力承担,而市面上的“本地部署”方案多为参数量大幅缩水的蒸馏版,在本地小规模硬件上运行满血版 DeepSeek-R1 被认为几乎不可能。
此次KTransformers项目更新带来重大突破,支持在24G显存(4090D)的设备上本地运行 DeepSeek-R1、V3的671B满血版。其预处理速度最高可达286 tokens/s,推理生成速度最高能达到14 tokens/s。甚至有开发者借助这一优化技术,在3090显卡和200GB内存的配置下,使Q2_K_XL模型的推理速度达到9.1 tokens/s,实现了千亿级模型的 “家庭化” 运行。
此外,该项目v0.3预览版还将整合Intel AMX指令集,进一步提升CPU预填充速度,最高至286 tokens/s,相比llama.cpp快了近28倍,为长序列任务带来秒级响应。同时,KTransformers提供兼容Hugginface Transformers的API与ChatGPT式Web界面,降低上手难度,其基于YAML的“模板注入框架”可灵活切换多种优化方式。
【大公报讯】记者郭瀚林北京报道:近期,国产开源大模型DeepSeek以其强大的深度学习能力和广泛应用场景迅速成为科技焦点,全球企业扎堆“拥抱”DeepSeek成为一股新潮流。据统计,截至2025年2月14日,已经有超过15家央国企与DeepSeek展开合作。合作领域覆盖通信、能源、金融、汽车、科技等多个领域。各大企业通过其平台和资源,为DeepSeek打开了庞大的市场空间,加速其在多场景、多产品中广泛落地。
能源领域,中国石油、中国石化、中国海油、中国中化都已接入DeepSeek系列模型。记者从中国石油获悉,中国石油昆仑大模型8日已正式完成DeepSeek大模型私有化部署,为昆仑大模型优化应用效果、缩短研发周期、构建健康生态提供了新引擎,推动“数智中国石油”建设驶入快车道。国家电网全资子公司国网信通产业集团研发的模型服务云MSC平台也已全面接入DeepSeek大模型。通过二者深度融合,将提高平台智能化生产能力,提升电网数字化项目研发效率,赋能业务快速响应和灵活变革,同时有效降低研发成本。
通信领域,工业和信息化部日前宣布,三家基础电信企业均全面接入DeepSeek开源大模型。
汽车领域,东风汽车研发总院日前宣布,已完成DeepSeek全系列大语言模型的接入工作,并将于近期陆续搭载于自主品牌车型。
另据经济观察报报道,多家科技央企正与DeepSeek探讨合作,计划共建智能化算力中心,以应对5G和未来6G时代的海量数据处理需求。
广州算力中心接入DeepSeek 可支撑千家企业同时接入
近日,广州人工智能公共算力中心(以下简称“算力中心”)官宣正式部署接入DeepSeek,成为全国首个率先开放了DeepSeek-R1 671B昇腾适配版试用的政务级安全算力中心。
记者了解到,当前算力中心正通过将DeepSeek“本地化”为各类企业、机构部署私有化模型。针对备受关注的安全性问题,目前正在进一步构建政务数据“进不来、拿不走、看不懂、改不了、跑不掉”五重防护体系。
春节假期刚过,广州人工智能公共算力中心主任、广州数据集团副总经理李学军格外忙碌。年后上班第一天,就有高级副总带着公司的IT部门总监专程到访,希望通过算力中心,将DeepSeek嵌入自己公司的办公OA系统。
“我们已经接待局委办、餐饮企业、旅游集团等各类前来拜访的企业不下20家,很多企业拜访都排到下周了。”李学军告诉记者,算力中心很早就开始部署DeepSeek,于今年1月28日正式上线了升级版DeepSeek。经过了底层优化后的DeepSeek,相当于一位站在巨人肩膀上的“混合专家”,接入算力中心后的应用场景也更加广阔,如政务民生领域中的政策智能问答,科研创新领域的医疗健康管理,产业协作领域工业质检等。
目前,算力中心支持DeepSeek V1-V3、R1等全量版本,涵盖671B满血版及7B、14B蒸馏小模型,支持在线推理、API调用、一键数据处理、模型微调及部署等,可支撑1000家企业同时接入。
值得注意的是,DeepSeek R1的开源,进一步加速了AI技术的“平民化”进程。对于算力中心这样的平台来说,接入大模型后如何深挖各行业、各场景的需求和痛点开发出有价值的AI应用与服务显得格外重要。
在李学军看来,过去许多平台通过出售大模型API调用次数、模型授权等方式盈利。但在开源时代,模型不再是稀缺资源,单纯“贩卖模型”的商业模式将难以为继,“但模型本身开源并不代表着服务不能产生价值,这个时候服务才是真正帮助用户获得价值的抓手。”李学军说。
他进一步指出,作为通用大模型,DeepSeek要深度参与到某个行业、企业具体的生产运营和管理,需要接受算力中心本地化的“训练”和“微调”,从而成为DeepSeek的“本地模型”。
“我们正在做这样一件事情,根据客户的使用场景和需求,整理出客户专属的私有化模型,帮企业产生更大的商业价值。”他举例,目前很多连锁餐饮企业都建立了一套标准化的SOP运营操作流程。算力中心将每个餐饮集团不同的SOP(Standard Operating Procedure,标准作业程序)作为语料,对DeepSeek进行训练、微调,成为企业的一个私有化模型,从而提升餐饮集团对旗下各门店企业的标准流程管控能力。
此外,算力中心还能做方法论的培训,针对行业分析哪些痛点最适合用DeepSeek大模型解决,比如高效生成办公中创意设计、营销文案、公文撰写;高效处理客服行业中的意见反馈、打造智能化客服座席;智能标准流程自动采集数据输出分析和建议等。
记者注意到,当前,各行各业都在积极接入DeepSeek。特别是对于政务级算力中心这样的平台而言,接入后需要注意什么?
对此,李学军告诉记者,在政务单位使用人工智能公共算力中心提供的模型时,保障数据安全与信息安全是核心任务,需重点关注数据全生命周期安全、模型行为可控性、系统攻击面管理三个方面问题。
从实施路径来看,他建议可分阶段部署:一期选择政务服务热线智能问答等低风险场景试点,积累安全防护经验;二期扩展至政策文件辅助撰写等中度风险场景,同步完善审计追溯机制;三期探索应急指挥决策支持等高价值场景,部署量子加密信道等强化措施。
此外,建立联合实验室,由网信办牵头,联合算力中心、网络安全企业成立专项工作组,开发政务大模型安全中间件,实现敏感数据识别精度>99%,恶意请求拦截响应时间<200ms。
“目前,我们正通过以上措施,构建起政务数据‘进不来、拿不走、看不懂、改不了、跑不掉’的五重防护体系。”李学军说。
近日,广州市政务服务和数据管理局在政务外网正式部署上线DeepSeek-R1、V3 671B大模型。通过融合海量政务数据要素,大模型将丰富政务服务场景应用,催生政务服务提质增效的“链式反应”。
据悉,本次大模型上线工作依托数字广州创新实验室实施,并已经完成DeepSeek-R1等模型深度适配国产硬件,将通过政务专网算力推动人工智能大模型在民生政策解读系统、12345热线工单分派等政务领域应用。
记者从广州市政务服务和数据管理局获悉,该局正筹划构建基于DeepSeek的“1+3+N”智慧政务体系,打造支撑广州“12218”现代化产业体系建设的数字化新引擎。“1”是指以DeepSeek等国产人工智能大模型为核心驱动引擎。“3”是推动政务效能、城市治理以及民生服务三个先行场景建设,深化“AI+政务”实践。“N”是指打造“多元共生”产业创新生态。推动民生服务、技术交流、产业协同等多个产业生态多点融合、矩阵发展。