腾讯回应微信接入DeepSeek：满血版免费-环球产经网

　　财联社2月16日电，近日，有消息称，微信正在灰测接入DeepSeek R1模型。对此，腾讯方面回应称，微信搜一搜在调用混元大模型丰富AI搜索的同时，近日正式灰度测试接入DeepSeek。在灰度测试范围的用户，可在对话框顶部搜索入口，看到“AI搜索”字样，点击进入后，可免费使用DeepSeek-R1满血版模型，获得更多元化的搜索体验。（中证金牛座）

　　4090显卡单枪匹马就能跑满血版DeepSeek-R1

　　清华团队突破大模型算力难题

据每日经济新闻，2月10日，清华大学KVCache.AI团队联合趋境科技发布的KTransformers开源项目迎来重大更新，成功打破大模型推理算力门槛。此前，拥有671B参数的MoE架构大模型DeepSeek-R1在推理时困难重重。推理服务器常因高负荷宕机，专属版云服务器按GPU小时计费的高昂成本让中小团队无力承担，而市面上的“本地部署”方案多为参数量大幅缩水的蒸馏版，在本地小规模硬件上运行满血版 DeepSeek-R1 被认为几乎不可能。

此次KTransformers项目更新带来重大突破，支持在24G显存（4090D）的设备上本地运行 DeepSeek-R1、V3的671B满血版。其预处理速度最高可达286 tokens/s，推理生成速度最高能达到14 tokens/s。甚至有开发者借助这一优化技术，在3090显卡和200GB内存的配置下，使Q2_K_XL模型的推理速度达到9.1 tokens/s，实现了千亿级模型的 “家庭化” 运行。

此外，该项目v0.3预览版还将整合Intel AMX指令集，进一步提升CPU预填充速度，最高至286 tokens/s，相比llama.cpp快了近28倍，为长序列任务带来秒级响应。同时，KTransformers提供兼容Hugginface Transformers的API与ChatGPT式Web界面，降低上手难度，其基于YAML的“模板注入框架”可灵活切换多种优化方式。

　　逾15家央国企与DeepSeek展开合作

　　【大公报讯】记者郭瀚林北京报道：近期，国产开源大模型DeepSeek以其强大的深度学习能力和广泛应用场景迅速成为科技焦点，全球企业扎堆“拥抱”DeepSeek成为一股新潮流。据统计，截至2025年2月14日，已经有超过15家央国企与DeepSeek展开合作。合作领域覆盖通信、能源、金融、汽车、科技等多个领域。各大企业通过其平台和资源，为DeepSeek打开了庞大的市场空间，加速其在多场景、多产品中广泛落地。

　　能源领域，中国石油、中国石化、中国海油、中国中化都已接入DeepSeek系列模型。记者从中国石油获悉，中国石油昆仑大模型8日已正式完成DeepSeek大模型私有化部署，为昆仑大模型优化应用效果、缩短研发周期、构建健康生态提供了新引擎，推动“数智中国石油”建设驶入快车道。国家电网全资子公司国网信通产业集团研发的模型服务云MSC平台也已全面接入DeepSeek大模型。通过二者深度融合，将提高平台智能化生产能力，提升电网数字化项目研发效率，赋能业务快速响应和灵活变革，同时有效降低研发成本。

　　通信领域，工业和信息化部日前宣布，三家基础电信企业均全面接入DeepSeek开源大模型。

　　共建智能化算力中心为6G准备

　　汽车领域，东风汽车研发总院日前宣布，已完成DeepSeek全系列大语言模型的接入工作，并将于近期陆续搭载于自主品牌车型。

　　另据经济观察报报道，多家科技央企正与DeepSeek探讨合作，计划共建智能化算力中心，以应对5G和未来6G时代的海量数据处理需求。

　　广州算力中心接入DeepSeek 可支撑千家企业同时接入

　　近日，广州人工智能公共算力中心（以下简称“算力中心”）官宣正式部署接入DeepSeek，成为全国首个率先开放了DeepSeek-R1 671B昇腾适配版试用的政务级安全算力中心。

　　记者了解到，当前算力中心正通过将DeepSeek“本地化”为各类企业、机构部署私有化模型。针对备受关注的安全性问题，目前正在进一步构建政务数据“进不来、拿不走、看不懂、改不了、跑不掉”五重防护体系。

　　支持全量版本政务企业排队“嵌入”

　　春节假期刚过，广州人工智能公共算力中心主任、广州数据集团副总经理李学军格外忙碌。年后上班第一天，就有高级副总带着公司的IT部门总监专程到访，希望通过算力中心，将DeepSeek嵌入自己公司的办公OA系统。

　　“我们已经接待局委办、餐饮企业、旅游集团等各类前来拜访的企业不下20家，很多企业拜访都排到下周了。”李学军告诉记者，算力中心很早就开始部署DeepSeek，于今年1月28日正式上线了升级版DeepSeek。经过了底层优化后的DeepSeek，相当于一位站在巨人肩膀上的“混合专家”，接入算力中心后的应用场景也更加广阔，如政务民生领域中的政策智能问答，科研创新领域的医疗健康管理，产业协作领域工业质检等。

　　目前，算力中心支持DeepSeek V1-V3、R1等全量版本，涵盖671B满血版及7B、14B蒸馏小模型，支持在线推理、API调用、一键数据处理、模型微调及部署等，可支撑1000家企业同时接入。

　　“本土化训练”后应用场景更广阔

　　值得注意的是，DeepSeek R1的开源，进一步加速了AI技术的“平民化”进程。对于算力中心这样的平台来说，接入大模型后如何深挖各行业、各场景的需求和痛点开发出有价值的AI应用与服务显得格外重要。

　　在李学军看来，过去许多平台通过出售大模型API调用次数、模型授权等方式盈利。但在开源时代，模型不再是稀缺资源，单纯“贩卖模型”的商业模式将难以为继，“但模型本身开源并不代表着服务不能产生价值，这个时候服务才是真正帮助用户获得价值的抓手。”李学军说。

　　他进一步指出，作为通用大模型，DeepSeek要深度参与到某个行业、企业具体的生产运营和管理，需要接受算力中心本地化的“训练”和“微调”，从而成为DeepSeek的“本地模型”。

　　“我们正在做这样一件事情，根据客户的使用场景和需求，整理出客户专属的私有化模型，帮企业产生更大的商业价值。”他举例，目前很多连锁餐饮企业都建立了一套标准化的SOP运营操作流程。算力中心将每个餐饮集团不同的SOP（Standard Operating Procedure，标准作业程序）作为语料，对DeepSeek进行训练、微调，成为企业的一个私有化模型，从而提升餐饮集团对旗下各门店企业的标准流程管控能力。

　　此外，算力中心还能做方法论的培训，针对行业分析哪些痛点最适合用DeepSeek大模型解决，比如高效生成办公中创意设计、营销文案、公文撰写；高效处理客服行业中的意见反馈、打造智能化客服座席；智能标准流程自动采集数据输出分析和建议等。

　　构建政务数据五重防护体系

　　记者注意到，当前，各行各业都在积极接入DeepSeek。特别是对于政务级算力中心这样的平台而言，接入后需要注意什么？

　　对此，李学军告诉记者，在政务单位使用人工智能公共算力中心提供的模型时，保障数据安全与信息安全是核心任务，需重点关注数据全生命周期安全、模型行为可控性、系统攻击面管理三个方面问题。

　　从实施路径来看，他建议可分阶段部署：一期选择政务服务热线智能问答等低风险场景试点，积累安全防护经验；二期扩展至政策文件辅助撰写等中度风险场景，同步完善审计追溯机制；三期探索应急指挥决策支持等高价值场景，部署量子加密信道等强化措施。

　　此外，建立联合实验室，由网信办牵头，联合算力中心、网络安全企业成立专项工作组，开发政务大模型安全中间件，实现敏感数据识别精度＞99%，恶意请求拦截响应时间＜200ms。

　　“目前，我们正通过以上措施，构建起政务数据‘进不来、拿不走、看不懂、改不了、跑不掉’的五重防护体系。”李学军说。

腾讯回应微信接入DeepSeek：满血版免费

相关推荐

微信公众号

热门标签