阿里版GPT“通义千问”官宣内测
4月7日,阿里云通过官方微博宣布,自研大模型”通义千问”开始邀请用户测试体验。现阶段该模型主要定向邀请企业用户进行体验测试。用户可通过官网申请(tongyi.aliyun.com),符合条件的用户可参与体验。
北京日报记者提出“你与文心一言、ChatGPT有何不同?”这一问题时,通义千问回答道:“相比于文心一言和ChatGPT,我有以下优势:1、大量训练数据:我基于大量的互联网文本进行训练,这使得我能够理解和回答各种主题的问题。2、对话理解能力:经过多轮迭代和优化,我的对话理解能力得到了显著提高,能够准确理解与用户交互的对话历史,为用户提供更自然、流畅的对话体验。3、代码写作能力:经过充分的训练,我具有多种编程语言的理解和生成能力,如果您有代码相关的问题,欢迎您提问。4、多语言支持:除了中文,我还支持其他多种语言,满足国际化的使用需求。”
除了对话外,它还具备一个“百宝袋”功能,里面相当于一个功能丰富的工具箱,能快速生成各种指定类型的文案。例如写提纲、商品描述生成、SWOT分析等效率类工具,生成小学生风格作文、菜谱等生活类工具,或是输入三个字就能为你写首诗、免费代写情书等娱乐类工具。
此前,在ChatGPT刚火的时候,阿里巴巴就已向外界确认正在研发同类产品,并已进入内测阶段。4月11日,2023阿里云峰会将在北京召开,包括阿里巴巴董事局主席兼CEO张勇,阿里云智能首席技术官周靖人、阿里云智能全球商业总裁蔡英华在内的主要负责人将出席主论坛。据悉,阿里云峰会上将正式推出阿里大模型,接下来还有各类的行业应用类模型面世。
公开资料显示,阿里达摩院在NLP自然语言处理等前沿科研领域早已布局多年,2019年阿里就已经启动了中文大模型研发。2021年,阿里先后发布了国内首个超百亿参数多模态大模型M6,以及被称为“中文版GPT-3”的语言大模型PLUG。其中,M6在多次迭代之后,实现了十万亿级别的参数规模,并且M6和支付宝、淘宝的业务需求相结合,首个在国内实现了商业化落地。继多模态大模型M6、语言大模型PLUG之后,阿里达摩院于2022年9月发布“通义”大模型系列。当时阿里发布的语言大模型StructBERT超越谷歌、微软、Facebook,登顶了CLUE榜单。
而谈到ChatGPT这类技术,马云表示,这一类技术已经对教育带来挑战,但这只是AI时代的开始。“我们要用人工智能去解决问题,而不是被人工智能所控制,虽然人的体力、脑力比不过机器,但机器只有‘芯’,而人有‘心’。”他说,工业时代是知识驱动,知识的竞争;数字时代,是智慧驱动,是创造力和想象力的竞争,是领导力、担当力、责任的竞争,是独立思考的竞争。
“360智脑”面向企业内测,率先落地搜索场景
在4月9日由360自己主办的2023数字安全与发展高峰论坛上,360集团创始人周鸿祎发布了中国版+ChatGPT+产品“360智脑”,并宣布“360智脑”率先落地搜索场景,面向企业用户开放内测。企业用户在PC端360搜索首页申请并获得测试资格后,可通过企业安全云体验使用。360智脑将与浏览器、数字助理、苏打办公、智能营销等场景应用深度结合,全面提升用户生产力和创造力。
据DoNews4月10日的消息,从演示效果来看,360 版 GPT 已经具备了一定的推理能力,但在回答具体问题时多次“翻车”,不少问题需要多次回答才能给出准确答复。
此前,有消息称,360已在内部办公软件“推推”上线类ChatGPT机器人助手MasterYoda。据介绍,MasterYoda由周鸿祎亲自带队,人工智能团队实际推进,已参与360多款产品的设计和开发,包括360QAN(360问答机器人)、360DOC(360文档机器人)、360搜索(360搜索机器人)等。
3月29日,周鸿祎现场演示了360版GPT,在回答周鸿祎为什么总谈论GPT话题时,它认为周鸿祎既表示GPT是场工业革命,又担心它对人类发展造成风险,其观点矛盾。周鸿祎点评称,生成式AI和搜索的最大的区别是,搜索是严格按照关键字匹配,而生成式AI和人类大脑一样,能够联想,有自己的主观观点。
清华大学与蚂蚁集团将合作研究安全通用大模型和下一代互联网应用安全技术
据蚂蚁集团官微,4月7日,清华大学与蚂蚁集团签署合作协议,双方将在“下一代互联网应用安全技术”方向展开合作,聚焦智能风控、反欺诈等核心安全场景,先期聚焦在可信AI和安全通用大模型两个核心领域。
在可信AI领域,双方将联合攻克安全对抗、博弈攻防、噪声学习等核心技术,加强AI模型的可信保障机制,提升规模化落地中的AI模型的可解释性、鲁棒性、公平性及隐私保护能力。
同时,双方还将开展“安全通用大模型”的技术路线和落地研究,以应对大模型技术爆发时代的安全科技生产力问题,及通用AI能力广泛应用带来的新型未知风险防控。双方将基于互联网异构数据,构建面向网络安全、数据安全、内容安全、交易安全等多领域多任务的安全通用大模型,以打造强推理能力,解决跨多风险领域的安全任务拓展;覆盖互联网行为全周期,实现端到端的安全防控运营智能化提效。
据悉,过去几年,清华大学与蚂蚁集团通过CCF-蚂蚁科研基金、定向联合研究等模式,开展了多项课题合作。此前,清华大学高等研究院已与蚂蚁集团联合设立了“隐私计算与区块链联合研究中心”,开展隐私计算、区块链以及信息安全等相关方向联合研究,以应对大规模数据流转必须面对的数据安全可信和个人信息保护难题。
科大讯飞:将于5月6日发布“1+N认知智能大模型”及应用产品
据大皖新闻,2023年以来,ChatGPT、GPT-4火爆全球,二者代表着人工智能的发展阶段已经从识别信息为主的感知智能,发展到以语言为核心的认知智能,并初步实现了智能涌现。面对认知智能大模型掀起的第四次AI浪潮,4月6日,在合肥召开的人工智能大模型发展论坛上,科大讯飞副总裁、研究院执行院长刘聪透露,科大讯飞“1+N认知智能大模型”将在5月6日正式发布。
刘聪表示,讯飞基于多年来在深度学习算法、大模型技术、行业大数据、知识图谱、多模态感知、系统工程等技术方面的深厚积累,同时依托于国家新一代人工智能开放创新平台、认知智能全国重点实验室、语言及语音信息处理国家工程研究中心三大国家级平台,已具备认知智能大模型综合研发和长期持续突破的底气和能力。
为了进一步提高大模型在细分行业的实用性,讯飞已实行了“1+N认知智能大模型”攻关计划。其中,“1”是通用认知智能大模型算法研发及高效训练底座平台,“N”则是应用于教育、医疗、人机交互、办公等多个行业领域的专用大模型版本。
刘聪介绍,在5月6日,讯飞“1+N认知智能大模型”也将正式发布,“N”个场景的示范性应用产品也将随之呈现。“我们希望为打造中国的认知智能大模型贡献自己的力量。”
华为云科学家田奇:大模型开发和训练一次需要1200万美元 市场将向大公司集中
新浪科技4月8日上午消息,在今日的人工智能大模型技术高峰论坛上,华为云人工智能领域首席科学家、国际欧亚科学院院士、IEEE/CAAI Fellow田奇发表题为《AI赋能千行百业智能升级》的演讲。他表示,人工智能发展已从局部探索走向千行百业,AI走进企业核心生产系统,开始创造更大价值。人工智能行业渗透率提速,2026年将达到20%。
田奇分享了人工智能发展面临的两大趋势:
第一,从小模型到大模型,过去10年内AI算法的算力需求提升了40万倍。大模型可能收编高度定制化的小模型,导致市场向大公司集中:资本门槛高,大模型开发和训练一次1200万美元;技术门槛高,对AI框架深度优化和超强的并行计算能力。
第二,人工智能与科学计算的交汇,工业、气象、能源、生物医学等众多领域都受到AI的深刻影响。
他认为,大模型是连接技术生态和商业生态的桥梁,是未来AI生态的核心。他介绍了华为云盘古大模型的进展:2019-2021年,立项研发盘古大模型;2021年4月,首次发布盘古基础大模型,包括盘古NLP大模型,盘古CV大模型,盘古科学计算大模型;后来陆续发布盘古行业大模型系列,2021年9月发布盘古药物分子大模型,2022年6月发布盘古矿山大模型,2022年11月发布盘古气象大模型、盘古海浪大模型、盘古金融OCR大模型。
田奇表示,华为云盘古大模型推动人工智能开发从作坊式到工业化升级,拥有优秀的泛化能力,高效样本筛选能力,小样本/零样本能力,低门槛AI开发。未来华为云盘古大模型要做好行业应用,形成关键技术壁垒,为煤矿、水泥、电力、金融、农业、国家云创造产业价值。
他以华为云盘古矿山大模型为例,人工智能可以帮助降低劳动强度,减少安全风险,沉淀专家经验,覆盖矿山采、掘、机、运、通等主业务。比如煤矿主运场景,主运智能监测系统20公里运行巡检,异物识别精度达98%;煤矿矿作业场景,作业序列智能监测系统,井下安全事故减少90%以上,动作规范识别准确率95%。
展望未来,他认为,AI赋能产业是人工智能新的爆发点,通过大数据、大模型、大算力,广泛服务企业客户、消费者以及开发者。