关于我们 设为首页 加入收藏夹

当前位置:首页 >> 新闻中心>> 金融公司 >> 正文内容

拓尔思:高质量数据是大模型价值跃迁的制胜法宝

来源:证券日报    作者:    发布时间:2023年06月05日

    本报记者 李乔宇

    2023年5月31日下午,人民日报社技术部主任何智敏、技术部副主任居晓军等领导一行到拓尔思(300229.SZ)总部调研,拓尔思总裁施水才携相关业务负责人接待陪同。

    何智敏一行听取了拓尔思正在承建的人民日报“国传”融媒体及中央数据库项目建设情况,双方就当前热门的大模型技术如何赋能媒体生产和传播,提升媒体行业服务能力等话题做了深入交流,并研究了拓尔思与人民日报共创的人民专属大模型落地应用的有关问题。

    调研最后,双方均表示在AIGC大模型时代下,探索媒体与大模型的融合应用势在必行,未来双方将依托各自在媒体领域的技术产品与生态优势,携手加强媒体大模型的深入应用,共同推动媒体融合向纵深发展。

    目前,拓尔思已经积累了大量的专业模型、AI工程化经验和千亿级规模高质量数据资产,在中国NLP市场中占有重要地位。根据国内权威咨询机构赛迪顾问发布《2022-2023年中国NLP市场研究报告》显示,预计2023-2025年,中国NLP市场将保持33%以上增速;到2025年,NLP市场规模将超过400亿元。

    自2022年11月份ChatGPT发布以来,国内大模型如雨后春笋般,层出不穷。据智东西统计,截至2023年5月29日,国内至少有55个类GPT大模型已经推出或马上面世。互联网/云服务大厂、AI企业、传统行业公司、大数据公司以及算法公司几乎全部入局。

    在大模型“百花齐放”的背景下,民生证券在研报中指出,“单纯发布一个大模型的门槛没有市场想象中的那么高”,“有大模型不难,难的是有一个能持续迭代,性能不断提升的优质大模型”。一些观点也提到,高质量数据才是垂大模型发展的稀缺要素。

    据拓尔思方面介绍,高质量数据是大模型价值跃迁的制胜法宝。目前,拓尔思拥有规模及质量均位列业界前茅的网络公开数据。千亿规模的高质量数据不仅可用于拓尔思自研的拓天大模型中,媒体、政务、金融三个领域的基础知识注入,也可为其他广大的MaaS服务商提供训练数据集服务。这些数据既可帮助垂类大模型实现中文特性增强,也可显著提升在上述专业领域方面的上下文和生成连续文本的能力。

分享:

来源:证券日报

责任编辑:无

[版权与免责声明]

专题推荐

为加强对网络借贷信息中介机构业务活动的监督管理,促进网络借贷行业健康发展,依据《中华人民共和国民法通则》、《中华人民共和国公司法》、《中华人民共和国合同法》等法律法规,中国银监会、工业…[详情]

关于我们 | 广告服务 | 本站声明 | 联系方式 | 征稿启事 | 评论须知 | 站点地图 | 会员登录
主办:赣州市普惠金融协会
指导单位:赣州市人民政府金融工作办公室 人民银行赣州市分行 国家金融监督管理总局赣州监管分局
Copyright© 2009-2012 www.gzjrw.com.cn All rights reserved 赣州金融网 版权所有.
请使用IE6.0以上版本或将浏览器设置为兼容模式浏览本网站
赣ICP备18016875号-2 赣公网安备36070202000326号 技术支持:红浩网络