拓尔思(300229):领先的中文NLP服务商 拓天大模型赋能AIGC业务增长

时间:2024年02月19日 中财网
中文NLP 领先服务商,加速布局AI 大模型。拓尔思成立于1993 年,是中文全文检索技术的始创者,领先的人工智能、大数据和数据安全产品及服务提供商。拓尔思坚持“数智+赛道”的发展战略,以优秀的科技能力打造丰富的行业解决方案,为企业、政府实现数字化升级赋能。公司自主研发的TRS大数据平台、TRS 人工智能平台和安全一体化平台,已成为行业领先的数字化基座。同时,公司已建立了大规模的数据和知识资产,正在全面构建云和数据服务生态(SaaS&DaaS)。目前,公司的数智产品与服务已被国内外10000余家企业级用户广泛使用,尤其在企业数字化转型、数字政府、网络内容安全、融媒体、金融科技和开源情报等领域实现了深度应用。基于公司三十年的NLP 技术积累和三大数据资产平台积累的高质量数据,公司在2023 年全面发力大模型的研发和行业落地,自主研发拓天大模型,并在媒体、金融和政府等垂直行业落地。2023 年前三季度公司实现营业总收入6.01 亿元,同比下降5.57%;实现归母净利润2286.37 万元,同比下降77.96%。2023 年Q3 单季度,公司实现营业总收入1.57 亿元,同比下降25.94%;实现归母净利润-4678.04 万元,同比下降260.66%。


  数据积累深厚,应用空间广阔。公司采集的公开信源数据通过加工处理,通过不同专业模型转化成不同领域的知识数据,实现数据从资源性到经营性的数据资产变现,形成了三大数据资产平台:数家(媒体资讯)、网察(舆情)、数星(产业大脑)的格局。在数据流通方面,公司已实现了三大经营性数据资产平台的数据服务产品全面细化与优化,数据要素业务也呈良好增长态势。


  目前,公司数据服务类Open API 已在北京、上海、深圳、郑州数据交易所挂牌,贵阳大数据交易所与西部数据交易中心的数据服务上架正在同步推进中。在数据服务方面,公司大力开拓大模型预训练数据集服务业务,以数据推送服务方式为全国大模型服务厂商提供优质的中文预训练数据集。目前,公司拥有规模位列业界前茅的、经过领域知识加工的权威高质量公开数据1500 亿+,涵盖近10 年来的报刊数据、互联网主流新闻数据、新闻资讯客户端数据、政府类门户网站数据、权威第三方平台数据及行业资讯数据等。在数据资产管理方面,公司积极加强与上海数据交易所的交流,共同探索数据资产入表的操作实践,持续加强对数据资源的应用场景或业务模式、原始数据类型来源、加工维护和安全保护等相关机制优化、工作细化,以全面提升公司的数据资产管理能效。我们认为,公司在数据积累方面的优势有望推动数据要素为公司创造更大的价值回报。


  聚焦五大板块应用,深耕数字政府领域。公司作为人工智能、大数据和数据安全产品及服务提供商,为各行业用户的数智化赋能。公司业务根据行业应用的不同,可划分为数字政府、融媒体、金融科技、数字企业、公共安全五个版块。1)数字政府:数字政府是公司的成熟业务版块,主要面向各级政府和职能部门提供政府网站集约化、智慧监管、政务舆情、产业招商、数字机关等领域政务应用的解决方案、软件产品及数据服务。目前,公司的数字政府业务主要以“软件产品+大数据服务+订阅制SaaS 服务”的融合模式为客户提供服务。政府用户已经覆盖80%的中央和国务院机构,60%的省级政府,50%的地市政府。2)融媒体:融媒体是公司的成熟业务版块,主要面向各级新闻媒体单位围绕新闻生产策、采、编、发、评、运、屏全流程提供融媒体内容生产、用户行为资产、媒体大数据等综合服务。公司融媒体用户已经覆盖了72%的中央媒体,61%的省级媒体,40%的行业媒体。3)金融科技:金融科技是公司的成长业务版块,主要面向银行业金融机构提供智能风控、智能消保、普惠助贷、绿色金融等金融科技领域的软件产品及数据服务。目前,公司的金融科技业务主要以“软件产品+大数据服务+订阅SaaS 服务”的融合模式为客户提供服务。公司智能风控业务的用户已经覆盖了5 大国有银行、3 大政策性银行、92%的股份制商业银行。4)数字企业:数字企业是公司重点拓展业务版块,主要面向能源、消费电子、餐饮等行业用户提供智能内容管理、企业融媒宣传、企业声誉风险管理、企业开源情报等企业应用。公司数字企业版块订阅制SaaS 服务用户已经覆盖了中国能建、中国铁路、国投集团、国家电网、南方电网、中国人民保险、潍柴动力、海尔集团、鲁信集团、百胜集团、中国通用、上汽通用、九毛九集团、山东航空、浙江国贸等大型企业。5)公共安全:公共安全是公司的成长业务版块,主要面向网信、公安、防务等涉密和安全机构,提供公安情指行(情报、指挥、行动)、开源情报、知识图谱、数据安全等领域的产品和数据服务。


  发布拓天大模型,AIGC 业务有望快速增长。2023 年6 月29 日,拓尔思发布“拓天大模型”,并面向媒体、金融、政务领域,推出了三大行业大模型。1)媒体行业大模型:公司基于自有的1000 亿+互联网媒体资讯数据,100 亿+官媒数据,200 万+人民数据,14 大类知识标引规范,12000+知识标引规则作为专业训练数据,打造了媒体专业大模型,主要功能覆盖内容生产智能助手、新一代搜索与推荐、多模态传播与服务三大业务场景。2)金融行业大模型:公司基于自有的110 亿+金融主题数据、百亿级产业指标数据、30 亿+产业要素明细数据、2 亿+产业动态本体、500+以上标引维度、10000+知识标引规则、10 万+产业标签作为专业训练数据,打造了金融专业大模型,主要功能覆盖智能风控、智能客服、智能投研等业务场景。3)政务行业大模型:拓尔思基于自有的300 万+篇公文类数据、200 万+篇政策法规类数据、8000 万+篇政务资讯类数据等数据作为专业训练数据,打造了政务专业大模型,主要功能覆盖公文辅助写作、政策大脑和新一代政务互动等业务场景。和通用大模型相比,拓尔思拓天大模型基于多年自主研发成果,在自主可控、中文特性加强、专业知识加强、实时数据接入、内容安全和价值观对齐、客户私有化部署等方面具有领先优势,并与业务场景深度融合,为用户带来生产力变革。拓天大模型拥有内容生成、多轮对话、语义理解、跨模态交互、知识型搜索、逻辑推理、安全合规、数学计算、编程能力和插件扩展十大基础能力,具有中文特性增强的可控生成技术、融合搜索引擎的生成结果可信核查、融合稠密向量的跨模态能力加强以及支持外界知识及时更新四大创新点。我们认为,拓天大模型的发布有望赋能公司AIGC 业务的快速增长。


  盈利预测与投资建议。我们认为,公司作为领先的中文NLP 服务商,公司积极开发了拓天大模型并在多个行业成功落地,在AI 受到关注度持续提升的当下,公司或持续受益;此外,数据要素的蓬勃发展更为公司传统优势业务——大数据软件产品及服务业务奠定了未来增长的坚实基础。我们假设:1)大数据软件产品及服务业务方面,公司通过三大经营性数据资产平台(数家-媒体资讯、网察-舆情、数星-产业大脑)积累了具有高商业价值的大数据资源,拥有来自境内外、各行业数据资产总量超2000 亿条,具备日均亿级的数据获取能力,此外公司已同北京、上海、深圳、郑州、贵阳、浙江等省市的大数据交易所建立起合作关系,上架多款数据服务类产品,公司将持续强化数据要素底座基础,加强数据治理能力建设,丰富数据要素的流通与变现渠道。根据公司2023 半年报援引国家工业信息安全发展研究中心测算,“十四五”期间我国数据要素市场规模预计2025 年将突破1749 亿元,复合增速将达到26.3%,整体上进入高速发展阶段,故我们认为2024-2025 年数据要素行业有望进入高速发展阶段,公司大数据软件产品及服务业务也有望重回增长快车道,我们预计2023-2025 年公司大数据软件产品及服务业务同比增速分别为-10%、30%和20%。2)人工智能软件产品及服务业务方面,公司拓天行业大模型推出后,得到了广大媒体、金融、政务、舆情用户的关注。目前,拓天媒体大模型、金融大模型已在多个行业客户中得到试用和成功应用。拓天行业大模型通过中文特性增强、向量数据库等技术提升内容生成质量,通过问答 AIGC、Copilot 副驾驶、AI Agent 三种形式与核心业务系统集成,通过私有化部署能够有效保障安全与行业场景适配,考虑到目前人工智能领域得到的关注度持续提升,同时公司AIGC 业务2023H1 已经实现了营业收入同比增长206.02%的良好成绩,我们认为未来公司人工智能相关业务也有望快速稳定增长,我们预计2023-2025 年公司人工智能软件产品及服务业务同比增速分别为-8%、30%和26%。3)安全产品业务方面,公司主要面向政府、公检法、海关等单位提供以数据交换为核心的边界安全、物联网安全、大数据安全三大阵营产品线和解决方案。其中,边界安全产品在全国公安边界安全市场处于领先地位。2023 年内,公司仍在不断进行新品的研发工作,在边界安全产品方面,公司子公司天行网安基于统一架构的边界产品升级改造,有效提高开发效率及产品性能,提升产品竞争力,已完成边界安全基础平台开发。同时,启动了数据服务安全网关和视频交换平台3.2 版本的合作研发工作。在大数据安全方面,天行网安完成了公安安全大数据平台项目开发,发布了安全管理平台V1.0。


  同时启动了边界运维平台(BOP)2.0 版本的研发工作。同时,天行网安未来实验室已完成天行隐私计算平台V1.1 的研发,新一代FPGA 隔离板卡研发也基本完成,准备进行实验局。考虑到公司在安全产品领域的领先地位和对新品的  积极研发,我们认为安全产品业务有望维持较为稳定的增长,我们预计2023-2025 年公司安全产品业务同比增速分别为10%、15%和15%。4)系统集成及其他业务方面,考虑到系统集成收入是公司为客户实施软件项目时,应客户要求代其外购软硬件系统所获得的收入,故该业务有望伴随公司整体业务的发展稳定增长,我们预计2023-2025 年公司系统集成及其他业务同比增速分别为20%、20%和20%。整体来看,我们预计公司2023/2024/2025 归母净利润分别为0.38/2.45/3.30 亿元,EPS 分别为0.05/0.31/0.41 元,给予2024 年动态PE 55-60 倍,合理价值区间为16.97-18.51元,首次覆盖给予“优于大市”评级


  风险提示。数据要素发展不及预期的风险,AI 发展不及预期的风险,市场竞争加剧的风险。
□.杨.林./.杨.蒙    .海.通.证.券.股.份.有.限.公.司
中财网版权所有(C) HTTP://WWW.CFi.CN