
投资界(ID:pedaily2012)11月20日消息,数创弧光(DataArc)宣布近期连续完成种子轮及种子+轮融资,累计融资金额达数千万元人民币,投后估值数亿元。本轮融资由英诺天使基金与东方富海领投,君科丹木、数字未来、启迪之星等财务投资机构,以及深智城、头部云厂商等产业投资方共同参与。融资将主要用于核心技术研发、产品矩阵完善与海内外市场拓展。
数创弧光成立于2025年1月,孵化于粤港澳大湾区数字经济研究院(IDEA研究院),是一家专注于大模型合成数据技术的创新企业。公司聚焦于从大模型训练过程中的“数据缺口”中寻找价值——特别是在小语种、隐私敏感行业、小样本场景以及长尾领域数据极度稀缺的情况下,通过合成数据技术系统性补齐真实数据无法获取、无法共享、无法覆盖的空白,将“数据缺口”转化为可度量的模型能力增量和业务增长空间。
数创弧光创始团队均为IDEA研究科学家,CEO江旭晖博士具备复合背景,以及多项国家自然科学基金重点项目及国家重点研发计划经验;CTO徐铖晋博士曾入选华为“天才少年”计划,并担任IDEA金融大模型研发总负责人。
团队融汇了中科院、浙大、清华、德国波恩大学等海内外知名高校的学术成果(发表顶会/刊论文100余篇),并结合了来自阿里、腾讯、AI独角兽及头部投行等一线机构的资深经验,兼具世界级研发能力与成熟的商业化落地实力。此外,由美国、英国工程院双院院士、IDEA研究院创院理事长沈向洋院士担任项目顾问,为公司发展提供顶层战略支持。
在业务布局上,数创弧光构建了“国内深度验证、全球规模复制”的协同发展路径。在国内市场,公司聚焦金融、高端制造等对数据质量与安全要求极高的场景,与多家头部银行、头部硬件厂商等机构开展联合验证,持续打磨产品的可靠性、隐私合规性与行业适配度。在海外市场,公司战略性聚焦中东等“小语种数据稀缺、高AI需求”的区域,通过自研合成数据框架,在语料构建中充分考虑宗教与文化因素,为海外客户提供更本地化的数据供给链与模型优化。
产品方面,数创弧光已形成以知识驱动的合成数据为内核,覆盖继续预训练、有监督微调、强化学习微调等不同阶段的数据合成方案,以及合成之后的数据筛选、质量评估、应用全链条,并沉淀为标准产品Living KB和SynData Platform,为企业提供从数据生成到知识管理的一站式解决方案。
英诺天使基金创始合伙人李竹表示: “在我们的 AI 投资框架中,‘数据创新’与模型、算力共同构成底层三要素。无论是模型推理能力的持续增强,还是具身智能的泛化性突破,本质上都依赖稳定、丰富且可合规的数据供给。随着互联网数据红利走向枯竭,行业‘数据荒’正在逼近。数创弧光提前在这一结构性缺口中卡位,以合成数据技术为隐私敏感、监管严格以及小语种等长尾场景重建数据供给体系,技术路径与市场需求高度契合。
我们看重的不仅是数创弧光的技术原创性,更是其在中东等海外市场快速验证的业务落地能力——在真实数据最稀缺、AI 需求增长最快的区域,数创弧光已经证明了产品价值。我相信数创弧光具备成为这一赛道基础设施级企业的潜力。”
东方富海投资部总经理韩雪松表示: “我们选择投资数创弧光,主要基于其在合成数据方向形成的技术路径与产品化能力。公司聚焦小语种、隐私敏感和长尾场景等数据缺口突出的领域,通过可控的合成数据体系补齐模型训练中的关键供给问题。核心团队来自 IDEA 研究院,具备扎实的研究基础和在金融、工业等复杂场景的实践经验。
在当前 AI 应用加速落地的背景下,高质量数据的成本与稀缺已成为行业普遍瓶颈。数创弧光的技术路线与这一趋势高度契合,具备明确的刚需价值和可扩展空间。”