在AI大模型竞争日趋激烈的当下,数据质量已成为决定模型性能的关键瓶颈。近日,智能知识(Human Intelligence)宣布完成天使轮融资,由耀途资本和锦秋基金联合投资。这标志着资本市场对高质量数据基础设施的重视,也反映出行业从“堆算力”向“精数据”转型的共识。智能知识的核心使命,是构建覆盖多领域、高价值的数据管道,为大模型训练提供“燃料”而非“杂质”。
本轮融资资金将主要用于两个方向:一是前沿数据品类扩张,深耕Coding、Enterprise Office(GDPVal)、Agentic Tool Use等高价值数据。这些场景对数据精度和上下文理解要求极高,例如在代码生成领域,错误数据会导致模型产生漏洞;在企业办公场景中,数据需符合GDPR等合规标准。二是积极探索AI4Math、AI4Science、AutoResearch等新场景,这些领域的数据稀缺且专业性强,智能知识计划通过专家标注和合成数据技术,为模型提供结构化、可推理的训练样本。
从行业影响来看,这一布局直击当前大模型训练的痛点。国内模型在通用对话上已接近国际水平,但在专业领域(如数学推理、科学实验设计)仍存在明显差距。智能知识的数据产品将帮助模型在Coding任务中提升代码生成准确率,在Agent场景中强化工具调用能力。例如,其Agentic Tool Use数据集通过模拟真实用户与API的交互,让模型学会自主规划任务流程,这对构建自主智能体至关重要。
展望未来,高质量数据基础设施的建设将成为AI产业的核心竞争力。对于AI从业者而言,建议关注数据标注的标准化和自动化工具,以及垂直领域数据集的获取渠道。智能知识的融资,或许预示着中国AI行业将迎来“数据基建”的爆发期,而谁能率先打通从原始数据到高价值训练样本的链路,谁就能在下一轮模型中占据先机。