About
我是招富耀,一名专注于 SFT 数据全链路的大模型数据工程师。拥有视觉传达设计的专业背景,这让我在多模态数据场景下——尤其是图像质量评估、视觉-文本一致性判定等环节——具备独特的跨界视角。
我相信,数据质量是模型能力的天花板。我的工作核心是在需求拆解、数据合成、标注管理与评测验收的每一个环节中,确保交付给模型的每一条数据都经得起检验。
统筹 AI 业务数据完整闭环,管理 4 人数据组,与算法研发及硬件集成团队(共 12 人)协同推进项目落地。
参与大语言模型训练数据集的系统性构建,负责问答对训练数据的生产管理。
系统的审美训练为多模态场景下的数据工作提供了差异化视角。
Capabilities
从业务需求拆解、数据规格定义、合成生产、标注管理到交付评测的完整闭环。能结合模型能力演进与真实场景反馈,动态调整数据构建策略。
擅长将主观风格需求量化为可操作的标注维度。独立搭建"黄金样本 + 双人盲标 + 仲裁"三级质检体系,主观类标注一致性达 91%。
借助 AI 辅助编程进行数据预清洗;调用大模型 API 结合少样本示例进行批量合成与扩写;搭建可复用的评测工具。
多维度盲测评测框架(0-3 分制),覆盖文本与图像维度,安全无害性一票否决。通过双盲抽样驱动模型多轮迭代。
视觉传达设计背景赋予独特视角,在图像质量评估、人像相似度判定、视觉-文本一致性等多模态场景中具有专业审美判断力。
4 人数据团队日常管理经验,与算法研发、硬件集成等跨职能团队保持需求对齐与进度同步,建立周级数据交付看板。
Projects
多模态感知 · 个性化生成 · RAG 知识增强 — 覆盖"感知识别–内容生成–实体转化"的完整 AI 系统
基于 AI 视觉特征识别,根据观众属性实现讲解内容的实时动态匹配
Contact
如果你正在寻找一位懂数据质量、懂模型需求、能从需求到交付全链路把控的大模型数据工程师,欢迎联系我。
数据质量是模型能力的天花板。
我的工作,是不断抬高这个天花板。

扫码添加微信,期待与你交流