国家标准验证可行路径,红湖·可信数据服务让高质量数据赋能大模型训练

从智能家居中智能音箱精准执行用户指令,到医疗领域人工智能辅助医生进行疾病诊断;从智能交通里自动驾驶技术的逐步成熟,到金融行业利用人工智能进行风险评估与投资决策,人工智能已广泛渗透进人们生活与社会生产的各个角落。据国际数据公司(IDC)预测,全球人工智能市场规模将在未来几年保持高速增长,年复合增长率有望超过20%。这一技术的迅猛发展,不仅改变着人们的生活方式,更推动着产业升级与经济结构的深度调整。

随着人工智能技术的不断进步,“如何安全可靠地获取高质量数据训练大模型” 成为行业发展的关键议题。与此同时,企业和机构在寻求AI数据服务时,也面临着“如何评估和选择适合自己需求的 AI 数据服务提供商”问题。高质量数据是大模型训练的“燃料”,直接决定了模型的性能与应用效果,但数据的安全流通与隐私保护难题却如同横亘在前的高墙,阻碍着优质数据的有效整合与利用。

我国高度重视数据要素市场培育和人工智能产业发展,近年先后出台《关于构建数据基础制度更好发挥数据要素作用的意见》(“数据二十条”)、《数字中国建设整体布局规划》等顶层设计文件,明确提出要建立数据可信流通体系,促进数据合规高效流通使用。工信部、网信办等部门也密集发布系列支持政策,推动建立数据空间技术标准、探索数据资产入表、鼓励数据基础设施建设,为数据要素市场化改革和AI产业高质量发展提供制度保障。

在国家对人工智能产业大力扶持,推动各行业数字化、智能化转型的大背景下,数据作为关键生产要素的重要性愈发凸显。如何实现数据的安全流通、高效共享与价值挖掘成了行业发展面临的关键课题。可信数据空间作为一种创新的数据治理模式,受到了广泛关注。

近期,全国信息技术标准化技术委员会大数据标准工作组(以下简称“全国数标委”)开展了首批可信数据空间方向标准/技术文件验证试点工作,旨在遴选一批在可信数据空间领域具有技术实力与实践经验的单位,通过试点验证相关标准与技术文件的可行性与有效性,推动可信数据空间技术的规范化、标准化发展。经过严格的评审与筛选,北电数智成功入选全国数标委首批可信数据空间方向标准/技术文件验证试点典型单位。这不仅是对北电数智在可信数据空间领域技术实力与创新能力的认可,也标志着北电数智将在推动可信数据空间行业标准制定与技术发展方面发挥重要作用。

红湖・可信数据空间是北电数智基于对数据治理与数据安全的深刻理解,率先研发布局的可信数据产品。其融合先进的区块链、隐私计算、数据加密等技术,打造的一套具有高安全性、高可信度、高可用性的数据治理解决方案。

在数据安全与隐私保护方面,红湖・可信数据空间采用了多重加密技术,对数据在传输、存储与使用过程中的每一个环节进行加密处理,确保数据的机密性,防止数据被窃取或篡改。同时,通过隐私计算技术实现数据“可用不可见”,在不泄露原始数据的前提下完成数据的联合分析与建模,有效保护了数据所有者的隐私与数据安全。例如,在医疗领域,不同医疗机构之间的数据往往因为隐私与安全问题难以共享,红湖・可信数据空间通过隐私计算技术,使得医疗机构能够在不泄露患者敏感信息的情况下,联合开展疾病研究、临床数据分析等工作,为提高医疗服务水平与疾病防治能力提供了支持。

在数据可信流通方面,红湖・可信数据空间利用区块链技术的不可篡改、可追溯特性,为数据的流通提供了可信的环境。每一次数据的交易、共享与使用都被记录在区块链上,形成不可篡改的审计日志,确保数据来源可查、去向可追、责任可究。这一特性增强了数据供需双方的信任,促进了数据的有效流通与共享。

红湖・可信数据空间还具备数据管理与分析能力,能够适配多领域创新应用需求。在文化创新领域,该平台积极推动生成式AI与可信数据空间技术深度融合,通过安全的数据治理体系整合海量文化影像素材、历史文献数据,探索实现老电影AI智能着色、中国传统美学元素智能化融入影视创作等创新应用场景,既保障了珍贵文化数据的安全存储与合规使用,又为文化内容创作注入科技动能,助力文化的创新性发展与创造性转化;在工业领域,企业往往面临着生产数据、设备数据、供应链数据等多种数据的管理难题,红湖・可信数据空间能够将这些数据进行有效整合与分析,帮助企业实现生产过程的优化、设备故障的预测与供应链的精准管理,提升企业的生产效率与竞争力。

随着数据要素市场化改革进入深水区,以及人工智能产业对高质量数据需求的爆发式增长,可信数据空间的建设将迎来广阔的发展前景。北电数智将以此次入选为契机,持续深化“红湖”可信数据空间的技术创新与应用拓展:一方面加大在隐私计算、数据语义互操作、数据资产化管理等关键领域的研发投入;另一方面,积极与医疗、工业、政务等领域伙伴合作,共建跨行业数据流通生态,推动数据要素安全、有序、高效地流向实体经济,为构建全国统一的数据要素大市场和数字中国建设注入新动能。