在日前举行的第七届数字中国建设峰会上,贵阳大数据交易所携手19家数商生态企业和机构共同发布633个人工智能高质量训练数据集。
这些训练数据来自贵州勘设、贵州新气象、中文在线、中财数碳、晴数智慧、中国知网、中科富创等19家企业和机构,覆盖“数据要素×”交通运输、金融服务、工业制造、科技创新等多个重点领域,涉及文字、音频、图片、视频等多种模态,以及TTS、ORC等跨模态数据,为大模型厂商提供了数据养料,降低了采集、清洗、加工、治理模型训练数据的成本。
此前,为破解有效数据供给不足的难题,贵数所以“数据专区”为抓手,按照“一个行业、一个专区”的思路,创新建立了数据专区,并陆续上线了电力数据专区、电信数据专区、乡村振兴数据专区等12个专区。(记者 方亚丽)