首页动态消费创业汽车商业房产互联网纵横聚焦快讯热点

资讯 > 商业 >

资讯 > 商业 >

中国大模型语料数据联盟开源发布高质量多模态语料“书生·万卷”

来源：新华财经发布时间：2023-08-14 20:46:12

(相关资料图)

据上海市经信委消息，8月14日，上海人工智能实验室宣布，联合中国大模型语料数据联盟成员单位，共同开源发布“书生·万卷”1.0多模态预训练语料。

“书生·万卷”1.0目前包含文本数据集、图文数据集、视频数据集三部分，本次开源的数据总量超过2TB。该语料数据包含超过5亿个文本，2200万个图文交错文档，1000个节目影像视频，具备多元融合、精细处理、价值对齐、易用高效等四大特征。

中国大模型语料数据联盟是由上海人工智能实验室联合中央广播电视总台、人民网、国家气象中心、中国科学技术信息研究所、上海报业集团、上海文广集团、上海数据集团、上海市数商协会、金杜律师事务所等单位联合发起成立的开放组织。

（文章来源：新华财经）

关键词：

责任编辑：FG003

上一篇：长城汽车CTO三次抨击比亚迪直指此前油箱举报事件

下一篇：最后一页

频道精选

中国大模型语料数据联盟开源发布高质量多模态语料“书生·万卷”2023-08-14 20:46:12
长城汽车CTO三次抨击比亚迪直指此前油箱举报事件2023-08-14 19:52:03
平安财险、安盛天平等7家险企获批设立上海再保险运营中心2023-08-14 19:57:12
青岛：提高租赁住房提取公积金额度上限升至3000元/月2023-08-14 19:51:37
中国科学院院士邓子新：改变传统药物发现路径合成生物学正加速崛起2023-08-14 19:50:24

光山法院：诉前保全维护合法权益的“定心丸”|今日热搜2023-08-14 19:43:11
农业农村部部署加强汛期农产品质量安全监管2023-08-14 18:46:42
商品日报（8月14日）：SC原油盘中大涨创近九个月新高碳酸锂跌破20万元关口创上市以来新低2023-08-14 18:51:18
安徽医科大学第二附属医院原党委书记都鹏飞被查2023-08-14 18:46:47
呼和浩特市与中兴通讯、三诺集团在深签署合作投资协议2023-08-14 18:56:50

中国大模型语料数据联盟开源发布高质量多模态语料“书生·万卷”

中国大模型语料数据联盟开源发布高质量多模态语料“书生·万卷”

长城汽车CTO三次抨击比亚迪直指此前油箱举报事件

长城汽车CTO三次抨击比亚迪直指此前油箱举报事件

热门资讯

河南新乡与河南师大探索校地合作新模式推进教育事业新发展西安交警推出122报警短信定位功能可精确定位报警位置大连失业保险金咨询电话阿根廷大选初选结果：“崇拜”特朗普的极右翼政党候选人领先电影《消失的她》延长上映至9月21日票房已突破35亿汗手汗脚汗手 8月15日10点西安多地区可预约HPV疫苗帮企业算好“减税账” 算准“红利账” 甘肃研发费用加计扣除政策扎实落地河北省大名县法院将司法服务向基层延伸

最新资讯

网站首页 | 关于我们 | 免责声明 | 联系我们

所有文章、评论、信息、数据仅供参考，使用前请核实，风险自负。

Copyright 2013-2020 高陵经济网版权所有京ICP备2022016840号-34

联系邮箱：920 891 263@qq.com glxcb.cn All Rights Reserved