北京拟整合现有开源中文预训练数据集和高质量互联网中文数据|当前动态

来源:北京商报网 2023-05-16 12:57:18


【资料图】

北京商报讯(记者 杨月涵)5月16日,据北京市科委官网,北京出台《北京市促进通用人工智能创新发展的若干措施(2023-2025年)(征求意见稿)》,针对目前大模型训练高质量中文语料占比过少,不利于中文语境表达及产业应用的问题,征求意见稿提到,整合现有开源中文预训练数据集和高质量互联网中文数据并进行合规清洗。同时持续扩展高质量多模态数据来源,建设合规安全的中文、图文对、音频、视频等大模型预训练语料库,通过北京国际大数据交易所社会数据专区进行定向有条件开放。

上一篇:每股净资产每股公积金_每股公积金 下一篇:最后一页
精彩推荐

北京拟整合现有开源中文预训练数据集和高质量互联网中文数据|当前动态

2023-05-16

每股净资产每股公积金_每股公积金

2023-05-16

播报:胆大包天!男子店铺偷香烟,得手后还淡定与店主聊天

2023-05-16

针对IT设备 三星电机计划生产自主研发的固态电池

2023-05-16

【环球聚看点】system占用cpu过高可以关闭吗-system是什么意思 system是什么进程可以关闭吗

2023-05-16

国家统计局:1-4月全国房地产开发投资35514亿元 同比下降6.2%

2023-05-16

深度布局新能源,这家环保企业拿下一光伏投资运营公司过半股权

2023-05-16

23Q1货币政策执行报告点评:新发放贷款利率回升 利率决策审慎

2023-05-16

环球头条:汽车报道:奔奔EV260上市补贴后7.28-8.48万元

2023-05-16

"玲娜贝儿"只要两折秒杀?主播直播售假时被抓,判了!_快资讯

2023-05-16

当前热议!华宝中证银行ETF净值上涨1.02% 请保持关注

2023-05-16

便民也要不扰民_全球快看

2023-05-16

腾讯发布会20款新品清单:果然“憋了一年,等着往上冲”

2023-05-16

天天最新:联合国援助机构负责人:我们将在未来几天继续努力延长乌克兰黑海粮食协议。

2023-05-16

三国群英传7最强兵种篇_三国群英传7最强兵种_环球时快讯

2023-05-16

天天观热点:前途未卜的途虎养车

2023-05-15

华容:92名瓶装液化石油气经营企业配送员参加岗位培训

2023-05-15

“培育好家风”主题活动在海口市美兰区新安社区举办

2023-05-15

怎样炖鸡块又香又好吃(怎样炖鸡块又香又好吃窍门)

2023-05-15

中证协:坚决遏制非法证券活动蔓延扩散

2023-05-15
相关推荐

北京拟整合现有开源中文预训练数据集和高质量互联网中文数据|当前动态

2023-05-16

每股净资产每股公积金_每股公积金

2023-05-16

播报:胆大包天!男子店铺偷香烟,得手后还淡定与店主聊天

2023-05-16

针对IT设备 三星电机计划生产自主研发的固态电池

2023-05-16

【环球聚看点】system占用cpu过高可以关闭吗-system是什么意思 system是什么进程可以关闭吗

2023-05-16

国家统计局:1-4月全国房地产开发投资35514亿元 同比下降6.2%

2023-05-16

深度布局新能源,这家环保企业拿下一光伏投资运营公司过半股权

2023-05-16

23Q1货币政策执行报告点评:新发放贷款利率回升 利率决策审慎

2023-05-16

环球头条:汽车报道:奔奔EV260上市补贴后7.28-8.48万元

2023-05-16

"玲娜贝儿"只要两折秒杀?主播直播售假时被抓,判了!_快资讯

2023-05-16