大规模中文自然语言处理语料Large Scale Chinese Corpus ...

104万个词条(1,043,224条;原始文件大小1.6G,压缩文件519M;数据更新时间:2019.2.7).GoogleDrive下载或百度云盘.可能的用途:.可以做为通用中文语料,做 ...

大规模中文自然语言处理语料Large Scale Chinese Corpus ...

为中文自然语言处理领域发展贡献语料

【琅琊榜】-中文大模型专用竞技场,你关心的领先模型都在这里[1]

中文大模型最新榜单[2]

SuperCLUE: 中文通用大模型综合性测评基准[3]

*** update ****

中文任务基准测评,10大任务 & 9个模型一键运行、详细测评:

Language Understanding Evaluation benchmark for Chinese(CLUE benchmark[4]): run 10 tasks & 9 baselines with one line of code, performance comparision with details.

Releasing Pre-trained Model of ALBERT_Chinese[5]:

Training with 30G+ Raw Chinese Corpus, xxlarge, small version and more, Target to match State of the Art performance in Chinese with 30% less parameters, 2019-Oct-7, During the National Day of China!

语料库将会不断扩充。。。

一期目标:10个百万级中文语料 & 3个千万级中文语料(2019年5月1号)

二期目标:30个百万级中文语料 & 10个千万级中文语料 & 1个亿级中文语料(2019年12月31日)

Update: 增加高质量社区问答json版(webtext2019zh),可用于训练超大规模NLP模型;添加520万翻译语料(translation2019zh)。

1.维基百科(wiki2019zh),1...

相關分類資訊

國家教育研究院【解詞造句──華語文基礎詞語彙編】出版書本詳細資訊-適用對象:成人(學術性)

以下是國家教育研究院【解詞造句──華語文基礎詞語彙編】書本詳細資訊,包含書本標題、出版商、作者、出版日期、歸類、摘要等...

國家教育研究院【臺灣華語文語料庫-華語文教與學的必備工具】出版書本詳細資訊-適用對象:成人(學術性)

以下是國家教育研究院【臺灣華語文語料庫-華語文教與學的必備工具】書本詳細資訊,包含書本標題、出版商、作者、出版日期、...

國家教育研究院【跨域趨勢—臺灣華語文語料庫與能力基準整合應用系統】出版書本詳細資訊-適用對象:成人(學術性)

以下是國家教育研究院【跨域趨勢—臺灣華語文語料庫與能力基準整合應用系統】書本詳細資訊,包含書本標題、出版商、作者、出...

國家教育研究院【說情話境-華語文詞語情境分類】出版書本詳細資訊-適用對象:成人(學術性)

以下是國家教育研究院【說情話境-華語文詞語情境分類】書本詳細資訊,包含書本標題、出版商、作者、出版日期、歸類、摘要等...