#

TCMEval

TCMEval致力于打造一个科学、公平且严谨的中文 中医大模型 评测体系及开放平台。我们基于中医权威标准,不断更新维护高质量的中医数据集,全方位多维度量化模型在各个中医维度的能力。

多层次多维度评估体系

设置中医执业医师考试、中医医师职称考试、中医研究生入学考试、中医理论专题问答、中医临床实践等5大模块,共18个数据集。其中考试类数据集由权威中医专家团队根据国家医考大纲命题,中医理论问答数据集由权威中医专家团队根据中医专业教科书等通过国家认证的教材构建,中医临床实践数据集来源于真实病例并经过匿名化处理。

#

权威命题专家

#

佘世锋

5
#

张万年

2
#

凌曦淘

2
#

梁婉诗

2
#

李亚鑫

2
#

熊媛媛

2
#

张熠

2
#

梁艺

3

项目管理

#

付瑞吉

1
#

柳泽明

4
#

郭园方

4
#

程子豪

4
#

鹿煜恒

4
#

叶怀谦

4
#

刘晶晶

4
#

李子涵

4
#

高晓阳

6
#

胡小林

6
1北京知言吉智科技有限公司
2广州市杏儒堂医院管理有限公司
3广州市越秀区珠光街社区卫生服务中心
4北京航空航天大学
5广州中医药大学
6把脉互联网医院

如果我们工作对你有所启发

欢迎你把参与TCMEval评测的报告发表技术论文,你可以通过以下方式引用我们的 论文

#
@misc{TCMEval,
title={TCM-Eval: An Expert-Level Dynamic and Extensible Benchmark for Traditional Chinese Medicine},
author={Zihao Cheng and Yuheng Lu and Huaiqian Ye and Zeming Liu and Minqi Wang and Jingjing Liu and Zihan Li and Wei Fan and Yuanfang Guo and Ruiji Fu and Shifeng She and Gang Wang and Yunhong Wang},
year={2025},
eprint={2511.07148},
archivePrefix={arXiv},
primaryClass={cs.CL},
url={https://arxiv.org/abs/2511.07148},
}