wenge-research/yayi_uie_sft_data
General NLPZH, ENBenchmark
Wenge-research/yayi_uie_sft_data is a General NLP benchmark dataset in ZH, EN from wenge-research in Parquet format.
📊 This dataset is used as an LLM benchmark. See model leaderboards →
About wenge-research/yayi_uie_sft_data
训练数据/Training Data
百万级语料中文54%,英文46%;其中其中数据集包括12个领域包括金融,社会,生物,商业,工业制造,化学,车辆,科学,疾病医疗,个人生活,安全和通用。覆盖数百个使用场景
NER:中文覆盖28个实体类型包括人物,地缘政治,组织,身体部位,药物等,英文覆盖130个实体类型包括Animal, Weapon, Conference, Book等。
RE:中文覆盖232种关系包括买资,增持,重组,国籍,别名,亲属,入股,转让,导致,发生地点,制造商等,英...
Details
- Task
- General NLP
- Language
- ZH, EN
- Format
- Parquet
- Rows / instances
- N/A
- Creator
- wenge-research
- Year
- 2023