fastNLP是一款轻量级的自然语言处理(NLP)工具包, 目标是快速实现NLP任务以及构建复杂模型。.
fastNLP | 功能 |
---|---|
fastNLP.core |
实现了核心功能,包括数据处理组件、训练器、测试器等 |
fastNLP.models |
实现了一些完整的神经网络模型 |
fastNLP.modules |
实现了用于搭建神经网络模型的诸多组件 |
fastNLP.embeddings |
实现了将序列index转为向量序列的功能,包括读取预训练embedding等 |
fastNLP.io |
实现了读写功能,包括数据读入与预处理,模型读写,数据与模型自动下载等 |
fastHan是基于fastNLP与pytorch实现的中文自然语言处理工具,共有base与large两个版本。 其内核为基于BERT的联合模型,在13个语料库中进行训练,可处理中文分词、词性标注、依存分析、 命名实体识别 四项任务,在各项任务中均有不错表现。
采用Java编写的中文自然语言处理开源项目,提供了进行自然语言处理的工具, 包括分词、词性标注、句法分析、文本相似度计算等 以及进行处理所需的数据集
本项目现已停止维护
2020 FudanNLP. All Rights Reserved by Fudan University