预训练时代微调新范式,高性能加速2800%,NLPer赶紧看过来!
时间:2021-10-14 17:01:17
手机看文章
扫描二维码
随时随地手机看文章
[导读]导读PaddleNLP是兼具科研学习和产业实践能力的PythonNLP工具包,提供中文领域丰富的预训练模型和部署工具,被高校、企业开发者广泛应用。近日,PaddleNLPv2.1正式发布,为开发者带来三项重要更新:开箱即用的工业级NLP预置任务能力Taskflow:八大经典场景一...


PaddleNLP 是兼具科研学习和产业实践能力的 Python NLP 工具包,提供中文领域丰富的预训练模型和部署工具,被高校、企业开发者广泛应用。近日,PaddleNLP v2.1正式发布,为开发者带来三项重要更新:
- 开箱即用的工业级NLP预置任务能力Taskflow:八大经典场景一键预测。
- 预训练时代的微调新范式应用:三行代码显著提升小样本学习效果。
- 高性能预测加速:文本生成任务28倍加速效果。

PaddleNLP是飞桨生态的自然语言处理开发库,旨在提升文本领域的开发效率,为开发者带来模型构建、训练及预测部署的全流程优质体验。



- 1. 开箱即用的工业级NLP预置任务能力——Taskflow

- 2. 预训练时代的微调新范式应用:三行代码提升小样本学习效果

https://github.com/PaddlePaddle/PaddleNLP/tree/develop/examples/few_shot
- 3. 高性能预测加速:文本生成场景高达28倍加速效果





PaddleNLP Transformer翻译模型加速优化前后的Nsight Profling对比图 (2)支持丰富的经典解码策略PaddleNLP v2.1提供工业界主流的解码加速支持,包括经典的Beam Search,以及多个Sampling-based的解码方式:如Diverse Sibling Search[6]、T2T版本的Beam Search实现[7]、Top-k/Top-p Sampling等。丰富的加速策略可以满足对话、翻译等工业场景的实际应用,同时PaddleNLP的加速实现也在百度内部经过了大规模互联网业务的真实考验。表1:PaddleNLP 2.1 支持加速的模型结构与解码策略



