概述

    PaddleHub以预训练模型应用为核心具备以下特点:

    • 模型即软件: 通过Python API或命令行实现模型调用,可快速体验或集成飞桨特色预训练模型。

    • 一键模型转服务: 简单一行命令即可搭建属于自己的深度学习模型API服务完成部署。

    • 自动超参优化: 内置AutoDL Finetuner能力,一键启动自动化超参搜索。

    PaddleHub全景图

    PaddleHub特性

    PaddleHub采用模型即软件的设计理念,所有的预训练模型与Python软件包类似,具备版本的概念,通过 可以便捷完成模型的升级和卸载。此外,还可以通过Python的API或命令行实现快速预测的软件集成,更方便地应用和管理深度学习模型,完成模型的搜索、下载、安装、升级、预测等功能。更加详细的使用说明可以参考。

    迁移学习(Transfer Learning)通俗来讲,就是运用已有的知识来学习新的知识,核心是找到已有知识和新知识之间的相似性。PaddleHub提供了Fine-tune API,只需要少量代码即可完成深度学习模型在自然语言处理和计算机视觉场景下的迁移学习,可以在更短的时间完成模型的训练,同时模型具备更好的泛化能力。下图所示是基于PaddleHub,通过数十行代码完成ERNIE工业级文本分类示例:

    _images/paddlehub_finetune.gif

    十行代码完成ERNIE工业级文本分类

    PaddleHub提供了使用Finetune-API和预训练模型完成文本分类、、多标签分类、、检索式问答任务、、句子语义相似度计算、等迁移任务的使用示例,详细参见demo。下图是PaddleHub的迁移学习全景图:

    • 场景化使用

      PaddleHub在AI Studio上提供了IPython NoteBook形式的demo。用户可以直接在平台上在线体验,链接如下:

    NOTE: 是PaddleHub的官方账号。

    API

    实现自定义迁移任务

    PaddleHub Serving是基于PaddleHub的一键模型服务部署工具,能够通过简单的Hub命令行工具轻松启动一个模型预测在线服务。 其主要包括利用Bert Service实现embedding服务化,以及利用预测模型实现预训练模型预测服务化两大功能。未来还将支持开发者使用PaddleHub Fine-tune API的模型服务化。

    关于服务化部署详细信息参见PaddleHub Serving一键服务部署

    深度学习模型往往包含许多的超参数,而这些超参数的取值对模型性能起着至关重要的作用。因为模型参数空间大,目前超参调整都是通过手动,依赖人工经验或者不断尝试,且不同模型、样本数据和场景下不尽相同,所以需要大量尝试,时间成本和资源成本非常浪费。PaddleHub AutoDL Finetuner可以实现自动调整超参数,使得模型性能达到最优水平。它通过多种调优的算法来搜索最优超参。

    AutoDL Finetuner详细信息参见。