GPT2 - GPT-2 训练实现


MIT
跨平台
Python

软件简介

非官方 GPT-2 训练实现,支持 GPU 和 TPU。

GPT-2 是一种基于 transformer 的大型语言模型,具有 15 亿个参数,在 800 万网页数据集上进行训练。

依赖:

GPU

pip3 install tensorflow-gpu regex

TPU

pip3 install tensorflow regex google-api-python-client oauth2client

下载模型

pip3 install requests tqdm

生成数据集

pip3 install ftfy tqdm newspaper3k