Skip to content

可图(Kolors)-部署与使用

一、Kolors 简介

1. 介绍

Kolors 是快手 Kolors 团队开发的基于潜在扩散的大规模文本到图像生成模型。 Kolors 经过数十亿个文本图像对的训练,在视觉质量、复杂语义准确性以及中英文字符的文本渲染方面比开源和专有模型表现出显着优势。此外,Kolors 支持中英文输入,在理解和生成中文内容方面表现出强大的性能。

2. 前提条件

  • Python 3.8 或更新版本
  • PyTorch 1.13.1 或更新版本
  • Transformers 4.26.1 或更新版本
  • 推荐:CUDA 11.7 或更新版本

二、DAMODEL 平台创建适配机器

按照实际要求选择对应配置即可,本示例中使用 8 卡 4090 容器。 按照 Kolors 要求选择对应版本。

三、服务部署

1. 安装 Anaconda

bash
# 下载安装脚本
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh

# 安装 Anaconda
bash Miniconda3-latest-Linux-x86_64.sh

 Anaconda 目录加入环境变量
vim ~/.bashrc
export PATH=$PATH:/root/miniconda3/condabin

# 重新加载环境变量
source ~/.bashrc

2. Kolors 库下载

bash
apt-get install git-lfs
git clone https://github.com/Kwai-Kolors/Kolors
cd Kolors

3. 创建虚拟环境并安装依赖项

bash
conda create --name kolors python=3.8
conda init bash
source ~/.bashrc
conda activate kolors
pip install -r requirements.txt
python3 setup.py install
git lfs clone https://huggingface.co/Kwai-Kolors/Kolors weights/Kolors

四、生成图片

bash
python3 scripts/sample.py "一个在星空下奔跑的女孩"
# The image will be saved to "scripts/outputs/sample_test.jpg"

DAMODEL