当然可以。我会在文档的最开始添加一个更具描述性的标题。以下是更新后的Markdown格式:
开发机配置与ktransformer安装指南
创建开发机
用户进入息壤科研助手平台后,选择创建开发机。在框架选择中,要选择带有cuda12
以上标签的社区框架或公共框架。创建开发机完成后,通过远程登录进入开发机。
安装环境
查看显卡驱动
nvidia-smi
下载CUDA
wget https://developer.download.nvidia.com/compute/cuda/12.4.0/local_installers/cuda_12.4.0_550.54.14_linux.run
安装CUDA(跳过驱动安装)
sudo sh cuda_12.4.0_550.54.14_linux.run
配置环境变量
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
检查CUDA安装
运行以下命令以确认CUDA安装成功:
nvcc -V
安装Conda
首先安装必要的依赖:
apt install libgl1-mesa-glx libegl1-mesa libxrandr2 libxrandr2 libxss1 libxcursor1 libxcomposite1 libasound2 libxi6 libxtst6
然后下载并安装Conda:
wget https://repo.anaconda.com/archive/Anaconda3-2024.10-1-Linux-x86_64.sh
mkdir anaconda3
bash Anaconda3-2024.10-1-Linux-x86_64.sh -u anaconda3
# 安装过程中会提示是否接受许可协议,输入yes确认
# 指定安装路径为 /home/anaconda3
eval "$(/root/data/anaconda3/bin/conda shell.bash hook)"
创建Conda环境并安装Python包
初始化Conda
conda init
创建环境
conda create --name ktrans python=3.11
conda activate ktrans
更新pip
python -m pip install --upgrade pip
配置pip源
pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/
pip config list
安装包
pip install torch packaging ninja cpufeature numpy
pip install flash-attn --no-build-isolation
更新gcc包
sudo apt-get update
sudo apt-get install --only-upgrade libstdc++6
ln -sf /usr/lib/x86_64-linux-gnu/libstdc++.so.6 /home/anaconda3/envs/ktrans/bin/../lib/libstdc++.so.6
安装和运行ktransformer
克隆ktransformer仓库
git clone https://github.com/kvcache-ai/ktransformers.git
cd ktransformers
初始化和更新子模块
git submodule init
git submodule update
安装ktransformer
sh ./install.sh
export USE_NUMA=1
运行模型
python ./ktransformers/local_chat.py --model_path /model/path --gguf_path /gguf/file/path --cpu_infer 32
大家有问题欢迎随时提问我