项目结构
mini_llm/data/# 数据存储目录models/# 模型定义__init__.pymini_transformer.py# 我们的极小Transformer模型
training/# 训练相关代码__init__.pypretrain.py# 预训练代码sft.py# 监督微调代码lora.py# LoRA实现dpo.py# DPO实现distill.py# 蒸馏实现
utils/# 工具函数__init__.pydata_utils.py# 数据处理工具train_utils.py# 训练工具
main.py# 主入口文件