彰化县网站建设_网站建设公司_版式布局_seo优化
2025/12/31 9:55:17 网站建设 项目流程

数据集:https://modelscope.cn/datasets/AI-ModelScope/alpaca-gpt4-data-zh

32GPU

“train_batch_size”: 256,
“train_micro_batch_size_per_gpu”: 2,
“gradient_accumulation_steps”: 4,

一个step用14s左右,epoch训到了17

64GPU

“train_batch_size”: 512,
“train_micro_batch_size_per_gpu”: 2,
“gradient_accumulation_steps”: 4,

一个step用16s左右,epoch训到了29

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询