Skip to content

关于学习率以及复现结果 #6

@Sihan-Song

Description

@Sihan-Song

您好,您在论文中提到的是pretrain和fine-tune阶段都使用1e-3作为学习率,但是在复现的时候,使用1e-3来finetune的效果很差,而使用0.3的效果要好一些,请问您实验时的最优学习率是多少呢?
感谢。

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions