Superpose Task-specific Features for Model Merging (EMNLP 2025)

code of EMNLP2025 paper: Superpose Task-specific Features for Model Merging

Authors: Haiquan Qiu, You Wu, Dong Li, Jianmin Guo, Quanming Yao
Paper:

File Structure

stf/
│
├── merge/                         # Core STF merging scripts 
│   ├── stf_lora.py                # GPT-2 LoRA adapter merging
│   ├── stf_t5.py                  # T5 merging
│   ├── stf_vit.py                 # ViT merging
|   └── utils.py                   # common function: state dict - vector converting, merge matrix
│
├── eval/
│   └── lora/                      # LoRA evaluate utilities
│       ├── data/                  # E2E / DART / WebNLG raw & formatted data
│       ├── eval/                  # Official / third‑party generation metrics
|       ├── merged_checkpoint/
|       ├── pretrained_checkpoints 
│       ├── src/                   # GPT-2 decoding, beam search, wrappers
│       ├── trained_models/        # LoRA checkpoints of finetuned models
|       ├── create_dataset.sh
|       ├── download_pretrained_checkpoints.sh
|       └── eval.sh
│
|    └── t5/
|       ├── merged_checkpoint/
|       └── src/
|           ├── data/                  # Dataset readers & batching
|           ├── eval/                  # Evaluation & scoring components
|           ├── model/                 # T5Wrapper, loading & merge ops
|           ├── train/                 # Training configuration
|           └── utils/                 # Distributed + general utilities
|           └── inference.py           # evaluate utils
│
|    └── ViT/
|       ├── checkpoints/
|       ├── datasets/
|       ├── merged_checkpoint/
|       ├── src/
│       └── download.sh
├── LICENSE
├── README.md
├── requirements.txt
└── THIRD_PARTY_LICENSES.md

Core Files

stf_lora.py: LoRA (Low-Rank Adaptation) merging algorithms
stf_t5.py: T5 model merging implementation
stf_vit.py: Vision Transformer model merging implementation
utils.py: merging utilities: merge matrix (core function), state_dict_to_vector, vector_to_state_dict

Setup

Create a virtual environment and activate it.

conda create --name stf python=3.9
conda activate stf

Install dependencies

python -m pip install -r requirements.txt

Download Checkpoints and Datasets

T5

ViT

model checkpoint

download (7 ViT finetuned checkpoints, pretrained checkpoint and classification heads) to eval/ViT/Checkpoints/

https://drive.google.com/drive/folders/1u_Tva6x0p6oxu5Eo0ZZsf-520Cc_3MKw

gdown --folder https://drive.google.com/drive/folders/1u_Tva6x0p6oxu5Eo0ZZsf-520Cc_3MKw -O eval/ViT/checkpoints

dataset

cd eval/ViT
bash download.sh
cd ../..

LoRA

cd eval/LoRA/

model checkpoints

download 3 GPT2-Medium LoRA checkpoints to eval/LoRA/trained_models/GPT2_M/

E2E

DART

WebNLG

mkdir -p eval/LoRA/trained_models/GPT2_M
wget https://github.com/microsoft/LoRA/releases/download/GPT-2/gpt2_md_lora_e2e.pt -O eval/LoRA/trained_models/GPT2_M/gpt2_md_lora_e2e.pt

wget https://github.com/microsoft/LoRA/releases/download/GPT-2/gpt2_md_lora_dart.pt -O eval/LoRA/trained_models/GPT2_M/gpt2_md_lora_dart.pt

wget https://github.com/microsoft/LoRA/releases/download/GPT-2/gpt2_md_lora_webnlg.pt -O eval/LoRA/trained_models/GPT2_M/gpt2_md_lora_webnlg.pt

download pretrained checkpoints to stf/eval/LoRA/pretrained_checkpoints

bash download_pretrained_ckeckpoints.sh

dataset

create datasets at stf/eval/LoRA/data

bash create_datasets.sh

download eval utils to stf/eval/LoRA/eval

bash eval/download_evalscript.sh
cd GenerationEval
bash install_dependencies.sh
cd ../../../..

LLM

3 huggingface Llama-2-7B checkpoints:

LinkSoul/Chinese-Llama-2-7b

meta-math/MetaMath-7B-V1.0

qualis2006/llama-2-7b-int4-python-code-18k

Merge expriment and Test performance

ViT-B-32

python /merge/stf_vit.py

t5

python /merge/stf_t5.py

LoRA (GPT2-M)

python /merge/stf_lora.py
cd eval/LoRA
bash eval.sh

Reference

@inproceedings{qiu2025stf,
  title     = {Superpose Task-specific Features for Model Merging},
  author    = {Qiu Haiquan and Wu You and Li Dong and Guo, Jianmin and Yao, Quanming},
  booktitle = {Proceedings of the 2025 Conference on Empirical Methods in Natural Language Processing (EMNLP)},
  year      = {2025},
  publisher = {Association for Computational Linguistics},
  note      = {Corresponding author: Quanming Yao (qyaoaa@tsinghua.edu.cn)}
}

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Superpose Task-specific Features for Model Merging (EMNLP 2025)

File Structure

Core Files

Setup

Download Checkpoints and Datasets

T5

ViT

model checkpoint

dataset

LoRA

model checkpoints

dataset

LLM

Merge expriment and Test performance

ViT-B-32

t5

LoRA (GPT2-M)

Reference

About

Uh oh!

Releases

Packages

Contributors 3

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
eval		eval
merge		merge
LICENSE		LICENSE
README.md		README.md
THIRD_PARTY_LICENSES.md		THIRD_PARTY_LICENSES.md
requirements.txt		requirements.txt

License

LARS-research/STF

Folders and files

Latest commit

History

Repository files navigation

Superpose Task-specific Features for Model Merging (EMNLP 2025)

File Structure

Core Files

Setup

Download Checkpoints and Datasets

T5

ViT

model checkpoint

dataset

LoRA

model checkpoints

dataset

LLM

Merge expriment and Test performance

ViT-B-32

t5

LoRA (GPT2-M)

Reference

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Uh oh!

Languages

Packages