Should apply model.norm layer to hidden_states[early_exit_layer] ?

https://github.com/voidism/DoLa/blob/dc88907406f9744f748f3c779f2353efd5bdc824/transformers-4.28.1/src/transformers/models/llama/modeling_llama.py#L703

I think you guys should apply model.norm layer to hidden_states[early_exit_layer] . Because only the last hidden_state applied model.norm layer. See https://github.com/voidism/DoLa/blob/dc88907406f9744f748f3c779f2353efd5bdc824/transformers-4.28.1/src/transformers/models/llama/modeling_llama.py#L594

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Should apply model.norm layer to hidden_states[early_exit_layer] ? #9

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

Should apply model.norm layer to hidden_states[early_exit_layer] ? #9

Description

Metadata

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

Issue actions