Wav2Vec2BertForSequenceClassification. return_attention_mask work wrong #35495

HERIUN · 2025-01-03T03:58:53Z

System Info

transformers version: 4.47.1
Platform: Linux-6.8.0-47-generic-x86_64-with-glibc2.39
Python version: 3.12.3
Huggingface_hub version: 0.27.0
Safetensors version: 0.4.5
Accelerate version: 0.26.0
Accelerate config: not found
PyTorch version (GPU?): 2.5.1+cu124 (True)
Tensorflow version (GPU?): not installed (NA)
Flax version (CPU?/GPU?/TPU?): not installed (NA)
Jax version: not installed
JaxLib version: not installed
Using distributed or parallel set-up in script?:
Using GPU in script?:
GPU type: NVIDIA RTX A5000

Who can help?

@ylacombe

Information

The official example scripts
My own modified scripts

Tasks

An officially supported task in the examples folder (such as GLUE/SQuAD, ...)
My own task or dataset (give details below)

Reproduction

I'am using https://github.com/huggingface/transformers/blob/main/examples/pytorch/audio-classification/run_audio_classification.py

from transformers import (
    AutoConfig,
    AutoFeatureExtractor,
    AutoModelForAudioClassification
)


dataset = load_dataset("hf-internal-testing/librispeech_asr_demo", "clean", split="validation")
dataset = dataset.sort("id")
sampling_rate = dataset.features["audio"].sampling_rate


labels = raw_datasets["train"].features[data_args.label_column_name].names
label2id, id2label = {}, {}
for i, label in enumerate(labels):
        label2id[label] = str(i)
        id2label[str(i)] = label


model_name_or_path = "facebook/w2v-bert-2.0"

feature_extractor = AutoFeatureExtractor.from_pretrained(model_name_or_path)
config = AutoConfig.from_pretrained(
        model_args.config_name or model_args.model_name_or_path,
        num_labels=len(label_list),
        label2id=label2id,
        id2label=id2label,
        finetuning_task="audio-classification",
)
model = AutoModelForAudioClassification.from_pretrained(
        model_name_or_path,
        config=config,
)

def train_transforms(batch):
        """Apply train_transforms across a batch."""
        subsampled_wavs = []
        for audio in batch[data_args.audio_column_name]:
            wav = random_subsample(
                audio["array"], max_length=data_args.max_length_seconds, sample_rate=feature_extractor.sampling_rate
            )
            subsampled_wavs.append(wav)
        inputs = feature_extractor(subsampled_wavs, sampling_rate=feature_extractor.sampling_rate)
        output_batch = {model_input_name: inputs.get(model_input_name)}
        output_batch["labels"] = list(batch[data_args.label_column_name])

        return output_batch

def val_transforms(batch):
        """Apply val_transforms across a batch."""
        wavs = [audio["array"] for audio in batch[data_args.audio_column_name]]
        inputs = feature_extractor(wavs, sampling_rate=feature_extractor.sampling_rate)
        output_batch = {model_input_name: inputs.get(model_input_name)}
        output_batch["labels"] = list(batch[data_args.label_column_name])

raw_datasets["train"].set_transform(train_transforms, output_all_columns=False)
raw_datasets["eval"].set_transform(val_transforms, output_all_columns=False)

...
## I don't know..

Expected behavior

When padding in batch, attention_mask will always [1,1,1,...,1]
but, I expect [0,0,0,...,1,1]

The text was updated successfully, but these errors were encountered:

LysandreJik · 2025-01-03T13:41:23Z

cc @eustlb

HERIUN added the bug label Jan 3, 2025

HERIUN changed the title ~~Wav2Vec2BertForSequenceClassification. return_attention_mask work weried.~~ Wav2Vec2BertForSequenceClassification. return_attention_mask work wrong Jan 3, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Wav2Vec2BertForSequenceClassification. return_attention_mask work wrong #35495

Wav2Vec2BertForSequenceClassification. return_attention_mask work wrong #35495

HERIUN commented Jan 3, 2025 •

edited

Loading

LysandreJik commented Jan 3, 2025

Wav2Vec2BertForSequenceClassification. return_attention_mask work wrong #35495

Wav2Vec2BertForSequenceClassification. return_attention_mask work wrong #35495

Comments

HERIUN commented Jan 3, 2025 • edited Loading

System Info

Who can help?

Information

Tasks

Reproduction

Expected behavior

LysandreJik commented Jan 3, 2025

HERIUN commented Jan 3, 2025 •

edited

Loading