poyu39
/

wav2vec2-conformer-base_librispeech

Feature Extraction

Model card Files Files and versions

poyu39 commited on Sep 2, 2025

Commit

466a099

·

verified ·

1 Parent(s): 4219f23

Update README.md

Files changed (1) hide show

README.md +44 -3

README.md CHANGED Viewed

@@ -1,3 +1,44 @@
----
-license: mit
----

+---
+license: mit
+pipeline_tag: feature-extraction
+tags:
+- wav2vec2
+- conformer
+- speech
+datasets:
+- openslr/librispeech_asr
+language:
+- en
+---
+# wav2vec2-conformer-base
+## Dataset
+- [librispeech](https://www.openslr.org/12)
+## Framework
+- [faiseq](https://github.com/facebookresearch/fairseq)
+## Model Info
+```
+model:
+  _name: wav2vec2
+  quantize_targets: true
+  final_dim: 256
+  encoder_layerdrop: 0.05
+  dropout_input: 0.1
+  dropout_features: 0.1
+  feature_grad_mult: 0.1
+  encoder_layers: 12
+  encoder_embed_dim: 768
+  encoder_ffn_embed_dim: 3072
+  encoder_attention_heads: 12
+  layer_type: conformer
+  attn_type: espnet
+  pos_enc_type: rel_pos
+```
+This model is use in [emotion-conformer](https://github.com/poyu39/emotion-conformer)