Awesome Diffusion

Universal Speech Enhancement with Score-based Diffusion

Joan Serrà, Santiago Pascual, Jordi Pons, R. Oguz Araz, Davide Scaini

arXiv 2022. Paper

2022-06-07

Guided-TTS 2: A Diffusion Model for High-quality Adaptive Text-to-Speech with Untranscribed Data

Sungwon Kim¹, Heeseung Kim¹, Sungroh Yoon

arXiv 2022. Paper

2022-05-30

BinauralGrad: A Two-Stage Conditional Diffusion Probabilistic Model for Binaural Audio Synthesis

Yichong Leng, Zehua Chen, Junliang Guo, Haohe Liu, Jiawei Chen, Xu Tan, Danilo Mandic, Lei He, Xiang-Yang Li, Tao Qin, Sheng Zhao, Tie-Yan Liu

arXiv 2022. Paper

2022-05-30

FastDiff: A Fast Conditional Diffusion Model for High-Quality Speech Synthesis

Rongjie Huang¹, Max W. Y. Lam¹, Jun Wang, Dan Su, Dong Yu, Yi Ren, Zhou Zhao

arXiv 2022. Paper Project

2022-04-21

SpecGrad: Diffusion Probabilistic Model based Neural Vocoder with Adaptive Noise Spectral Shaping

Yuma Koizumi, Heiga Zen, Kohei Yatabe, Nanxin Chen, Michiel Bacchiani

arXiv 2022. Paper

2022-03-31

BDDM: Bilateral Denoising Diffusion Models for Fast and High-Quality Speech Synthesis

Max W. Y. Lam, Jun Wang, Dan Su, Dong Yu

ICLR 2022. Paper Github

2022-03-25

Conditional Diffusion Probabilistic Model for Speech Enhancement

Yen-Ju Lu, Zhong-Qiu Wang, Shinji Watanabe, Alexander Richard, Cheng Yu, Yu Tsao

IEEE 2022. Paper

2022-02-10

InferGrad: Improving Diffusion Models for Vocoder by Considering Inference in Training

Zehua Chen, Xu Tan, Ke Wang, Shifeng Pan, Danilo Mandic, Lei He, Sheng Zhao

arXiv 2022. Paper

2022-02-08

ItôWave: Itô Stochastic Differential Equation Is All You Need For Wave Generation

Shoule Wu¹, Ziqiang Shi¹

arXiv 2022. Paper Project

2022-01-29

DiffGAN-TTS: High-Fidelity and Efficient Text-to-Speech with Denoising Diffusion GANs

Songxiang Liu, Dan Su, Dong Yu

arXiv 2022. Paper

2022-01-28

Itô-Taylor Sampling Scheme for Denoising Diffusion Probabilistic Models using Ideal Derivatives

Hideyuki Tachibana, Mocho Go, Muneyoshi Inahara, Yotaro Katayama, Yotaro Watanabe

arXiv 2021. Paper

2021-12-26

Guided-TTS:Text-to-Speech with Untranscribed Speech

Heeseung Kim, Sungwon Kim, Sungroh Yoon

arXiv 2021. Paper

2021-11-30

Denoising Diffusion Gamma Models

Eliya Nachmani¹, Robin San Roman¹, Lior Wolf

arXiv 2021. Paper

2021-10-10

EdiTTS: Score-based Editing for Controllable Text-to-Speech

Jaesung Tae¹, Hyeongju Kim¹, Taesu Kim

arXiv 2021. Paper

2021-10-06

A Study on Speech Enhancement Based on Diffusion Probabilistic Model

Yen-Ju Lu¹, Yu Tsao¹, Shinji Watanabe

arXiv 2021. Paper

2021-07-25

Variational Diffusion Models

Diederik P. Kingma, Tim Salimans, Ben Poole, Jonathan Ho

arXiv 2021. Paper Github

2021-07-01

WaveGrad 2: Iterative Refinement for Text-to-Speech Synthesis

Nanxin Chen, Yu Zhang, Heiga Zen, Ron J. Weiss, Mohammad Norouzi, Najim Dehak, William Chan

arXiv 2021. Paper Project Github Github2

2021-06-17

CRASH: Raw Audio Score-based Generative Modeling for Controllable High-resolution Drum Sound Synthesis

Simon Rouard¹, Gaëtan Hadjeres¹

arXiv 2021. Paper Project

2021-06-14

PriorGrad: Improving Conditional Denoising Diffusion Models with Data-Driven Adaptive Prior

Sang-gil Lee, Heeseung Kim, Chaehun Shin, Xu Tan, Chang Liu, Qi Meng, Tao Qin, Wei Chen, Sungroh Yoon, Tie-Yan Liu

arXiv 2021. Paper Project

2021-06-11

DiffSVC: A Diffusion Probabilistic Model for Singing Voice Conversion*

Songxiang Liu¹, Yuewen Cao¹, Dan Su, Helen Meng

arXiv 2021. Paper Github

2021-05-28

Grad-TTS: A Diffusion Probabilistic Model for Text-to-Speech

Vadim Popov¹, Ivan Vovk¹, Vladimir Gogoryan, Tasnima Sadekova, Mikhail Kudinov

ICML 2021. Paper Project Github

2021-05-13

DiffSinger: Singing Voice Synthesis via Shallow Diffusion Mechanism

Jinglin Liu¹, Chengxi Li¹, Yi Ren¹, Feiyang Chen, Peng Liu, Zhou Zhao

arXiv 2021. Paper Project Github

2021-05-06

DiffSinger: Singing Voice Synthesis via Shallow Diffusion Mechanism

Jinglin Liu¹, Chengxi Li¹, Yi Ren¹, Feiyang Chen, Peng Liu, Zhou Zhao

arXiv 2021. Paper Project Github

2021-05-06

Restoring degraded speech via a modified diffusion model

Jianwei Zhang, Suren Jayasuriya, Visar Berisha

Interspeech 2021. Paper

2021-04-22

NU-Wave: A Diffusion Probabilistic Model for Neural Audio Upsampling*

Junhyeok Lee, Seungu Han

Interspeech 2021. Paper Project Github

2021-04-06

Diff-TTS: A Denoising Diffusion Model for Text-to-Speech*

Myeonghun Jeong, Hyeongju Kim, Sung Jun Cheon, Byoung Jin Choi, Nam Soo Kim

Interspeech 2021. Paper

2021-04-03

Symbolic Music Generation with Diffusion Models

Gautam Mittal, Jesse Engel, Curtis Hawthorne, Ian Simon

arXiv 2021. Paper Code

2021-03-30

DiffWave: A Versatile Diffusion Model for Audio Synthesis

Zhifeng Kong, Wei Ping, Jiaji Huang, Kexin Zhao, Bryan Catanzaro

ICLR 2021. Paper Github

2020-09-21

WaveGrad: Estimating Gradients for Waveform Generation

Nanxin Chen, Yu Zhang, Heiga Zen, Ron J. Weiss, Mohammad Norouzi, William Cha

ICLR 2021. Paper Project Github

2020-09-02