ParakeetEricRoss/parakeet/models/transformer_tts/vocoder.py

import paddle.fluid.dygraph as dg
import paddle.fluid as fluid
from parakeet.modules.customized import Conv1D
from parakeet.models.transformer_tts.utils import *
from parakeet.models.transformer_tts.cbhg import CBHG

class Vocoder(dg.Layer):
    """
    CBHG Network (mel -> linear)
    """
    def __init__(self, config, batch_size):
        super(Vocoder, self).__init__()
        self.pre_proj = Conv1D(num_channels = config['audio']['num_mels'], 
                             num_filters = config['hidden_size'],
                             filter_size=1)
        self.cbhg = CBHG(config['hidden_size'], batch_size)
        self.post_proj = Conv1D(num_channels = config['hidden_size'], 
                             num_filters = (config['audio']['n_fft'] // 2) + 1,
                             filter_size=1)

    def forward(self, mel):
        mel = layers.transpose(mel, [0,2,1])
        mel = self.pre_proj(mel)
        mel = self.cbhg(mel)
        mag_pred = self.post_proj(mel)
        mag_pred = layers.transpose(mag_pred, [0,2,1])
        return mag_pred
add TransformerTTS and fastspeech 2020-02-10 15:47:19 +08:00			`import paddle.fluid.dygraph as dg`
			`import paddle.fluid as fluid`
Adjust the directory structure 2020-02-11 16:57:30 +08:00			`from parakeet.modules.customized import Conv1D`
remove utils.py to models/transdformer_tts 2020-02-20 10:17:25 +08:00			`from parakeet.models.transformer_tts.utils import *`
move data.py and rename some files 2020-02-13 20:46:21 +08:00			`from parakeet.models.transformer_tts.cbhg import CBHG`
add TransformerTTS and fastspeech 2020-02-10 15:47:19 +08:00
			`class Vocoder(dg.Layer):`
			`"""`
			`CBHG Network (mel -> linear)`
			`"""`
transform parse to argparse 2020-02-13 14:48:21 +08:00			`def __init__(self, config, batch_size):`
add TransformerTTS and fastspeech 2020-02-10 15:47:19 +08:00			`super(Vocoder, self).__init__()`
transform parse to argparse 2020-02-13 14:48:21 +08:00			`self.pre_proj = Conv1D(num_channels = config['audio']['num_mels'],`
			`num_filters = config['hidden_size'],`
update Conv1D and Linear 2020-02-12 16:51:32 +08:00			`filter_size=1)`
transform parse to argparse 2020-02-13 14:48:21 +08:00			`self.cbhg = CBHG(config['hidden_size'], batch_size)`
			`self.post_proj = Conv1D(num_channels = config['hidden_size'],`
			`num_filters = (config['audio']['n_fft'] // 2) + 1,`
update Conv1D and Linear 2020-02-12 16:51:32 +08:00			`filter_size=1)`
add TransformerTTS and fastspeech 2020-02-10 15:47:19 +08:00
			`def forward(self, mel):`
			`mel = layers.transpose(mel, [0,2,1])`
			`mel = self.pre_proj(mel)`
			`mel = self.cbhg(mel)`
			`mag_pred = self.post_proj(mel)`
			`mag_pred = layers.transpose(mag_pred, [0,2,1])`
			`return mag_pred`