add datasets

2020-11-19 20:43:03 +08:00 · 2020-11-19 20:43:03 +08:00 · db7598c702
parent abee3ecdd4
commit db7598c702
4 changed files with 46 additions and 3 deletions
--- a/.gitignore
+++ b/.gitignore
@ -4,9 +4,6 @@
 *.udb
 *.ann
 # data
 datasets/
 # Byte-compiled / optimized / DLL files
 __pycache__/
 *.py[cod]
--- a/parakeet/datasets/init.py
+++ b/parakeet/datasets/init.py
@ -0,0 +1,2 @@
 from parakeet.datasets.common import *
 from parakeet.datasets.ljspeech import *
--- a/parakeet/datasets/common.py
+++ b/parakeet/datasets/common.py
@ -0,0 +1,21 @@
 from paddle.io import Dataset
 import os
 import librosa
 class AudioFolderDataset(Dataset):
    def __init__(self, path, sample_rate, extension="wav"):
        self.root = os.path.expanduser(path)
        self.sample_rate = sample_rate
        self.extension = extension
        self.file_names = [
            os.path.join(self.root, x) for x in os.listdir(self.root) \
                if os.path.splitext(x)[-1] == self.extension]
        self.length = len(self.file_names)
    def __len__(self):
        return self.length
    def __getitem__(self, i):
        file_name = self.file_names[i]
        y, _ = librosa.load(file_name, sr=self.sample_rate) # pylint: disable=unused-variable
        return y
--- a/parakeet/datasets/ljspeech.py
+++ b/parakeet/datasets/ljspeech.py
@ -0,0 +1,23 @@
 from paddle.io import Dataset
 from pathlib import Path
 class LJSpeechMetaData(Dataset):
    def __init__(self, root):
        self.root = Path(root).expanduser()
        wav_dir = self.root / "wavs"
        csv_path = self.root / "metadata.csv"
        records = []
        speaker_name = "ljspeech"
        with open(str(csv_path), 'rt') as f:
            for line in f:
                filename, _, normalized_text = line.strip().split("|")
                filename = str(wav_dir / (filename + ".wav"))
                records.append([filename, normalized_text, speaker_name])
        self.records = records
    def __getitem__(self, i):
        return self.records[i]
    def __len__(self):
        return len(self.records)
		`@ -0,0 +1,2 @@`
							`from parakeet.datasets.common import *`
							`from parakeet.datasets.ljspeech import *`