add datasets

2020-11-19 20:43:03 +08:00 · 2020-11-19 20:43:03 +08:00 · db7598c702
parent abee3ecdd4
commit db7598c702
4 changed files with 46 additions and 3 deletions
--- a/.gitignore
+++ b/.gitignore
@ -4,9 +4,6 @@
 *.udb
 *.ann

-# data
-datasets/
-
 # Byte-compiled / optimized / DLL files
 __pycache__/
 *.py[cod]
--- a/parakeet/datasets/init.py
+++ b/parakeet/datasets/init.py
@ -0,0 +1,2 @@
+from parakeet.datasets.common import *
+from parakeet.datasets.ljspeech import *
--- a/parakeet/datasets/common.py
+++ b/parakeet/datasets/common.py
@ -0,0 +1,21 @@
+from paddle.io import Dataset
+import os
+import librosa
+
+class AudioFolderDataset(Dataset):
+    def __init__(self, path, sample_rate, extension="wav"):
+        self.root = os.path.expanduser(path)
+        self.sample_rate = sample_rate
+        self.extension = extension
+        self.file_names = [
+            os.path.join(self.root, x) for x in os.listdir(self.root) \
+                if os.path.splitext(x)[-1] == self.extension]
+        self.length = len(self.file_names)
+
+    def __len__(self):
+        return self.length
+
+    def __getitem__(self, i):
+        file_name = self.file_names[i]
+        y, _ = librosa.load(file_name, sr=self.sample_rate) # pylint: disable=unused-variable
+        return y
--- a/parakeet/datasets/ljspeech.py
+++ b/parakeet/datasets/ljspeech.py
@ -0,0 +1,23 @@
+from paddle.io import Dataset
+from pathlib import Path
+
+class LJSpeechMetaData(Dataset):
+    def __init__(self, root):
+        self.root = Path(root).expanduser()
+        wav_dir = self.root / "wavs"
+        csv_path = self.root / "metadata.csv"
+        records = []
+        speaker_name = "ljspeech"
+        with open(str(csv_path), 'rt') as f:
+            for line in f:
+                filename, _, normalized_text = line.strip().split("|")
+                filename = str(wav_dir / (filename + ".wav"))
+                records.append([filename, normalized_text, speaker_name])
+        self.records = records
+
+    def __getitem__(self, i):
+        return self.records[i]
+
+    def __len__(self):
+        return len(self.records)
+