34 lines
421 B
Python
34 lines
421 B
Python
|
import abc
|
|||
|
import string
|
|||
|
|
|||
|
__all__ = ["get_punctuations"]
|
|||
|
|
|||
|
EN_PUNCT = [
|
|||
|
" ",
|
|||
|
"-",
|
|||
|
"...",
|
|||
|
",",
|
|||
|
".",
|
|||
|
"?",
|
|||
|
"!",
|
|||
|
]
|
|||
|
|
|||
|
CN_PUNCT = [
|
|||
|
"、",
|
|||
|
",",
|
|||
|
";",
|
|||
|
":",
|
|||
|
"。",
|
|||
|
"?",
|
|||
|
"!"
|
|||
|
]
|
|||
|
|
|||
|
def get_punctuations(lang):
|
|||
|
if lang == "en":
|
|||
|
return EN_PUNCT
|
|||
|
elif lang == "cn":
|
|||
|
return CN_PUNCT
|
|||
|
else:
|
|||
|
raise ValueError(f"language {lang} Not supported")
|
|||
|
|