This commit is contained in:
sarahalamdari 2024-04-10 16:12:49 -04:00
Родитель 354fde009b
Коммит eb04f65295
1 изменённых файлов: 2 добавлений и 0 удалений

Просмотреть файл

@ -27,6 +27,7 @@ PAD = GAP
MSA_PAD = '!'
MASK = '#' # Useful for masked language model training
START = '@'
SEP = '/'
SPECIALS = STOP + GAP + MASK + START
PROTEIN_ALPHABET = ALL_AAS + SPECIALS
@ -34,6 +35,7 @@ MSA_AAS = ALL_AAS + GAP
MSA_ALPHABET = ALL_AAS + GAP + STOP + MASK + START + MSA_PAD
RNA_ALPHABET = IUPAC_AMB_RNA + SPECIALS
ENHANCER_ALPHABET = DNA + 'N' + GAP + MSA_PAD + MASK + STOP + START
MSA_ALPHABET_PLUS = MSA_ALPHABET + SEP
trR_ALPHABET = "ARNDCQEGHILKMFPSTWYV-"