Важнейшим элементом номенклатуры генных мутаций является общепринятое краткое обозначение каждой из 20 аминокислот, входящих в состав белка (таблица 13). Оно может осуществляться либо путем записи 3 ключевых букв английского названия аминокислоты, либо условным однобуквенным символом. Современная номенклатура предполагает преимущественное использование однобуквенных обозначений аминокислот.
Для обозначения мутаций используется стандартизованная нумерация аминокислот в белке и нуклеотидов в составе гена. Отсчет аминокислот ведется с первого положения в полипептидной цепочке, отсчет нуклеотидов начинается с первого нуклеотида в составе первого смыслового кодона и ведется на протяжении всей кодирующей области (исключая нитроны). Нуклеотиды, находящиеся в составе экзонов, обозначаются заглавными буквами (А, Т, С, G), в составе интронов - маленькими (a, t, с, g).
Нуклеотиды, входящие в состав интронов или других некодирующих областей гена, нумеруются: исходя из их расположения по отношению к ближайшему экзону: если нуклеотид расположен левее экзона (т.е против рамки считывания), он записывается со знаком «-», если он находится правее экзона (вдоль
Таблица Г.
Общепринятая номенклатура аминокислот
рамки считывания), он записывается со знаком «+». Например, запись «-3» означает третий нуклеотид слева от начала первого экзона (т.е. от первого кодирующего нуклеотида); запись «15-1» означает первый интронный нуклеотид слева от экзона, начинающегося 15-м нуклеотидом; запись «34+3» означает третий нуклеотид интрона, следующего за экзоном, оканчивающимся 34-м нуклеотидом (рис. 76).
Запись мутаций может осуществляться как посредством обозначения нуклеотидных изменений в ДНК, так и посредством обозначения изменений аминокислотного состава белка (в тех случаях, когда такое изменение имеет место). В случае первого описания в литературе определенной мутации ее обозначение должно даваться как в нуклеотидной, так и в аминокислотной системе записи (если это возможно).
Относительно несложной является регистрация точковых мутаций. Для записи нуклеотидной замены приводятся номер мутировавшего нуклеотида, обозначение исходного нуклеотида и (через стрелку) -обозначение нового нуклеотида, например: 236G—»T (замена G на Т в положении 236 экзона); 1174+ЗА—gt;С (замена А на С в 3-м положении интрона, примыкающего справа к 1174-му нуклеотиду экзона) и т.д. Когда известна полная геномная последовательность, интронные мутации могут обозначаться символом «IVS» и номером соответствующего интрона. Так, если в указанном выше примере 1174-й нуклеотид замыкает 5-й экзон, то предствленная интронная мутация может быть обозначена как IVS5+3A—»C (замена А на С в 3-м положении 5-го интрона).
Для записи замены аминокислоты приводятся последовательно исходный вариант аминокислоты, ее порядковый номер в составе белка и новый вариант
Рис. 76. Принципы обозначения нуклеотидов в гене
аминокислоты, возникший в результате мутации, например: Y59S (замена тирозина на серин в 59-м кодоне). Эта же мутация может быть обозначена как Tyr59Ser (однако, как уже было указано, однобуквенное обозначение аминокислот признается предпочтительным). Для обозначения стоп-кодона, ведущего к обрыву трансляции, используется символ «X». Например: R67X (нонсенс-мутация с заменой аргинина на стоп-сигнал в 67-м кодоне).
Делсции принято обозначать символом «del», который следует после номера мутантного нуклеотида, например: 877delC (деления нуклеотида С в положении 877); 966-968delATT (деления трех нуклеотидов ATT в положении 966-968). Вставки (ин- серции) обозначаются символом «ins» с указанием нуклеотидного интервала, в который встроился новый нуклеотид, например: 911-912insG (вставка G между нуклеотидами, находящимися в положении 911 и 912). Для обозначения протяженных делений и вставок обычно указывается лишь общее число мутантных нуклеотидов. Например, запись 1634del27 означает делсцию участка длиной 27 нуклеотидов, начиная с 1634-го нуклеотида.
Вариабельное число простых нуклеотидных повторов обозначается следующим образом: 1337(GT)8-19 (т.е. динуклеотид GT, начиняющийся с 1337-го положения, может повторяться от 8 до 19 раз). Исходя из этого, мутация по типу экспансии тринук- леотидных повторов может быть записана следующим образом: 23(CAG)56 (т.е. 56 повторов триплета CAG, начинающегося с 23-го нуклеотида).
Точковые мутации, являющиеся полиморфизмами (т.е. либо не приводящие к изменению аминокислоты, либо ведущие к замене аминокислоты на функ- дионалъно равноценную ей) обозначаются символами, разделенными косой чертой, например: 1366C/G (С либо G в положении 1366). Аналогичным образом полиморфизмы обозначаются и в аминокислотной системе записи: 455Leu/Val, 455L/V (лейцин либо валин в кодоне 455).
Если в одном и том же аллеле зарегистрированы 2 мутации, они указываются в квадратных скобках через точку с запятой, например: [866G—»Т; 1001 А—» С]. При аутосомно-рецессивных заболеваниях для записи 2 мутаций, расположенных в различных аллелях одного гена, эти мутации также указываются в квадратных скобках и объединаются знаком «+»: [ 1997G-*T + 2001 A-*G].
В некоторых случаях для уточнения используемой нуклеотидной нумерации (геномная ДНК или кДНК) перед номером нуклеотида указывается особый индекс с точкой: для геномной ДНК используется индекс g. («genomic»), для кДНК - индекс с. («cDNA»).
Для обозначения мутаций используется стандартизованная нумерация аминокислот в белке и нуклеотидов в составе гена. Отсчет аминокислот ведется с первого положения в полипептидной цепочке, отсчет нуклеотидов начинается с первого нуклеотида в составе первого смыслового кодона и ведется на протяжении всей кодирующей области (исключая нитроны). Нуклеотиды, находящиеся в составе экзонов, обозначаются заглавными буквами (А, Т, С, G), в составе интронов - маленькими (a, t, с, g).
Нуклеотиды, входящие в состав интронов или других некодирующих областей гена, нумеруются: исходя из их расположения по отношению к ближайшему экзону: если нуклеотид расположен левее экзона (т.е против рамки считывания), он записывается со знаком «-», если он находится правее экзона (вдоль
Таблица Г.
Общепринятая номенклатура аминокислот
Аминокислота |
Трехбуквенный символ |
Однобуквенный символ |
Аланин |
Ala |
A |
Аргинин |
Arg |
R |
Аспарагин |
Asn |
N |
Аспарагиновая |
Asp |
D |
кислота |
|
|
Валин |
Val |
V |
Г истидип |
His |
H |
Гдицин |
Gly |
G |
Г лутамии |
Gin |
Q |
Глутаминовая |
Glu |
E |
кислота |
|
|
Изолейцин |
lie |
1 |
Лейцин |
Leu |
L |
Лизин |
Lys |
K. |
Метионин |
Met |
M |
Пролин |
Pro |
p |
Серин |
Ser |
s |
Тирозин |
Tyr |
Y |
Треонин |
Thr |
T |
Триптофан |
Tip |
W |
Фенилаланин |
Phe |
F |
Цистеин |
Cys |
C |
рамки считывания), он записывается со знаком «+». Например, запись «-3» означает третий нуклеотид слева от начала первого экзона (т.е. от первого кодирующего нуклеотида); запись «15-1» означает первый интронный нуклеотид слева от экзона, начинающегося 15-м нуклеотидом; запись «34+3» означает третий нуклеотид интрона, следующего за экзоном, оканчивающимся 34-м нуклеотидом (рис. 76).
Запись мутаций может осуществляться как посредством обозначения нуклеотидных изменений в ДНК, так и посредством обозначения изменений аминокислотного состава белка (в тех случаях, когда такое изменение имеет место). В случае первого описания в литературе определенной мутации ее обозначение должно даваться как в нуклеотидной, так и в аминокислотной системе записи (если это возможно).
Относительно несложной является регистрация точковых мутаций. Для записи нуклеотидной замены приводятся номер мутировавшего нуклеотида, обозначение исходного нуклеотида и (через стрелку) -обозначение нового нуклеотида, например: 236G—»T (замена G на Т в положении 236 экзона); 1174+ЗА—gt;С (замена А на С в 3-м положении интрона, примыкающего справа к 1174-му нуклеотиду экзона) и т.д. Когда известна полная геномная последовательность, интронные мутации могут обозначаться символом «IVS» и номером соответствующего интрона. Так, если в указанном выше примере 1174-й нуклеотид замыкает 5-й экзон, то предствленная интронная мутация может быть обозначена как IVS5+3A—»C (замена А на С в 3-м положении 5-го интрона).
Для записи замены аминокислоты приводятся последовательно исходный вариант аминокислоты, ее порядковый номер в составе белка и новый вариант
Рис. 76. Принципы обозначения нуклеотидов в гене
аминокислоты, возникший в результате мутации, например: Y59S (замена тирозина на серин в 59-м кодоне). Эта же мутация может быть обозначена как Tyr59Ser (однако, как уже было указано, однобуквенное обозначение аминокислот признается предпочтительным). Для обозначения стоп-кодона, ведущего к обрыву трансляции, используется символ «X». Например: R67X (нонсенс-мутация с заменой аргинина на стоп-сигнал в 67-м кодоне).
Делсции принято обозначать символом «del», который следует после номера мутантного нуклеотида, например: 877delC (деления нуклеотида С в положении 877); 966-968delATT (деления трех нуклеотидов ATT в положении 966-968). Вставки (ин- серции) обозначаются символом «ins» с указанием нуклеотидного интервала, в который встроился новый нуклеотид, например: 911-912insG (вставка G между нуклеотидами, находящимися в положении 911 и 912). Для обозначения протяженных делений и вставок обычно указывается лишь общее число мутантных нуклеотидов. Например, запись 1634del27 означает делсцию участка длиной 27 нуклеотидов, начиная с 1634-го нуклеотида.
Вариабельное число простых нуклеотидных повторов обозначается следующим образом: 1337(GT)8-19 (т.е. динуклеотид GT, начиняющийся с 1337-го положения, может повторяться от 8 до 19 раз). Исходя из этого, мутация по типу экспансии тринук- леотидных повторов может быть записана следующим образом: 23(CAG)56 (т.е. 56 повторов триплета CAG, начинающегося с 23-го нуклеотида).
Точковые мутации, являющиеся полиморфизмами (т.е. либо не приводящие к изменению аминокислоты, либо ведущие к замене аминокислоты на функ- дионалъно равноценную ей) обозначаются символами, разделенными косой чертой, например: 1366C/G (С либо G в положении 1366). Аналогичным образом полиморфизмы обозначаются и в аминокислотной системе записи: 455Leu/Val, 455L/V (лейцин либо валин в кодоне 455).
Если в одном и том же аллеле зарегистрированы 2 мутации, они указываются в квадратных скобках через точку с запятой, например: [866G—»Т; 1001 А—» С]. При аутосомно-рецессивных заболеваниях для записи 2 мутаций, расположенных в различных аллелях одного гена, эти мутации также указываются в квадратных скобках и объединаются знаком «+»: [ 1997G-*T + 2001 A-*G].
В некоторых случаях для уточнения используемой нуклеотидной нумерации (геномная ДНК или кДНК) перед номером нуклеотида указывается особый индекс с точкой: для геномной ДНК используется индекс g. («genomic»), для кДНК - индекс с. («cDNA»).