IPI:IPI00556369.3

Protein Information

ProteinIPI:IPI00556369.3
Gene SymbolSMG1
Protein DescriptionIsoform 1 of Serine/threonine-protein kinase SMG1
Sequence Length3662
Mwt410369.277 Da
Sequence
MSRRAPGSRL SSGGGGGGTK YPRSWNDWQP RTDSASADPD NLKYSSSRDR 
GGSSSYGLQP SNSAVVSRQR HDDTRVHADI QNDEKGGYSV NGGSGENTYG 
RKSLGQELRV NNVTSPEFTS VQHGSRALAT KDMRKSQERS MSYSDESRLS 
NLLRRITRED DRDRRLATVK QLKEFIQQPE NKLVLVKQLD NILAAVHDVL 
NESSKLLQEL RQEGACCLGL LCASLSYEAE KIFKWIFSKF SSSAKDEVKL 
LYLCATYKAL ETVGEKKAFS SVMQLVMTSL QSILENVDTP ELLCKCVKCI 
LLVARCYPHI FSTNFRDTVD ILVGWHIDHT QKPSLTQQVS GWLQSLEPFW 
VADLAFSTTL LGQFLEDMEA YAEDLSHVAS GESVDEDVPP PSVSLPKLAA 
LLRVFSTVVR SIGERFSPIR GPPITEAYVT DVLYRVMRCV TAANQVFFSE 
AVLTAANECV GVLLGSLDPS MTIHCDMVIT YGLDQLENCQ TCGTDYIISV 
LNLLTLIVEQ INTKLPSSFV EKLFIPSSKL LFLRYHKEKE VVAVAHAVYQ 
AVLSLKNIPV LETAYKLILG EMTCALNNLL HSLQLPEACS EIKHEAFKNH 
VFNVDNAKFV VIFDLSALTT IGNAKNSLIG MWALSPTVFA LLSKNLMIVH 
SDLAVHFPAI QYAVLYTLYS HCTRHDHFIS SSLSSSSPSL FDGAVISTVT 
TATKKHFSII LNLLGILLKK DNLNQDTRKL LMTWALEAAV LMKKSETYAP 
LFSLPSFHKF CKGLLANTLV EDVNICLQAC SSLHALSSSL PDDLLQRCVD 
VCRVQLVHSG TRIRQAFGKL LKSIPLDVVL SNNNHTEIQE ISLALRSHMS 
KAPSNTFHPQ DFSDVISFIL YGNSHRTGKD NWLERLFYSC QRLDKRDQST 
IPRNLLKTDA VLWQWAIWEA AQFTVLSKLR TPLGRAQDTF QTIEGIIRSL 
AAHTLNPDQD VSQWTTADND EGHGNNQLRL VLLLQYLENL EKLMYNAYEG 
CANALTSPPK VIRTFFYTNR QTCQDWLTRI RLSIMRVGLL AGQPAVTVRH 
GFDLLTEMKT TSLSQGNELE VTIMMVVEAL CELHCPEAIQ GIAVWSSSIV 
GKNLLWINSV AQQAEGRFEK ASVEYQEHLC AMTGVDCCIS SFDKSVLTLA 
NAGRNSASPK HSLNGESRKT VLSKPTDSSP EVINYLGNKA CECYISIADW 
AAVQEWQNAI HDLKKSTSST SLNLKADFNY IKSLSSFESG KFVECTEQLE 
LLPGENINLL AGGSKEKIDM KKLLPNMLSP DPRELQKSIE VQLLRSSVCL 
ATALNPIEQD QKWQSITENV VKYLKQTSRI AIGPLRLSTL TVSQSLPVLS 
TLQLYCSSAL ENTVSNRLST EDCLIPLFSE ALRSCKQHDV RPWMQALRYT 
MYQNQLLEKI KEQTVPIRSH LMELGLTAAK FARKRGNVSL ATRLLAQCSE 
VQLGKTTTAQ DLVQHFKKLS TQGQVDEKWG PELDIEKTKL LYTAGQSTHA 
MEMLSSCAIS FCKSVKAEYA VAKSILTLAK WIQAEWKEIS GQLKQVYRAQ 
HQQNFTGLST LSKNILTLIE LPSVNTMEEE YPRIESESTV HIGVGEPDFI 
LGQLYHLSSV QAPEVAKSWA ALASWAYRWG RKVVDNASQG EGVRLLPREK 
SEVQNLLPDT ITEEEKERIY GILGQAVCRP AGIQDEDITL QITESEDNEE 
DDMVDVIWRQ LISSCPWLSE LDESATEGVI KVWRKVVDRI FSLYKLSCSA 
YFTFLKLNAG QIPLDEDDPR LHLSHRVEQS TDDMIVMATL RLLRLLVKHA 
GELRQYLEHG LETTPTAPWR GIIPQLFSRL NHPEVYVRQS ICNLLCRVAQ 
DSPHLILYPA IVGTISLSSE SQASGNKFST AIPTLLGNIQ GEELLVSECE 
GGSPPASQDS NKDEPKSGLN EDQAMMQDCY SKIVDKLSSA NPTMVLQVQM 
LVAELRRVTV LWDELWLGVL LQQHMYVLRR IQQLEDEVKR VQNNNTLRKE 
EKIAIMREKH TALMKPIVFA LEHVRSITAA PAETPHEKWF QDNYGDAIEN 
ALEKLKTPLN PAKPGSSWIP FKEIMLSLQQ RAQKRASYIL RLEEISPWLA 
AMTNTEIALP GEVSARDTVT IHSVGGTITI LPTKTKPKKL LFLGSDGKSY 
PYLFKGLEDL HLDERIMQFL SIVNTMFATI NRQETPRFHA RHYSVTPLGT 
RSGLIQWVDG ATPLFGLYKR WQQREAALQA QKAQDSYQTP QNPGIVPRPS 
ELYYSKIGPA LKTVGLSLDV SRRDWPLHVM KAVLEELMEA TPPNLLAKEL 
WSSCTTPDEW WRVTQSYARS TAVMSMVGYI IGLGDRHLDN VLIDMTTGEV 
VHIDYNVCFE KGKSLRVPEK VPFRMTQNIE TALGVTGVEG VFRLSCEQVL 
HIMRRGRETL LTLLEAFVYD PLVDWTAGGE AGFAGAVYGG GGQQAESKQS 
KREMEREITR SLFSSRVAEI KVNWFKNRDE MLVVLPKLDG SLDEYLSLQE 
QLTDVEKLQG KLLEEIEFLE GAEGVDHPSH TLQHRYSEHT QLQTQQRAVQ 
EAIQVKLNEF EQWITHYQAA FNNLEATQLA SLLQEISTQM DLGPPSYVPA 
TAFLQNAGQA HLISQCEQLE GEVGALLQQR RSVLRGCLEQ LHHYATVALQ 
YPKAIFQKHR IEQWKTWMEE LICNTTVERC QELYRKYEMQ YAPQPPPTVC 
QFITATEMTL QRYAADINSR LIRQVERLKQ EAVTVPVCED QLKEIERCIK 
VFLHENGEEG SLSLASVIIS ALCTLTRRNL MMEGAASSAG EQLVDLTSRD 
GAWFLEELCS MSGNVTCLVQ LLKQCHLVPQ DLDIPNPMEA SETVHLANGV 
YTSLQELNSN FRQIIFPEAL RCLMKGEYTL ESMLHELDGL IEQTTDGVPL 
QTLVESLQAY LRNAAMGLEE ETHAHYIDVA RLLHAQYGEL IQPRNGSVDE 
TPKMSAGQML LVAFDGMFAQ VETAFSLLVE KLNKMEIPIA WRKIDIIREA 
RSTQVNFFDD DNHRQVLEEI FFLKRLQTIK EFFRLCGTFS KTLSGSSSLE 
DQNTVNGPVQ IVNVKTLFRN SCFSEDQMAK PIKAFTADFV RQLLIGLPNQ 
ALGLTLCSFI SALGVDIIAQ VEAKDFGAES KVSVDDLCKK AVEHNIQIGK 
FSQLVMNRAT VLASSYDTAW KKHDLVRRLE TSISSCKTSL QRVQLHIAMF 
QQWQHEDLLI NRPQAMSVTP PPRSAILTSM KKKLHTLSQI ETSIATVQEK 
LAALESSIEQ RLKWAGGANP ALAPVLQDFE ATIAERRNLV LKESQRASQV 
TFLCSNIIHF ESLRTRTAEA LNLDAALFEL IKRCQQMCSF ASQFNSSVSE 
LELRLLQRVD TGLEHPIGSS EWLLSAHKQL TQDMSTQRAI QTEKEQQIET 
VCETIQNLVD NIKTVLTGHN RQLGDVKHLL KAMAKDEEAA LADGEDVPYE 
NSVRQFLGEY KSWQDNIQTV LFTLVQAMGQ VRSQEHVEML QEITPTLKEL 
KTQSQSIYNN LVSFASPLVT DATNECSSPT SSATYQPSFA AAVRSNTGQK 
TQPDVMSQNA RKLIQKNLAT SADTPPSTVP GTGKSVACSP KKAVRDPKTG 
KAVQERNSYA VSVWKRVKAK LEGRDVDPNR RMSVAEQVDY VIKEATNLDN 
LAQLYEGWTA WV

Modification Site Information

Site Position 1232
MS/MS spectra 2 [show]
Best localized sequence K.ADFNYIK#SLSSFESGK.F
Matching Proteins
Site Position 1989
MS/MS spectra 1 [show]
Best localized sequence R.IQQLEDEVK#R.V
Matching Proteins