IPI:IPI00798339.3

Protein Information

ProteinIPI:IPI00798339.3
Gene SymbolEP400
Protein DescriptionIsoform 4 of E1A-binding protein p400
Sequence Length3043
Mwt331700.366 Da
Sequence
MHHGTGPQNV QHQLQRSRAC PGSEGEEQPA HPNPPPSPAA PFAPSASPSA 
PQSPSYQIQQ LMNRSPATGQ NVNITLQSVG PVVGGNQQIT LAPLPLPSPT 
SPGFQFSAQP RRFEHGSPSY IQVTSPLSQQ VQTQSPTQPS PGPGQALQNV 
RAGAPGPGLG LCSSSPTGGF VDASVLVRQI SLSPSSGGHF VFQDGSGLTQ 
IAQGAQVQLQ HPGTPITVRE RRPSQPHTQS GGTIHHLGPQ SPAAAGGAGL 
QPLASPSHIT TANLPPQISS IIQGQLVQQQ QVLQGPPLPR PLGFERTPGV 
LLPGAGGAAG FGMTSPPPPT SPSRTAVPPG LSSLPLTSVG NTGMKKVPKK 
LEEIPPASPE MAQMRKQCLD YHYQEMQALK EVFKEYLIEL FFLQHFQGNM 
MDFLAFKKKH YAPLQAYLRQ NDLDIEEEEE EEEEEEEKSE VINDEQQALA 
GSLVAGAGST VETDLFKRQQ AMPSTGMAEQ SKRPRLEVGH QGVVFQHPGA 
DAGVPLQQLM PTAQGGMPPT PQAAQLAGQR QSQQQYDPST GPPVQNAASL 
HTPLPQLPGR LPPAGVPTAA LSSALQFAQQ PQVVEAQTQL QIPVKTQQPN 
VPIPAPPSSQ LPIPPSQPAQ LALHVPTPGK VQVQASQLSS LPQMVASTRL 
PVDPAPPCPR PLPTSSTSSL APVSGSGPGP SPARSSPVNR PSSATNKALS 
PVTSRTPGVV ASAPTKPQSP AQNATSSQDS SQDTLTEQIT LENQVHQRIA 
ELRKAGLWSQ RRLPKLQEAP RPKSHWDYLL EEMQWMATDF AQERRWKVAA 
AKKLVRTVVR HHEEKQLREE RGKKEEQSRL RRIAASTARE IECFWSNIEQ 
VVEIKLRVEL EEKRKKALNL QKVSRRGKEL RPKGFDALQE SSLDSGMSGR 
KRKASISLTD DEVDDEEETI EEEEANEGVV DHQTELSNLA KEAELPLLDL 
MKLYEGAFLP SSQWPRPKPD GEDTSGEEDA DDCPGDRESR KDLVLIDSLF 
IMDQFKAAER MNIGKPNAKD IADVTAVAEA ILPKGSARVT TSVKFNAPSL 
LYGALRDYQK IGLDWLAKLY RKNLNGILAD EAGLGKTVQI IAFFAHLACN 
EGNWGPHLVV VRSCNILKWE LELKRWCPGL KILSYIGSHR ELKAKRQEWA 
EPNSFHVCIT SYTQFFRGLT AFTRVRWKCL VIDEMQRVKG MTERHWEAVF 
TLQSQQRLLL IDSPLHNTFL ELWTMVHFLV PGISRPYLSS PLRAPSEESQ 
DYYHKVVIRL HRVTQPFILR RTKRDVEKQL TKKYEHVLKC RLSNRQKALY 
EDVILQPGTQ EALKSGHFVN VLSILVRLQR ICNHPGLVEP RHPGSSYVAG 
PLEYPSASLI LKALERDFWK EADLSMFDLI GLENKITRHE AELLSKKKIP 
RKLMEEISTS AAPAARPAAA KLKASRLFQP VQYGQKPEGR TVAFPSTHPP 
RTAAPTTASA APQGPLRGRP PIATFSANPE AKGGEVVKIA QLASITGPQS 
RVAQPETPVT LQFQGSKFTL SHSQLRQLTA GQPLQLQGSV LQIVSAPGQP 
YLRAPGPVVM QTVSQAGAVH GALGSKPPAG GPSPAPLTPQ VGVPGRVAVN 
ALAVGEPGTA SKPASPIGGP TQEEKTRLLK ERLDQIYLVN ERRCSQAPVY 
GRDLLRICAL PSHGRVQWRG SLDGRRGKEA GPAHSYTSSS ESPSELMLTL 
CRCGESLQDV IDRVAFVIPP VVAAPPSLRV PRPPPLYSHR MRILRQGLRE 
HAAPYFQQLR QTTAPRLLQF PELRLVQFDS GKLEALAILL QKLKSEGRRV 
LILSQMILML DILEMFLNFH YLTYVRIDEN ASSEQRQELM RSFNRDRRIF 
CAILSTHSRT TGINLVEADT VVFYDNDLNP VMDAKAQEWC DRIGRCKDIH 
IYRLVSGNSI EEKLLKNGTK DLIREVAAQG NDYSMAFLTQ RTIQELFEVY 
SPMDDAGFPV KAEEFVVLSQ EPSVTETIAP KIARPFIEAL KSIEYLEEDA 
QKSAQEGVLG PHTDALSSDS ENMPCDEEPS QLEELADFME QLTPIEKYAL 
NYLELFHTSI EQEKERNSED AVMTAVRAWE FWNLKTLQER EARLRLEQEE 
AELLTYTRED AYSMEYVYED VDGQTEVMPL WTPPTPPQDD SDIYLDSVMC 
LMYEATPIPE AKLPPVYVRK ERKRHKTDPS AAGRKKKQRH GEAVVPPRSL 
FDRATPGLLK IRREGKEQKK NILLKQQVPF AKPLPTFAKP TAEPGQDNPE 
WLISEDWALL QAVKQLLELP LNLTIVSPAH TPNWDLVSDV VNSCSRIYRS 
SKQCRNRYEN VIIPREEGKS KNNRPLRTSQ IYAQDENATH TQLYTSHFDL 
MKMTAGKRSP PIKPLLGMNP FQKNPKHASV LAESGINYDK PLPPIQVASL 
RAERIAKEKK ALADQQKAQQ PAVAQPPPPQ PQPPPPPQQP PPPLPQPQAA 
GSQPPAGPPA VQPQPQPQPQ TQPQPVQAPA KAQPAITTGG SAAVLAGTIK 
TSVTGTSMPT GAVSGNVIVN TIAGVPAATF QSINKRLASP VAPGALTTPG 
GSAPAQVVHT QPPPRAVGSP ATATPDLVSM ATTQGVRAVT SVTASAVVTT 
NLTPVQTPAR SLVPQVSQAT GVQLPGKTIT PAHFQLLRQQ QQQQQQQQQQ 
QQQQQQQQQQ QQQQQQQQTT TTSQVQVPQI QGQAQSPAQI KAVGKLTPEH 
LIKMQKQKLQ MPPQPPPPQA QSAPPQPTAQ VQVQTSQPPQ QQSPQLTTVT 
APRPGALLTG TTVANLQVAR LTRVPTSQLQ AQGQMQTQAP QPAQVALAKP 
PVVSVPAAVV SSPGVTTLPM NVAGISVAIG QPQKAAGQTV VAQPVHMQQL 
LKLKQQAVQQ QKAIQPQAAQ GPAAVQQKIT AQQITTPGAQ QKVAYAAQPA 
LKTQFLTTPI SQAQKLAGAQ QVQTQIQVAK LPQVVQQQTP VASIQQVASA 
SQQASPQTVA LTQATAAGQQ VQMIPAVTAT AQVVQQKLIQ QQVVTTASAP 
LQTPGAPNPA QVPASSDSPS QQPKLQMRVP AVRLKTPTKP PCQ

Modification Site Information

Site Position 1255
MS/MS spectra 1 [show]
Best localized sequence R.APSEESQDYYHK#VVIR@.L
Matching Proteins
Site Position 1362
MS/MS spectra 1 [show]
Best localized sequence R.HPGSSYVAGPLEYPSASLILK#ALER.D
Matching Proteins
Site Position 1385
MS/MS spectra 3 [show]
Best localized sequence K.EADLSMFDLIGLENK#ITR.H
Matching Proteins
Site Position 1612
MS/MS spectra 3 [show]
Best localized sequence R.VAVNALAVGEPGTASK#PASPIGGPTQEEK.T
Matching Proteins