WERAM - Writers, Erasers & Readers of Histone Acetylation and Methylation Database

Protein
Gene
Details
Classification
Function
Domain Profile
Sequence
Keyword
GO
Orthology
TOP

WERAM Information

Tag

Content

WERAM ID

WERAM-Art-0013

Ensembl Protein ID

AT1G17770.1

Uniprot Accession

Q9C5P1; SUVH7_ARATH; Q9LMU9

Genbank Protein ID

NP_564036.1

Protein Name

Histone-lysine N-methyltransferase, H3 lysine-9 specific SUVH7

Genbank Nucleotide ID

NM_101640.1

Gene Name

SUVH7;SET17;SDG17

Ensembl Information

Ensembl Gene ID	Ensembl Transcript ID	Ensembl Protein ID
AT1G17770	AT1G17770.1	AT1G17770.1

Details

Type	Family	Domain	Substrates	AA	References (PMIDs)
HMT	SUV39	SET	H3K9	K	20703330; 15659850

Status

Reviewed

Classification

Type	Family	E-value	Score	Start	End
HMT	SUV39	8.10e-43	146.8	368	660

Organism

Arabidopsis thaliana

NCBI Taxa ID

3702

Functional Description
(View)

Histone methyltransferase. Methylates 'Lys-9' of histone H3. H3 'Lys-9' methylation represents a specific tag for epigenetic transcriptional repression.

Domain Profile

HMT SUV39

    SUV39.txt   2 rLqvfktenk..GwGv.rclddiakgsFvciyaGeiltddeaeke 43 
                  r++++++ n+  ++++ ++++++++   +    G il+d +   e
  AT1G17770.1 368 RFKLVRKPNQppAYAIwKTVENLRNHDLIDSRQGFILEDLSFGAE 412
                  678888888888899989999999999999999999999776665 PP
    SUV39.txt   2 rLqvfktenkGwGvrclddiakgsFvciyaGeiltddeaekegleegdeyladldskesvenlkegyesdvplssdssntrqekdkeeseyiidakke 99 
                  +L+vfkt+n GwG+r++d i++g+F+c++aG   t++e+e     e+d+yl+d++++++   ++ +ye ++ l +ds ++ +e+ +  ++++i+ak++
  AT1G17770.1 520 HLEVFKTRNCGWGLRSWDPIRAGTFICEFAGLRKTKEEVE-----EDDDYLFDTSKIYQR--FRWNYEPELLL-EDSWEQVSEFINLPTQVLISAKEK 609
                  79*****************************999998887.....56*********9987..55566666644.667799999999************ PP
    SUV39.txt 100 gnvgrflnHscspNlfvqnvfvdthdlrfprvafFaskrikagtELtwdYg 150
                  gnvgrf+nHscspN+f+q++ ++++   +  +++Fa+k+i+++tELt+dYg
  AT1G17770.1 610 GNVGRFMNHSCSPNVFWQPIEYENRGDVYLLIGLFAMKHIPPMTELTYDYG 660
                  **************************************************6 PP

Protein Sequence
(Fasta)

MDKSIPIKAI PVACVRPDLV DDVTKNTSTI PTMVSPVLTN MPSATSPLLM VPPLRTIWPS 60
NKEWYDGDAG PSSTGPIKRE ASDNTNDTAH NTFAPPPEMV IPLITIRPSD DSSNYSCDAG 120
AGPSTGPVKR GRGRPKGSKN STPTEPKKPK VYDPNSLKVT SRGNFDSEIT EAETETGNQE 180
IVDSVMMRFD AVRRRLCQIN HPEDILTTAS GNCTKMGVKT NTRRRIGAVP GIHVGDIFYY 240
WGEMCLVGLH KSNYGGIDFF TAAESAVEGH AAMCVVTAGQ YDGETEGLDT LIYSGQGGTD 300
VYGNARDQEM KGGNLALEAS VSKGNDVRVV RGVIHPHENN QKIYIYDGMY LVSKFWTVTG 360
KSGFKEFRFK LVRKPNQPPA YAIWKTVENL RNHDLIDSRQ GFILEDLSFG AELLRVPLVN 420
EVDEDDKTIP EDFDYIPSQC HSGMMTHEFH FDRQSLGCQN CRHQPCMHQN CTCVQRNGDL 480
LPYHNNILVC RKPLIYECGG SCPCPDHCPT RLVQTGLKLH LEVFKTRNCG WGLRSWDPIR 540
AGTFICEFAG LRKTKEEVEE DDDYLFDTSK IYQRFRWNYE PELLLEDSWE QVSEFINLPT 600
QVLISAKEKG NVGRFMNHSC SPNVFWQPIE YENRGDVYLL IGLFAMKHIP PMTELTYDYG 660
VSCVERSEED EVLLYKGKKT CLCGSVKCRG SFT 693

Nucleotide Sequence
(Fasta)

ATGGATAAGT CTATTCCAAT CAAGGCAATA CCGGTTGCAT GTGTCAGACC AGATTTGGTA 60
GATGACGTGA CCAAAAACAC ATCAACGATT CCTACAATGG TTTCACCAGT TCTAACCAAT 120
ATGCCATCTG CAACATCTCC TCTTCTAATG GTCCCACCTC TTCGAACAAT CTGGCCATCC 180
AACAAGGAAT GGTACGATGG AGATGCTGGT CCTAGTAGTA CTGGTCCAAT CAAACGAGAA 240
GCGTCCGATA ATACTAATGA TACAGCACAC AACACATTTG CACCTCCTCC AGAAATGGTC 300
ATACCACTGA TCACCATTAG GCCAAGTGAT GACTCTAGCA ACTATTCTTG TGATGCGGGT 360
GCTGGTCCTA GTACTGGTCC AGTAAAACGA GGCCGTGGCC GACCAAAAGG TTCAAAAAAC 420
TCAACGCCGA CGGAGCCGAA GAAGCCAAAA GTATATGATC CCAACAGCTT AAAGGTTACA 480
TCTCGTGGGA ATTTCGATTC AGAGATAACC GAAGCAGAGA CAGAAACTGG AAACCAGGAG 540
ATAGTTGATT CCGTTATGAT GCGGTTTGAT GCGGTTAGAC GACGATTATG CCAAATAAAC 600
CATCCGGAAG ACATCCTTAC AACGGCAAGT GGCAATTGCA CGAAAATGGG TGTCAAGACA 660
AATACAAGAA GGAGAATTGG TGCAGTTCCT GGAATACACG TCGGAGATAT ATTCTATTAC 720
TGGGGTGAAA TGTGCTTAGT GGGGCTTCAC AAATCAAATT ATGGTGGTAT TGATTTTTTT 780
ACGGCTGCAG AGAGTGCAGT GGAAGGCCAT GCTGCTATGT GTGTGGTAAC AGCAGGACAA 840
TACGATGGTG AAACCGAGGG GCTTGACACG TTGATCTACA GCGGACAGGG CGGAACGGAC 900
GTGTACGGTA ACGCTCGTGA TCAAGAGATG AAGGGCGGGA ATCTTGCACT AGAAGCAAGT 960
GTAAGCAAAG GGAATGACGT TAGAGTCGTG AGAGGAGTGA TACATCCTCA TGAGAACAAT 1020
CAGAAGATAT ATATCTACGA TGGGATGTAT CTGGTTTCAA AGTTCTGGAC AGTGACAGGA 1080
AAATCCGGCT TCAAGGAGTT CAGATTCAAA TTGGTGAGGA AACCAAACCA ACCTCCTGCT 1140
TATGCAATCT GGAAAACAGT TGAAAATCTG AGGAACCATG ACTTGATTGA TTCAAGGCAA 1200
GGTTTTATAC TTGAAGATCT TTCTTTTGGA GCTGAGCTTT TACGAGTTCC GCTCGTTAAT 1260
GAAGTTGATG AAGATGACAA AACGATTCCC GAAGATTTTG ATTACATCCC CTCTCAGTGT 1320
CACTCTGGTA TGATGACGCA TGAATTTCAT TTTGATCGTC AATCACTTGG ATGCCAGAAT 1380
TGTCGACATC AGCCATGCAT GCATCAAAAC TGCACCTGCG TGCAGAGAAA CGGTGACCTG 1440
CTACCGTACC ATAACAACAT TTTGGTTTGT CGTAAACCAT TGATTTACGA GTGCGGTGGA 1500
TCTTGTCCTT GCCCCGACCA TTGCCCAACC CGGTTGGTTC AAACCGGTTT GAAACTCCAT 1560
TTGGAAGTGT TCAAGACAAG AAACTGTGGT TGGGGTTTAC GTTCTTGGGA TCCAATCCGA 1620
GCCGGAACTT TTATCTGCGA GTTTGCTGGT TTGAGAAAGA CAAAAGAAGA AGTAGAAGAG 1680
GATGATGATT ACTTGTTCGA CACGTCAAAG ATTTATCAGA GGTTCAGATG GAACTACGAA 1740
CCTGAGCTTT TGCTTGAAGA TAGTTGGGAA CAAGTCTCTG AATTTATCAA TCTTCCAACA 1800
CAAGTCTTGA TAAGTGCTAA GGAAAAAGGG AATGTTGGTC GGTTCATGAA TCACAGTTGT 1860
TCACCGAATG TTTTCTGGCA GCCTATTGAG TATGAAAACA GAGGTGATGT ATATCTTCTT 1920
ATCGGACTTT TTGCTATGAA GCATATTCCT CCGATGACAG AGTTAACATA TGACTATGGA 1980
GTTTCATGTG TGGAGAGGAG CGAAGAAGAT GAAGTACTTC TTTATAAAGG CAAGAAGACC 2040
TGTCTCTGTG GTTCAGTCAA ATGTCGTGGC TCTTTTACCT GA 2083

Nucleotide Fasta Sequence

>AT1G17770.1|SUV39|Arabidopsis thaliana
ATGGATAAGTCTATTCCAATCAAGGCAATACCGGTTGCATGTGTCAGACCAGATTTGGTAGATGACGTGACCAAAAACACATCAACGATTCCTACAATGGTTTCACCAGTTCTAACCAATATGCCATCTGCAACATCTCCTCTTCTAATGGTCCCACCTCTTCGAACAATCTGGCCATCCAACAAGGAATGGTACGATGGAGATGCTGGTCCTAGTAGTACTGGTCCAATCAAACGAGAAGCGTCCGATAATACTAATGATACAGCACACAACACATTTGCACCTCCTCCAGAAATGGTCATACCACTGATCACCATTAGGCCAAGTGATGACTCTAGCAACTATTCTTGTGATGCGGGTGCTGGTCCTAGTACTGGTCCAGTAAAACGAGGCCGTGGCCGACCAAAAGGTTCAAAAAACTCAACGCCGACGGAGCCGAAGAAGCCAAAAGTATATGATCCCAACAGCTTAAAGGTTACATCTCGTGGGAATTTCGATTCAGAGATAACCGAAGCAGAGACAGAAACTGGAAACCAGGAGATAGTTGATTCCGTTATGATGCGGTTTGATGCGGTTAGACGACGATTATGCCAAATAAACCATCCGGAAGACATCCTTACAACGGCAAGTGGCAATTGCACGAAAATGGGTGTCAAGACAAATACAAGAAGGAGAATTGGTGCAGTTCCTGGAATACACGTCGGAGATATATTCTATTACTGGGGTGAAATGTGCTTAGTGGGGCTTCACAAATCAAATTATGGTGGTATTGATTTTTTTACGGCTGCAGAGAGTGCAGTGGAAGGCCATGCTGCTATGTGTGTGGTAACAGCAGGACAATACGATGGTGAAACCGAGGGGCTTGACACGTTGATCTACAGCGGACAGGGCGGAACGGACGTGTACGGTAACGCTCGTGATCAAGAGATGAAGGGCGGGAATCTTGCACTAGAAGCAAGTGTAAGCAAAGGGAATGACGTTAGAGTCGTGAGAGGAGTGATACATCCTCATGAGAACAATCAGAAGATATATATCTACGATGGGATGTATCTGGTTTCAAAGTTCTGGACAGTGACAGGAAAATCCGGCTTCAAGGAGTTCAGATTCAAATTGGTGAGGAAACCAAACCAACCTCCTGCTTATGCAATCTGGAAAACAGTTGAAAATCTGAGGAACCATGACTTGATTGATTCAAGGCAAGGTTTTATACTTGAAGATCTTTCTTTTGGAGCTGAGCTTTTACGAGTTCCGCTCGTTAATGAAGTTGATGAAGATGACAAAACGATTCCCGAAGATTTTGATTACATCCCCTCTCAGTGTCACTCTGGTATGATGACGCATGAATTTCATTTTGATCGTCAATCACTTGGATGCCAGAATTGTCGACATCAGCCATGCATGCATCAAAACTGCACCTGCGTGCAGAGAAACGGTGACCTGCTACCGTACCATAACAACATTTTGGTTTGTCGTAAACCATTGATTTACGAGTGCGGTGGATCTTGTCCTTGCCCCGACCATTGCCCAACCCGGTTGGTTCAAACCGGTTTGAAACTCCATTTGGAAGTGTTCAAGACAAGAAACTGTGGTTGGGGTTTACGTTCTTGGGATCCAATCCGAGCCGGAACTTTTATCTGCGAGTTTGCTGGTTTGAGAAAGACAAAAGAAGAAGTAGAAGAGGATGATGATTACTTGTTCGACACGTCAAAGATTTATCAGAGGTTCAGATGGAACTACGAACCTGAGCTTTTGCTTGAAGATAGTTGGGAACAAGTCTCTGAATTTATCAATCTTCCAACACAAGTCTTGATAAGTGCTAAGGAAAAAGGGAATGTTGGTCGGTTCATGAATCACAGTTGTTCACCGAATGTTTTCTGGCAGCCTATTGAGTATGAAAACAGAGGTGATGTATATCTTCTTATCGGACTTTTTGCTATGAAGCATATTCCTCCGATGACAGAGTTAACATATGACTATGGAGTTTCATGTGTGGAGAGGAGCGAAGAAGATGAAGTACTTCTTTATAAAGGCAAGAAGACCTGTCTCTGTGGTTCAGTCAAATGTCGTGGCTCTTTTACCTGA

Sequence Source

Ensembl

Keyword

KW-0137--Centromere
KW-0156--Chromatin regulator
KW-0158--Chromosome
KW-0181--Complete proteome
KW-0238--DNA-binding
KW-0479--Metal-binding
KW-0489--Methyltransferase
KW-0539--Nucleus
KW-1185--Reference proteome
KW-0949--S-adenosyl-L-methionine
KW-0808--Transferase
KW-0862--Zinc
--

Interpro

IPR025794--Hist-Lys_N-MeTrfase_plant
IPR003616--Post-SET_dom
IPR007728--Pre-SET_dom
IPR015947--PUA-like_domain
IPR001214--SET_dom
IPR003105--SRA_YDG

PROSITE

PS50868--POST_SET
PS50867--PRE_SET
PS51575--SAM_MT43_SUVAR39_2
PS50280--SET
PS51015--YDG

Pfam

PF05033--Pre-SET
PF02182--SAD_SRA
PF00856--SET

Gene Ontology

GO:0000775--C:chromosome, centromeric region
GO:0005634--C:nucleus
GO:0003677--F:DNA binding
GO:0018024--F:histone-lysine N-methyltransferase activity
GO:0008270--F:zinc ion binding

Orthology

WERAM ID	Ensembl Protein ID	Species	Identity	E-value	Score
WERAM-Arl-0030	fgenesh1_pm.C_scaffold_1001523	Arabidopsis lyrata	79	0.0	1075
WERAM-Bro-0115	Bo6g105260.1	Brassica oleracea	53	0.0	655
WERAM-Brr-0018	Bra004258.1-P	Brassica rapa	56	0.0	646
WERAM-Prp-0038	EMJ21426	Prunus persica	48	2e-140	496
WERAM-Pot-0004	POPTR_0001s07390.1	Populus trichocarpa	42	6e-140	495
WERAM-Thc-0121	EOY19472	Theobroma cacao	42	3e-138	489
WERAM-Glm-0201	GLYMA15G35450.1	Glycine max	47	1e-135	481
WERAM-Viv-0081	VIT_13s0047g00120.t01	Vitis vinifera	46	2e-132	471
WERAM-Met-0175	KEH19208	Medicago truncatula	46	5e-129	459
WERAM-Orl-0082	KN539783.1_FGP008	Oryza longistaminata	46	3e-120	430
WERAM-Org-0110	ORGLA11G0160500.1	Oryza glaberrima	46	3e-120	430
WERAM-Orb-0118	OBART11G19080.1	Oryza barthii	46	3e-120	430
WERAM-Ors-0105	OS11T0602200-01	Oryza sativa	46	3e-120	430
WERAM-Orr-0118	ORUFI11G20440.1	Oryza rufipogon	46	3e-120	430
WERAM-Zem-0004	AC233961.1_FGP001	Zea mays	45	6e-120	429
WERAM-Tra-0156	Traes_4DL_7DA2A133B.1	Triticum aestivum	45	1e-119	427
WERAM-Sei-0106	Si028938m	Setaria italica	43	2e-119	427
WERAM-Orp-0070	OPUNC07G07250.1	Oryza punctata	45	3e-119	426
WERAM-Orni-0117	ONIVA11G18710.1	Oryza nivara	46	4e-119	426
WERAM-Sob-0019	Sb02g006620.1	Sorghum bicolor	43	6e-119	425
WERAM-Hov-0083	MLOC_63544.1	Hordeum vulgare	45	1e-118	424
WERAM-Orgl-0113	OGLUM11G18450.2	Oryza glumaepatula	45	4e-118	422
WERAM-Brd-0028	BRADI1G53840.1	Brachypodium distachyon	44	6e-118	422
WERAM-Orbr-0013	OB01G43520.1	Oryza brachyantha	43	2e-117	420
WERAM-Aet-0087	EMT20679	Aegilops tauschii	46	4e-116	416
WERAM-Sot-0091	PGSC0003DMT400077329	Solanum tuberosum	44	1e-113	408
WERAM-Orm-0054	OMERI05G19070.1	Oryza meridionalis	43	1e-113	407
WERAM-Ori-0121	BGIOSGA034571-PA	Oryza indica	41	1e-112	404
WERAM-Sol-0115	Solyc09g082050.2.1	Solanum lycopersicum	44	3e-112	403
WERAM-Lep-0057	LPERR05G16930.1	Leersia perrieri	44	2e-111	401
WERAM-Tru-0079	TRIUR3_29078-P1	Triticum urartu	40	1e-108	391
WERAM-Amt-0085	ERM98215	Amborella trichopoda	43	2e-101	367
WERAM-Sem-0004	EFJ22703	Selaginella moellendorffii	34	7e-75	279
WERAM-Php-0105	PP1S469_7V6.1	Physcomitrella patens	34	4e-68	256
WERAM-Mua-0084	GSMUA_Achr5P13120_001	Musa acuminata	32	5e-67	253

Created Date

25-Jun-2016

WERAM Information

Functional Description

Protein Fasta Sequence

Nucleotide Fasta Sequence