Home

Download

Statistics

Examples

Help

Contact

	Fusion Gene Summary
	Fusion Gene ORF analysis
	Fusion Genomic Features
	Fusion Protein Features
	Fusion Gene Sequence
	Fusion Gene PPI analysis
	Related Drugs
	Related Diseases

Fusion gene:ARHGEF17-EP300 (FusionGDB2 ID:HG9828TG2033)

Fusion Gene Summary for ARHGEF17-EP300

Fusion gene summary

Fusion gene information	Fusion gene name: ARHGEF17-EP300
	Fusion gene ID: hg9828tg2033
		Hgene	Tgene
	Gene symbol	ARHGEF17	EP300
	Gene ID	9828	2033
	Gene name	Rho guanine nucleotide exchange factor 17	E1A binding protein p300
	Synonyms	P164RHOGEF\|RHOGEF17\|TEM4\|p164-RhoGEF	KAT3B\|MKHK2\|RSTS2\|p300
	Cytomap	('ARHGEF17')('EP300') 11q13.4	22q13.2
	Type of gene	protein-coding	protein-coding
	Description	rho guanine nucleotide exchange factor 17164 kDa Rho-specific guanine-nucleotide exchange factorRho guanine nucleotide exchange factor (GEF) 17Rho-specific guanine-nucleotide exchange factor 164 kDatumor endothelial marker 4	histone acetyltransferase p300E1A-associated protein p300E1A-binding protein, 300kDhistone butyryltransferase p300histone crotonyltransferase p300p300 HATprotein 2-hydroxyisobutyryltransferase p300protein propionyltransferase p300
	Modification date	20200313	20200329
	UniProtAcc	.	Q09472
	Ensembl transtripts involved in fusion gene	ENST00000263674, ENST00000536170,
Fusion gene scores	* DoF score	9 X 3 X 5=135	22 X 26 X 8=4576
	# samples	10	25
	** MAII score	log2(10/135*10)=-0.432959407276106 possibly effective Gene in Pan-Cancer Fusion Genes (peGinPCFGs). DoF>8 and MAII<0	log2(25/4576*10)=-4.1940870521163 possibly effective Gene in Pan-Cancer Fusion Genes (peGinPCFGs). DoF>8 and MAII<0
Context	PubMed: ARHGEF17 [Title/Abstract] AND EP300 [Title/Abstract] AND fusion [Title/Abstract]
Most frequent breakpoint	ARHGEF17(73022875)-EP300(41545042), # samples:3
Anticipated loss of major functional domain due to fusion event.	ARHGEF17-EP300 seems lost the major protein functional domain in Hgene partner, which is a CGC by not retaining the major functional domain in the partially deleted in-frame ORF. ARHGEF17-EP300 seems lost the major protein functional domain in Hgene partner, which is a CGC by not retaining the major functional domain in the partially deleted in-frame ORF. ARHGEF17-EP300 seems lost the major protein functional domain in Hgene partner, which is a essential gene by not retaining the major functional domain in the partially deleted in-frame ORF. ARHGEF17-EP300 seems lost the major protein functional domain in Hgene partner, which is a essential gene by not retaining the major functional domain in the partially deleted in-frame ORF.

* DoF score (Degree of Frequency) = # partners X # break points X # cancer types
** MAII score (Major Active Isofusion Index) = log2(# samples/DoF score*10)

Gene ontology of each fusion partner gene with evidence of Inferred from Direct Assay (IDA) from Entrez

Partner	Gene	GO ID	GO term	PubMed ID
Hgene	ARHGEF17	GO:0030036	actin cytoskeleton organization	12071859
Tgene	EP300	GO:0000122	negative regulation of transcription by RNA polymerase II	10733570
Tgene	EP300	GO:0001666	response to hypoxia	9887100\|15261140
Tgene	EP300	GO:0006110	regulation of glycolytic process	29775581
Tgene	EP300	GO:0006355	regulation of transcription, DNA-templated	15261140
Tgene	EP300	GO:0006473	protein acetylation	21030595\|24939902
Tgene	EP300	GO:0006475	internal protein amino acid acetylation	18722353
Tgene	EP300	GO:0010742	macrophage derived foam cell differentiation	26504087
Tgene	EP300	GO:0010976	positive regulation of neuron projection development	27256286
Tgene	EP300	GO:0016573	histone acetylation	25818647\|27256286
Tgene	EP300	GO:0018076	N-terminal peptidyl-lysine acetylation	12435739
Tgene	EP300	GO:0018393	internal peptidyl-lysine acetylation	17403783
Tgene	EP300	GO:0018394	peptidyl-lysine acetylation	23811396\|23962722
Tgene	EP300	GO:0031333	negative regulation of protein complex assembly	23962722
Tgene	EP300	GO:0034644	cellular response to UV	24939902
Tgene	EP300	GO:0042771	intrinsic apoptotic signaling pathway in response to DNA damage by p53 class mediator	17403783
Tgene	EP300	GO:0043627	response to estrogen	11581164
Tgene	EP300	GO:0043923	positive regulation by host of viral transcription	16687403
Tgene	EP300	GO:0043969	histone H2B acetylation	23415232
Tgene	EP300	GO:0045721	negative regulation of gluconeogenesis	30193097
Tgene	EP300	GO:0045815	positive regulation of gene expression, epigenetic	25818647
Tgene	EP300	GO:0045944	positive regulation of transcription by RNA polymerase II	12586840\|18722353\|23811396
Tgene	EP300	GO:0051091	positive regulation of DNA-binding transcription factor activity	10518217\|25818647
Tgene	EP300	GO:0060765	regulation of androgen receptor signaling pathway	18487222
Tgene	EP300	GO:0061921	peptidyl-lysine propionylation	17267393
Tgene	EP300	GO:0090043	regulation of tubulin deacetylation	18722353
Tgene	EP300	GO:0140066	peptidyl-lysine crotonylation	25818647
Tgene	EP300	GO:0140067	peptidyl-lysine butyrylation	17267393\|29775581
Tgene	EP300	GO:1901224	positive regulation of NIK/NF-kappaB signaling	23811396
Tgene	EP300	GO:1905636	positive regulation of RNA polymerase II regulatory region sequence-specific DNA binding	23811396

Fusion gene breakpoints across ARHGEF17 (5'-gene)
* Click on the image to open the UCSC genome browser with custom track showing this image in a new window.

Fusion gene breakpoints across EP300 (3'-gene)
* Click on the image to open the UCSC genome browser with custom track showing this image in a new window.

Fusion gene information
* All genome coordinats were lifted-over on hg19.
* Click on the break point to see the gene structure around the break point region using the UCSC Genome Browser.

Source	Disease	Sample	Hgene	Hchr	Hbp	Hstrand	Tgene	Tchr	Tbp	Tstrand
ChimerDB4	BRCA	TCGA-BH-A0AU-01A	ARHGEF17	chr11	73022875	-	EP300	chr22	41545042	+
ChimerDB4	BRCA	TCGA-BH-A0AU-01A	ARHGEF17	chr11	73022875	+	EP300	chr22	41545042	+
ChimerDB4	BRCA	TCGA-BH-A0AU	ARHGEF17	chr11	73022875	+	EP300	chr22	41545041	+

Top

Fusion Gene ORF analysis for ARHGEF17-EP300

Open reading frame (ORF) analsis of fusion genes based on Ensembl gene isoform structure.
* Click on the break point to see the gene structure around the break point region using the UCSC Genome Browser.

ORF	Henst	Tenst	Hgene	Hchr	Hbp	Hstrand	Tgene	Tchr	Tbp	Tstrand
In-frame	ENST00000263674	ENST00000263253	ARHGEF17	chr11	73022875	+	EP300	chr22	41545042	+
In-frame	ENST00000263674	ENST00000263253	ARHGEF17	chr11	73022875	+	EP300	chr22	41545041	+
intron-3CDS	ENST00000536170	ENST00000263253	ARHGEF17	chr11	73022875	+	EP300	chr22	41545042	+
intron-3CDS	ENST00000536170	ENST00000263253	ARHGEF17	chr11	73022875	+	EP300	chr22	41545041	+

ORFfinder result based on the fusion transcript sequence of in-frame fusion genes.

Henst

Tenst

Hgene

Hchr

Hbp

Hstrand

Tgene

Tchr

Tbp

Tstrand

Seq length
(transcript)

BP loci
(transcript)

Predicted start
(transcript)

Predicted stop
(transcript)

Seq length
(amino acids)

ENST00000263674

ARHGEF17

chr11

73022875

ENST00000263253

EP300

chr22

41545042

9667

3542

209

8545

2778

ENST00000263674

ARHGEF17

chr11

73022875

ENST00000263253

EP300

chr22

41545041

9667

3542

209

8545

2778

DeepORF prediction of the coding potential based on the fusion transcript sequence of in-frame fusion genes. DeepORF is a coding potential classifier based on convolutional neural network by comparing the real Ribo-seq data. If the no-coding score < 0.5 and coding score > 0.5, then the in-frame fusion transcript is predicted as being likely translated.

Henst	Tenst	Hgene	Hchr	Hbp	Hstrand	Tgene	Tchr	Tbp	Tstrand	No-coding score	Coding score
ENST00000263674	ENST00000263253	ARHGEF17	chr11	73022875	+	EP300	chr22	41545042	+	0.00276492	0.9972351
ENST00000263674	ENST00000263253	ARHGEF17	chr11	73022875	+	EP300	chr22	41545041	+	0.00276492	0.9972351

Top

Fusion Genomic Features for ARHGEF17-EP300

FusionAI prediction of the potential fusion gene breakpoint based on the pre-mature RNA sequence context (+/- 5kb of individual partner genes, total 20kb length sequence). FusionAI is a fusion gene breakpoint classifier based on convolutional neural network by comparing the fusion positive and negative sequence context of ~ 20K fusion gene data. From here, we can have the relative potentency of the 20K genomic sequence how individual sequnce will be likely used as the gene fusion breakpoints.

Hgene	Hchr	Hbp	Hstrand	Tgene	Tchr	Tbp	Tstrand	1-p	p (fusion gene breakpoint)
ARHGEF17	chr11	73022875	+	EP300	chr22	41545041	+	3.12E-05	0.99996877
ARHGEF17	chr11	73022875	+	EP300	chr22	41545041	+	3.12E-05	0.99996877
ARHGEF17	chr11	73022875	+	EP300	chr22	41545041	+	3.12E-05	0.99996877
ARHGEF17	chr11	73022875	+	EP300	chr22	41545041	+	3.12E-05	0.99996877

Distribution of 44 human genomic features loci across 20kb length fusion breakpoint regions. We integrated a total of 44 different types of human genomic feature loci information across five big categories including virus integration sites, repeats, structural variants, chromatin states, and gene expression regulation. More details are in help page.

Distribution of 44 human genomic features loci across 20kb length fusion breakpoint regions that are ovelapped with the top 1% feature importance score regions. More details are in help page.

Top

Fusion Protein Features for ARHGEF17-EP300

Four levels of functional features of fusion genes
Go to FGviewer search page for the most frequent breakpoint (https://ccsmweb.uth.edu/FGviewer/chr11:73022875/chr22:41545042)
- FGviewer provides the online visualization of the retention search of the protein functional features across DNA, RNA, protein, and pathological levels.
- How to search
1. Put your fusion gene symbol.
2. Press the tab key until there will be shown the breakpoint information filled.
4. Go down and press 'Search' tab twice.
4. Go down to have the hyperlink of the search result.
5. Click the hyperlink.
6. See the FGviewer result for your fusion gene.

Main function of each fusion partner protein. (from UniProt)

Hgene	Tgene
.	EP300 Q09472
FUNCTION: Transcriptional activator which is required for calcium-dependent dendritic growth and branching in cortical neurons. Recruits CREB-binding protein (CREBBP) to nuclear bodies. Component of the CREST-BRG1 complex, a multiprotein complex that regulates promoter activation by orchestrating a calcium-dependent release of a repressor complex and a recruitment of an activator complex. In resting neurons, transcription of the c-FOS promoter is inhibited by BRG1-dependent recruitment of a phospho-RB1-HDAC1 repressor complex. Upon calcium influx, RB1 is dephosphorylated by calcineurin, which leads to release of the repressor complex. At the same time, there is increased recruitment of CREBBP to the promoter by a CREST-dependent mechanism, which leads to transcriptional activation. The CREST-BRG1 complex also binds to the NR2B promoter, and activity-dependent induction of NR2B expression involves a release of HDAC1 and recruitment of CREBBP (By similarity). {ECO:0000250}.	FUNCTION: Functions as histone acetyltransferase and regulates transcription via chromatin remodeling (PubMed:23415232, PubMed:23934153, PubMed:8945521). Acetylates all four core histones in nucleosomes. Histone acetylation gives an epigenetic tag for transcriptional activation (PubMed:23415232, PubMed:23934153, PubMed:8945521). Mediates cAMP-gene regulation by binding specifically to phosphorylated CREB protein. Mediates acetylation of histone H3 at 'Lys-122' (H3K122ac), a modification that localizes at the surface of the histone octamer and stimulates transcription, possibly by promoting nucleosome instability. Mediates acetylation of histone H3 at 'Lys-27' (H3K27ac) (PubMed:23911289). Also functions as acetyltransferase for non-histone targets, such as ALX1, HDAC1, PRMT1 or SIRT2 (PubMed:12929931, PubMed:16762839, PubMed:18722353). Acetylates 'Lys-131' of ALX1 and acts as its coactivator (PubMed:12929931). Acetylates SIRT2 and is proposed to indirectly increase the transcriptional activity of p53/TP53 through acetylation and subsequent attenuation of SIRT2 deacetylase function (PubMed:18722353). Following DNA damage, forms a stress-responsive p53/TP53 coactivator complex with JMY which mediates p53/TP53 acetylation, thereby increasing p53/TP53-dependent transcription and apoptosis (PubMed:11511361, PubMed:15448695). Promotes chromatin acetylation in heat shock responsive HSP genes during the heat shock response (HSR), thereby stimulating HSR transcription (PubMed:18451878). Acetylates HDAC1 leading to its inactivation and modulation of transcription (PubMed:16762839). Acetylates 'Lys-247' of EGR2 (By similarity). Acts as a TFAP2A-mediated transcriptional coactivator in presence of CITED2 (PubMed:12586840). Plays a role as a coactivator of NEUROD1-dependent transcription of the secretin and p21 genes and controls terminal differentiation of cells in the intestinal epithelium. Promotes cardiac myocyte enlargement. Can also mediate transcriptional repression. Acetylates FOXO1 and enhances its transcriptional activity (PubMed:15890677). Acetylates BCL6 wich disrupts its ability to recruit histone deacetylases and hinders its transcriptional repressor activity (PubMed:12402037). Participates in CLOCK or NPAS2-regulated rhythmic gene transcription; exhibits a circadian association with CLOCK or NPAS2, correlating with increase in PER1/2 mRNA and histone H3 acetylation on the PER1/2 promoter (PubMed:14645221). Acetylates MTA1 at 'Lys-626' which is essential for its transcriptional coactivator activity (PubMed:16617102). Acetylates XBP1 isoform 2; acetylation increases protein stability of XBP1 isoform 2 and enhances its transcriptional activity (PubMed:20955178). Acetylates PCNA; acetylation promotes removal of chromatin-bound PCNA and its degradation during nucleotide excision repair (NER) (PubMed:24939902). Acetylates MEF2D (PubMed:21030595). Acetylates and stabilizes ZBTB7B protein by antagonizing ubiquitin conjugation and degradation, this mechanism may be involved in CD4/CD8 lineage differentiation (PubMed:20810990). Acetylates GABPB1, impairing GABPB1 heterotetramerization and activity (By similarity). Acetylates PCK1 and promotes PCK1 anaplerotic activity (PubMed:30193097). Acetylates RXRA and RXRG (PubMed:17761950). In addition to protein acetyltransferase, can use different acyl-CoA substrates, such as (2E)-butenoyl-CoA (crotonyl-CoA), butanoyl-CoA (butyryl-CoA), 2-hydroxyisobutanoyl-CoA (2-hydroxyisobutyryl-CoA), lactoyl-CoA or propanoyl-CoA (propionyl-CoA), and is able to mediate protein crotonylation, butyrylation, 2-hydroxyisobutyrylation, lactylation or propionylation, respectively (PubMed:17267393, PubMed:25818647, PubMed:29775581, PubMed:31645732). Acts as a histone crotonyltransferase; crotonylation marks active promoters and enhancers and confers resistance to transcriptional repressors (PubMed:25818647). Histone crotonyltransferase activity is dependent on the concentration of (2E)-butenoyl-CoA (crotonyl-CoA) substrate and such activity is weak when (2E)-butenoyl-CoA (crotonyl-CoA) concentration is low (PubMed:25818647). Also acts as a histone butyryltransferase; butyrylation marks active promoters (PubMed:17267393). Catalyzes histone lactylation in macrophages by using lactoyl-CoA directly derived from endogenous or exogenous lactate, leading to stimulates gene transcription (PubMed:31645732). Acts as a protein-lysine 2-hydroxyisobutyryltransferase; regulates glycolysis by mediating 2-hydroxyisobutyrylation of glycolytic enzymes (PubMed:29775581). Functions as a transcriptional coactivator for SMAD4 in the TGF-beta signaling pathway (PubMed:25514493). {ECO:0000250\|UniProtKB:B2RWS6, ECO:0000269\|PubMed:10733570, ECO:0000269\|PubMed:11430825, ECO:0000269\|PubMed:11511361, ECO:0000269\|PubMed:11701890, ECO:0000269\|PubMed:12402037, ECO:0000269\|PubMed:12586840, ECO:0000269\|PubMed:12929931, ECO:0000269\|PubMed:14645221, ECO:0000269\|PubMed:15186775, ECO:0000269\|PubMed:15448695, ECO:0000269\|PubMed:15890677, ECO:0000269\|PubMed:16617102, ECO:0000269\|PubMed:16762839, ECO:0000269\|PubMed:17267393, ECO:0000269\|PubMed:17761950, ECO:0000269\|PubMed:18451878, ECO:0000269\|PubMed:18722353, ECO:0000269\|PubMed:18995842, ECO:0000269\|PubMed:20810990, ECO:0000269\|PubMed:21030595, ECO:0000269\|PubMed:23415232, ECO:0000269\|PubMed:23911289, ECO:0000269\|PubMed:23934153, ECO:0000269\|PubMed:24939902, ECO:0000269\|PubMed:25514493, ECO:0000269\|PubMed:25818647, ECO:0000269\|PubMed:29775581, ECO:0000269\|PubMed:30193097, ECO:0000269\|PubMed:31645732, ECO:0000269\|PubMed:8945521, ECO:0000305\|PubMed:20955178}.; FUNCTION: (Microbial infection) In case of HIV-1 infection, it is recruited by the viral protein Tat. Regulates Tat's transactivating activity and may help inducing chromatin remodeling of proviral genes. Binds to and may be involved in the transforming capacity of the adenovirus E1A protein. {ECO:0000269\|PubMed:10545121, ECO:0000269\|PubMed:11080476}.

Retention analysis result of each fusion partner protein across 39 protein features of UniProt such as six molecule processing features, 13 region features, four site features, six amino acid modification features, two natural variation features, five experimental info features, and 3 secondary structure features. Here, because of limited space for viewing, we only show the protein feature retention information belong to the 13 regional features. All retention annotation result can be downloaded at
download page

* Minus value of BPloci means that the break pointn is located before the CDS.

- In-frame and retained protein feature among the 13 regional features.

Partner

Gene

Hbp

Tbp

ENST

Strand

BPexon

TotalExon

Protein feature loci

*BPloci

TotalLen

Protein feature

Protein feature note

Hgene

ARHGEF17

chr11:73022875

chr22:41545041

ENST00000263674

201_204

1064

2064.0

Compositional bias

Note=Poly-Gln

Hgene

ARHGEF17

chr11:73022875

chr22:41545041

ENST00000263674

230_235

1064

2064.0

Compositional bias

Note=Poly-Ser

Hgene

ARHGEF17

chr11:73022875

chr22:41545041

ENST00000263674

252_256

1064

2064.0

Compositional bias

Note=Poly-Glu

Hgene

ARHGEF17

chr11:73022875

chr22:41545041

ENST00000263674

566_569

1064

2064.0

Compositional bias

Note=Poly-Ser

Hgene

ARHGEF17

chr11:73022875

chr22:41545041

ENST00000263674

672_675

1064

2064.0

Compositional bias

Note=Poly-Ser

Hgene

ARHGEF17

chr11:73022875

chr22:41545041

ENST00000263674

707_710

1064

2064.0

Compositional bias

Note=Poly-Arg

Hgene

ARHGEF17

chr11:73022875

chr22:41545041

ENST00000263674

963_1054

1064

2064.0

Compositional bias

Note=Pro-rich

Hgene

ARHGEF17

chr11:73022875

chr22:41545042

ENST00000263674

201_204

1064

2064.0

Compositional bias

Note=Poly-Gln

Hgene

ARHGEF17

chr11:73022875

chr22:41545042

ENST00000263674

230_235

1064

2064.0

Compositional bias

Note=Poly-Ser

Hgene

ARHGEF17

chr11:73022875

chr22:41545042

ENST00000263674

252_256

1064

2064.0

Compositional bias

Note=Poly-Glu

Hgene

ARHGEF17

chr11:73022875

chr22:41545042

ENST00000263674

566_569

1064

2064.0

Compositional bias

Note=Poly-Ser

Hgene

ARHGEF17

chr11:73022875

chr22:41545042

ENST00000263674

672_675

1064

2064.0

Compositional bias

Note=Poly-Ser

Hgene

ARHGEF17

chr11:73022875

chr22:41545042

ENST00000263674

707_710

1064

2064.0

Compositional bias

Note=Poly-Arg

Hgene

ARHGEF17

chr11:73022875

chr22:41545042

ENST00000263674

963_1054

1064

2064.0

Compositional bias

Note=Pro-rich

Tgene

EP300

chr11:73022875

chr22:41545041

ENST00000263253

1519_1526

747

2415.0

Compositional bias

Note=Poly-Glu

Tgene

EP300

chr11:73022875

chr22:41545041

ENST00000263253

2066_2069

747

2415.0

Compositional bias

Note=Poly-Gln

Tgene

EP300

chr11:73022875

chr22:41545041

ENST00000263253

2190_2195

747

2415.0

Compositional bias

Note=Poly-Gln

Tgene

EP300

chr11:73022875

chr22:41545041

ENST00000263253

797_800

747

2415.0

Compositional bias

Note=Poly-Ser

Tgene

EP300

chr11:73022875

chr22:41545042

ENST00000263253

1519_1526

747

2415.0

Compositional bias

Note=Poly-Glu

Tgene

EP300

chr11:73022875

chr22:41545042

ENST00000263253

2066_2069

747

2415.0

Compositional bias

Note=Poly-Gln

Tgene

EP300

chr11:73022875

chr22:41545042

ENST00000263253

2190_2195

747

2415.0

Compositional bias

Note=Poly-Gln

Tgene

EP300

chr11:73022875

chr22:41545042

ENST00000263253

797_800

747

2415.0

Compositional bias

Note=Poly-Ser

Tgene

EP300

chr11:73022875

chr22:41545041

ENST00000263253

1067_1139

747

2415.0

Domain

Bromo

Tgene

EP300

chr11:73022875

chr22:41545041

ENST00000263253

1287_1663

747

2415.0

Domain

CBP/p300-type HAT

Tgene

EP300

chr11:73022875

chr22:41545042

ENST00000263253

1067_1139

747

2415.0

Domain

Bromo

Tgene

EP300

chr11:73022875

chr22:41545042

ENST00000263253

1287_1663

747

2415.0

Domain

CBP/p300-type HAT

Tgene

EP300

chr11:73022875

chr22:41545041

ENST00000263253

1017_1029

747

2415.0

Region

Note=CRD1%3B mediates transcriptional repression

Tgene

EP300

chr11:73022875

chr22:41545041

ENST00000263253

1398_1400

747

2415.0

Region

Acetyl-CoA binding

Tgene

EP300

chr11:73022875

chr22:41545041

ENST00000263253

1410_1411

747

2415.0

Region

Acetyl-CoA binding

Tgene

EP300

chr11:73022875

chr22:41545041

ENST00000263253

1572_1818

747

2415.0

Region

Note=Binding region for E1A adenovirus

Tgene

EP300

chr11:73022875

chr22:41545042

ENST00000263253

1017_1029

747

2415.0

Region

Note=CRD1%3B mediates transcriptional repression

Tgene

EP300

chr11:73022875

chr22:41545042

ENST00000263253

1398_1400

747

2415.0

Region

Acetyl-CoA binding

Tgene

EP300

chr11:73022875

chr22:41545042

ENST00000263253

1410_1411

747

2415.0

Region

Acetyl-CoA binding

Tgene

EP300

chr11:73022875

chr22:41545042

ENST00000263253

1572_1818

747

2415.0

Region

Note=Binding region for E1A adenovirus

Tgene

EP300

chr11:73022875

chr22:41545041

ENST00000263253

1664_1707

747

2415.0

Zinc finger

ZZ-type

Tgene

EP300

chr11:73022875

chr22:41545041

ENST00000263253

1728_1809

747

2415.0

Zinc finger

TAZ-type 2

Tgene

EP300

chr11:73022875

chr22:41545042

ENST00000263253

1664_1707

747

2415.0

Zinc finger

ZZ-type

Tgene

EP300

chr11:73022875

chr22:41545042

ENST00000263253

1728_1809

747

2415.0

Zinc finger

TAZ-type 2

- In-frame and not-retained protein feature among the 13 regional features.

Partner

Gene

Hbp

Tbp

ENST

Strand

BPexon

TotalExon

Protein feature loci

*BPloci

TotalLen

Protein feature

Protein feature note

Hgene

ARHGEF17

chr11:73022875

chr22:41545041

ENST00000263674

1990_1996

1064

2064.0

Compositional bias

Note=Poly-Pro

Hgene

ARHGEF17

chr11:73022875

chr22:41545042

ENST00000263674

1990_1996

1064

2064.0

Compositional bias

Note=Poly-Pro

Hgene

ARHGEF17

chr11:73022875

chr22:41545041

ENST00000263674

1066_1254

1064

2064.0

Domain

Hgene

ARHGEF17

chr11:73022875

chr22:41545042

ENST00000263674

1066_1254

1064

2064.0

Domain

Tgene

EP300

chr11:73022875

chr22:41545041

ENST00000263253

566_645

747

2415.0

Domain

KIX

Tgene

EP300

chr11:73022875

chr22:41545042

ENST00000263253

566_645

747

2415.0

Domain

KIX

Tgene

EP300

chr11:73022875

chr22:41545041

ENST00000263253

11_17

747

2415.0

Motif

Nuclear localization signal

Tgene

EP300

chr11:73022875

chr22:41545042

ENST00000263253

11_17

747

2415.0

Motif

Nuclear localization signal

Tgene

EP300

chr11:73022875

chr22:41545041

ENST00000263253

331_417

747

2415.0

Zinc finger

TAZ-type 1

Tgene

EP300

chr11:73022875

chr22:41545042

ENST00000263253

331_417

747

2415.0

Zinc finger

TAZ-type 1

Top

Fusion Gene Sequence for ARHGEF17-EP300

For in-frame fusion transcripts, we provide the fusion transcript sequences and fusion amino acid sequences. To have fusion amino acid sequence, we ran ORFfinder and chose the longest ORF among the all predicted ones.

>6228_6228_1_ARHGEF17-EP300_ARHGEF17_chr11_73022875_ENST00000263674_EP300_chr22_41545041_ENST00000263253_length(transcript)=9667nt_BP=3542nt
GAGCGAGCAGCCAAGGGCGTTGGGCAGGCGGACGCAGAGTCGAGGAACCAAGCGCTGGGATCCCGCCCAGGCGGTGCCGCGGTGCCCCTG
GTCGCTCCAGCCGCGGCGGGGGCTGGGCCTGGGGGTCGGCGCTGAGGCGGGAGGGGCCGCCCGGGATGGAGACGTTGCGGCCGGTGGCCA
CAGAAACTTGAGCCGCGGCAGAGAAACCTCTGCTCCGGTCTCTGCGTCCTCTTCCCACACTCCCGTGCGCTGCTTTCGGCGTGGGCCGCT
GCGCTCCTAGGGAGTGGGGGCGCAGGGGGGGTTGGCCGCGGCTGCCCGAGGCCAGCCCCCCCGGAGTGAGTTACGCCACTATGGCGGACG
GGGCACCCCGGCCCCAGCTTTACCGCAGCGTCTCGTTCAAGCTGCTGGAGCGCTGGAGCGGCGGCCCCGGGCTGAGGGAGGAGGACACGG
ACACCCCCGGCTTGAGGCGACGCGCCTCGTGCCGGCCGACCACGGCTGCCCGGGGCCAGCCCTCTCGGCGCGTGTCCAAGCTGGCGTCTG
GGCCCCTGGCCGCCCCCGCGCAGCCGCGCCCGCTCCGCAGCCTCTCGCCGTCGGTTCGCCAGCTCTCCCGGCGCTTCGACGCGCCGCGTC
TGGACGACGGCTCCGCTGGGACCCGAGACGGAGGCGTCTTACCCGCGGCCGCGGAAGAAGCGGCCGAGGGCCCAGCGCGAGGAGCCTGGC
CCAGCGTCACCGAGATGCGCAAGCTCTTCGGCGGTCCTGGCTCCAGGAGGCCCAGCGCCGACTCTGAATCCCCAGGAACGCCCAGCCCCG
ACGGTGCCGCGTGGGAGCCTCCGGCTCGGGAGTCGCGGCAGCCACCGACGCCACCCCCTCGGACATGCTTCCCCCTGGCGGGTCTGCGTT
CGGCGCGGCCCCTGACCGGGCCGGAGACCGAAGGGAGGCTGCGCCGGCCGCAGCAGCAACAGGAGCGGGCGCAGCGTCCAGCGGATGGTT
TACATTCTTGGCATATCTTCTCCCAACCGCAGGCCGGGGCCCGGGCCTCCTGCTCCTCCTCCTCCATCGCCGCCTCCTATCCTGTCAGCC
GCAGTCGTGCTGCCAGCTCCAGCGAGGAGGAAGAGGAGGGCCCGCCGCAGCTGCCTGGAGCCCAGAGTCCGGCCTACCACGGCGGCCACT
CCTCGGGCAGTGACGACGACCGAGACGGTGAGGGCGGCCACCGCTGGGGAGGGAGGCCCGGGCTCAGGCCTGGAAGCTCCCTATTGGATC
AGGACTGCAGGCCTGACAGTGATGGGTTAAATCTAAGCAGCATGAACTCAGCAGGGGTTTCTGGGAGCCCTGAGCCCCCAACATCTCCAA
GAGCCCCTAGAGAAGAAGGACTCCGGGAGTGGGGTAGTGGCTCTCCGCCCTGCGTCCCAGGTCCCCAGGAGGGACTTCGGCCTATGTCTG
ACTCTGTGGGAGGAGCTTTCCGTGTGGCCAAGGTGAGCTTTCCCTCGTACCTGGCCAGCCCCGCAGGCTCCCGCGGTAGCAGCCGTTATT
CCAGCACGGAGACCCTCAAGGACGACGACCTATGGTCTAGTAGGGGTTCTGGGGGCTGGGGCGTGTACCGCTCCCCTAGCTTTGGAGCTG
GGGAAGGGCTCCTGCGGTCCCAGGCTCGAACCCGTGCCAAAGGACCTGGAGGCACCTCTAGGGCATTGAGGGATGGAGGATTTGAGCCTG
AAAAGAGTCGACAGCGGAAGTCCCTGTCAAATCCAGATATCGCCTCAGAGACCCTGACGCTTCTCAGTTTCCTGCGCTCAGACCTTTCAG
AGCTGAGGGTCCGAAAACCTGGTGGGAGCTCCGGGGACCGTGGAAGCAACCCCCTAGATGGCAGAGACTCACCATCCGCAGGTGGCCCTG
TGGGGCAACTTGAACCCATACCCATCCCAGCCCCAGCATCACCTGGCACGCGCCCCACACTCAAGGACTTGACAGCCACTCTGCGGAGAG
CAAAGTCATTCACCTGCTCTGAGAAGCCCATGGCCCGCCGCCTGCCCCGCACCAGTGCTCTGAAGTCCAGCTCCTCCGAGCTCCTGCTCA
CAGGCCCTGGTGCCGAGGAGGATCCGCTGCCCCTCATCGTCCAGGACCAATATGTGCAGGAGGCCCGCCAGGTTTTTGAGAAGATCCAGC
GCATGGGTGCCCAACAAGATGATGGAAGCGATGCCCCCCCTGGAAGCCCTGACTGGGCAGGGGATGTGACCCGAGGGCAGCGGTCCCAGG
AGGAGCTCTCAGGCCCTGAGTCCAGTCTGACAGATGAAGGCATTGGGGCAGACCCTGAGCCTCCTGTTGCAGCATTTTGCGGCCTGGGTA
CCACAGGGATGTGGCGACCTCTTTCCTCATCCTCGGCCCAGACGAACCACCATGGCCCTGGGACTGAGGACAGTCTGGGCGGGTGGGCCC
TGGTGTCGCCTGAGACCCCTCCCACACCAGGTGCCCTCCGCCGACGACGCAAAGTCCCACCTTCAGGTTCTGGTGGGAGCGAATTGAGCA
ATGGGGAGGCAGGGGAGGCCTACAGGTCCCTGAGTGACCCAATTCCTCAGCGCCACCGGGCTGCCACCTCTGAAGAGCCTACTGGGTTCT
CTGTGGACAGCAACCTCCTGGGCTCACTGAGCCCCAAGACAGGGCTCCCTGCCACCTCAGCCATGGATGAGGGCTTGACCAGTGGTCACA
GTGACTGGTCTGTGGGCAGTGAAGAGAGCAAGGGATATCAGGAGGTTATTCAGAGCATAGTTCAGGGGCCTGGCACCCTGGGGCGTGTGG
TGGACGACAGGATTGCTGGCAAAGCCCCCAAGAAGAAATCCCTGAGTGACCCCAGCCGCCGTGGGGAGCTGGCTGGGCCTGGATTCGAGG
GCCCTGGAGGGGAGCCCATCCGAGAAGTTGAGCCCATGCTGCCTCCATCCAGCAGCGAGCCCATCCTTGTAGAGCAGCGGGCAGAGCCAG
AAGAACCTGGTGCCACCAGGAGCCGGGCACAGTCTGAAAGGGCCCTACCTGAGGCTCTGCCTCCCCCTGCCACTGCCCACCGAAACTTTC
ACCTTGACCCCAAGCTGGCTGACATTCTGTCCCCGAGGCTAATCCGCCGAGGCTCCAAGAAGCGCCCAGCTCGGAGTAGTCACCAGGAGC
TTCGGAGAGACGAGGGCAGTCAGGACCAGACTGGCAGCCTGTCTCGGGCCCGGCCCTCCTCCAGACACGTTCGCCATGCCAGTGTGCCCG
CCACATTTATGCCTATTGTGGTGCCTGAGCCACCAACTTCTGTTGGTCCCCCTGTGGCTGTGCCAGAACCCATAGGCTTCCCTACCCGAG
CCCATCCCACGTTGCAGGCACCATCGCTCGAGGACGTCACCAAGCAGTACATGCTGAACCTGCACTCCGGTGAGGTCCCTGCCCCAGTGC
CAGTGGACATGCCCTGCTTGCCTCTGGCTGCACCGCCCTCTGCTGAGGCCAAGCCCCCTGAGGCAGCTCGGCCTGCAGATGAGCCTACCC
CTGCCAGCAAGTGCTGCAGCAAGCCACAGGTGCCTATGGGCTATGGGCCTCGTATGCAACAGCCTTCCAACCAGGGCCAGTTCCTTCCTC
AGACTCAGTTCCCATCACAGGGAATGAATGTAACAAATATCCCTTTGGCTCCGTCCAGCGGTCAAGCTCCAGTGTCTCAAGCACAAATGT
CTAGTTCTTCCTGCCCGGTGAACTCTCCTATAATGCCTCCAGGGTCTCAGGGGAGCCACATTCACTGTCCCCAGCTTCCTCAACCAGCTC
TTCATCAGAATTCACCCTCGCCTGTACCTAGTCGTACCCCCACCCCTCACCATACTCCCCCAAGCATAGGGGCTCAGCAGCCACCAGCAA
CAACAATTCCAGCCCCTGTTCCTACACCTCCTGCCATGCCACCTGGGCCACAGTCCCAGGCTCTACATCCCCCTCCAAGGCAGACACCTA
CACCACCAACAACACAACTTCCCCAACAAGTGCAGCCTTCACTTCCTGCTGCACCTTCTGCTGACCAGCCCCAGCAGCAGCCTCGCTCAC
AGCAGAGCACAGCAGCGTCTGTTCCTACCCCAACAGCACCGCTGCTTCCTCCGCAGCCTGCAACTCCACTTTCCCAGCCAGCTGTAAGCA
TTGAAGGACAGGTATCAAATCCTCCATCTACTAGTAGCACAGAAGTGAATTCTCAGGCCATTGCTGAGAAGCAGCCTTCCCAGGAAGTGA
AGATGGAGGCCAAAATGGAAGTGGATCAACCAGAACCAGCAGATACTCAGCCGGAGGATATTTCAGAGTCTAAAGTGGAAGACTGTAAAA
TGGAATCTACCGAAACAGAAGAGAGAAGCACTGAGTTAAAAACTGAAATAAAAGAGGAGGAAGACCAGCCAAGTACTTCAGCTACCCAGT
CATCTCCGGCTCCAGGACAGTCAAAGAAAAAGATTTTCAAACCAGAAGAACTACGACAGGCACTGATGCCAACTTTGGAGGCACTTTACC
GTCAGGATCCAGAATCCCTTCCCTTTCGTCAACCTGTGGACCCTCAGCTTTTAGGAATCCCTGATTACTTTGATATTGTGAAGAGCCCCA
TGGATCTTTCTACCATTAAGAGGAAGTTAGACACTGGACAGTATCAGGAGCCCTGGCAGTATGTCGATGATATTTGGCTTATGTTCAATA
ATGCCTGGTTATATAACCGGAAAACATCACGGGTATACAAATACTGCTCCAAGCTCTCTGAGGTCTTTGAACAAGAAATTGACCCAGTGA
TGCAAAGCCTTGGATACTGTTGTGGCAGAAAGTTGGAGTTCTCTCCACAGACACTGTGTTGCTACGGCAAACAGTTGTGCACAATACCTC
GTGATGCCACTTATTACAGTTACCAGAACAGGTATCATTTCTGTGAGAAGTGTTTCAATGAGATCCAAGGGGAGAGCGTTTCTTTGGGGG
ATGACCCTTCCCAGCCTCAAACTACAATAAATAAAGAACAATTTTCCAAGAGAAAAAATGACACACTGGATCCTGAACTGTTTGTTGAAT
GTACAGAGTGCGGAAGAAAGATGCATCAGATCTGTGTCCTTCACCATGAGATCATCTGGCCTGCTGGATTCGTCTGTGATGGCTGTTTAA
AGAAAAGTGCACGAACTAGGAAAGAAAATAAGTTTTCTGCTAAAAGGTTGCCATCTACCAGACTTGGCACCTTTCTAGAGAATCGTGTGA
ATGACTTTCTGAGGCGACAGAATCACCCTGAGTCAGGAGAGGTCACTGTTAGAGTAGTTCATGCTTCTGACAAAACCGTGGAAGTAAAAC
CAGGCATGAAAGCAAGGTTTGTGGACAGTGGAGAGATGGCAGAATCCTTTCCATACCGAACCAAAGCCCTCTTTGCCTTTGAAGAAATTG
ATGGTGTTGACCTGTGCTTCTTTGGCATGCATGTTCAAGAGTATGGCTCTGACTGCCCTCCACCCAACCAGAGGAGAGTATACATATCTT
ACCTCGATAGTGTTCATTTCTTCCGTCCTAAATGCTTGAGGACTGCAGTCTATCATGAAATCCTAATTGGATATTTAGAATATGTCAAGA
AATTAGGTTACACAACAGGGCATATTTGGGCATGTCCACCAAGTGAGGGAGATGATTATATCTTCCATTGCCATCCTCCTGACCAGAAGA
TACCCAAGCCCAAGCGACTGCAGGAATGGTACAAAAAAATGCTTGACAAGGCTGTATCAGAGCGTATTGTCCATGACTACAAGGATATTT
TTAAACAAGCTACTGAAGATAGATTAACAAGTGCAAAGGAATTGCCTTATTTCGAGGGTGATTTCTGGCCCAATGTTCTGGAAGAAAGCA
TTAAGGAACTGGAACAGGAGGAAGAAGAGAGAAAACGAGAGGAAAACACCAGCAATGAAAGCACAGATGTGACCAAGGGAGACAGCAAAA
ATGCTAAAAAGAAGAATAATAAGAAAACCAGCAAAAATAAGAGCAGCCTGAGTAGGGGCAACAAGAAGAAACCCGGGATGCCCAATGTAT
CTAACGACCTCTCACAGAAACTATATGCCACCATGGAGAAGCATAAAGAGGTCTTCTTTGTGATCCGCCTCATTGCTGGCCCTGCTGCCA
ACTCCCTGCCTCCCATTGTTGATCCTGATCCTCTCATCCCCTGCGATCTGATGGATGGTCGGGATGCGTTTCTCACGCTGGCAAGGGACA
AGCACCTGGAGTTCTCTTCACTCCGAAGAGCCCAGTGGTCCACCATGTGCATGCTGGTGGAGCTGCACACGCAGAGCCAGGACCGCTTTG
TCTACACCTGCAATGAATGCAAGCACCATGTGGAGACACGCTGGCACTGTACTGTCTGTGAGGATTATGACTTGTGTATCACCTGCTATA
ACACTAAAAACCATGACCACAAAATGGAGAAACTAGGCCTTGGCTTAGATGATGAGAGCAACAACCAGCAGGCTGCAGCCACCCAGAGCC
CAGGCGATTCTCGCCGCCTGAGTATCCAGCGCTGCATCCAGTCTCTGGTCCATGCTTGCCAGTGTCGGAATGCCAATTGCTCACTGCCAT
CCTGCCAGAAGATGAAGCGGGTTGTGCAGCATACCAAGGGTTGCAAACGGAAAACCAATGGCGGGTGCCCCATCTGCAAGCAGCTCATTG
CCCTCTGCTGCTACCATGCCAAGCACTGCCAGGAGAACAAATGCCCGGTGCCGTTCTGCCTAAACATCAAGCAGAAGCTCCGGCAGCAAC
AGCTGCAGCACCGACTACAGCAGGCCCAAATGCTTCGCAGGAGGATGGCCAGCATGCAGCGGACTGGTGTGGTTGGGCAGCAACAGGGCC
TCCCTTCCCCCACTCCTGCCACTCCAACGACACCAACTGGCCAACAGCCAACCACCCCGCAGACGCCCCAGCCCACTTCTCAGCCTCAGC
CTACCCCTCCCAATAGCATGCCACCCTACTTGCCCAGGACTCAAGCTGCTGGCCCTGTGTCCCAGGGTAAGGCAGCAGGCCAGGTGACCC
CTCCAACCCCTCCTCAGACTGCTCAGCCACCCCTTCCAGGGCCCCCACCTGCAGCAGTGGAAATGGCAATGCAGATTCAGAGAGCAGCGG
AGACGCAGCGCCAGATGGCCCACGTGCAAATTTTTCAAAGGCCAATCCAACACCAGATGCCCCCGATGACTCCCATGGCCCCCATGGGTA
TGAACCCACCTCCCATGACCAGAGGTCCCAGTGGGCATTTGGAGCCAGGGATGGGACCGACAGGGATGCAGCAACAGCCACCCTGGAGCC
AAGGAGGATTGCCTCAGCCCCAGCAACTACAGTCTGGGATGCCAAGGCCAGCCATGATGTCAGTGGCCCAGCATGGTCAACCTTTGAACA
TGGCTCCACAACCAGGATTGGGCCAGGTAGGTATCAGCCCACTCAAACCAGGCACTGTGTCTCAACAAGCCTTACAAAACCTTTTGCGGA
CTCTCAGGTCTCCCAGCTCTCCCCTGCAGCAGCAACAGGTGCTTAGTATCCTTCACGCCAACCCCCAGCTGTTGGCTGCATTCATCAAGC
AGCGGGCTGCCAAGTATGCCAACTCTAATCCACAACCCATCCCTGGGCAGCCTGGCATGCCCCAGGGGCAGCCAGGGCTACAGCCACCTA
CCATGCCAGGTCAGCAGGGGGTCCACTCCAATCCAGCCATGCAGAACATGAATCCAATGCAGGCGGGCGTTCAGAGGGCTGGCCTGCCCC
AGCAGCAACCACAGCAGCAACTCCAGCCACCCATGGGAGGGATGAGCCCCCAGGCTCAGCAGATGAACATGAACCACAACACCATGCCTT
CACAATTCCGAGACATCTTGAGACGACAGCAAATGATGCAACAGCAGCAGCAACAGGGAGCAGGGCCAGGAATAGGCCCTGGAATGGCCA
ACCATAACCAGTTCCAGCAACCCCAAGGAGTTGGCTACCCACCACAGCAGCAGCAGCGGATGCAGCATCACATGCAACAGATGCAACAAG
GAAATATGGGACAGATAGGCCAGCTTCCCCAGGCCTTGGGAGCAGAGGCAGGTGCCAGTCTACAGGCCTATCAGCAGCGACTCCTTCAGC
AACAGATGGGGTCCCCTGTTCAGCCCAACCCCATGAGCCCCCAGCAGCATATGCTCCCAAATCAGGCCCAGTCCCCACACCTACAAGGCC
AGCAGATCCCTAATTCTCTCTCCAATCAAGTGCGCTCTCCCCAGCCTGTCCCTTCTCCACGGCCACAGTCCCAGCCCCCCCACTCCAGTC
CTTCCCCAAGGATGCAGCCTCAGCCTTCTCCACACCACGTTTCCCCACAGACAAGTTCCCCACATCCTGGACTGGTAGCTGCCCAGGCCA
ACCCCATGGAACAAGGGCATTTTGCCAGCCCGGACCAGAATTCAATGCTTTCTCAGCTTGCTAGCAATCCAGGCATGGCAAACCTCCATG
GTGCAAGCGCCACGGACCTGGGACTCAGCACCGATAACTCAGACTTGAATTCAAACCTCTCACAGAGTACACTAGACATACACTAGAGAC
ACCTTGTAGTATTTTGGGAGCAAAAAAATTATTTTCTCTTAACAAGACTTTTTGTACTGAAAACAATTTTTTTGAATCTTTCGTAGCCTA
AAAGACAATTTTCCTTGGAACACATAAGAACTGTGCAGTAGCCGTTTGTGGTTTAAAGCAAACATGCAAGATGAACCTGAGGGATGATAG
AATACAAAGAATATATTTTTGTTATGGCTGGTTACCACCAGCCTTTCTTCCCCTTTGTGTGTGTGGTTCAAGTGTGCACTGGGAGGAGGC
TGAGGCCTGTGAAGCCAAACAATATGCTCCTGCCTTGCACCTCCAATAGGTTTTATTATTTTTTTTAAATTAATGAACATATGTAATATT
AATAGTTATTATTTACTGGTGCAGATGGTTGACATTTTTCCCTATTTTCCTCACTTTATGGAAGAGTTAAAACATTTCTAAACCAGAGGA
CAAAAGGGGTTAATGTTACTTTAAAATTACATTCTATATATATATAAATATATATAAATATATATTAAAATACCAGTTTTTTTTCTCTGG
GTGCAAAGATGTTCATTCTTTTAAAAAATGTTTAAAAAAAAAAAAAAACTGCCTTTCTTCCCCTCAAGTCAACTTTTGTGCTCCAGAAAA
TTTTCTATTCTGTAAGTCTGAGCGTAAAACTTCAAGTATTAAAATAATTTGTACATGTAGAGAGAAAAATGACTTTTTCAAAAATATACA
GGGGCAGCTGCCAAATTGATGTATTATATATTGTGGTTTCTGTTTCTTGAAAGAATTTTTTTCGTTATTTTTACATCTAACAAAGTAAAA
AAATTAAAAAGAGGGTAAGAAACGATTCCGGTGGGATGATTTTAACATGCAAAATGTCCCTGGGGGTTTCTTCTTTGCTTGCTTTCTTCC
TCCTTACCCTACCCCCCACTCACACACACACACACACACACACACACACACACACACACACACTTTCTATAAAACTTGAAAATAGCAAAA
ACCCTCAACTGTTGTAAATCATGCAATTAAAGTTGATTACTTATAAATATGAACTTTGGATCACTGTATAGACTGTTAAATTTGATTTCT
TATTACCTATTGTTAAATAAACTGTGTGAGACAGACA

>6228_6228_1_ARHGEF17-EP300_ARHGEF17_chr11_73022875_ENST00000263674_EP300_chr22_41545041_ENST00000263253_length(amino acids)=2778AA_BP=1111
MLRSLRPLPTLPCAAFGVGRCAPREWGRRGGWPRLPEASPPGVSYATMADGAPRPQLYRSVSFKLLERWSGGPGLREEDTDTPGLRRRAS
CRPTTAARGQPSRRVSKLASGPLAAPAQPRPLRSLSPSVRQLSRRFDAPRLDDGSAGTRDGGVLPAAAEEAAEGPARGAWPSVTEMRKLF
GGPGSRRPSADSESPGTPSPDGAAWEPPARESRQPPTPPPRTCFPLAGLRSARPLTGPETEGRLRRPQQQQERAQRPADGLHSWHIFSQP
QAGARASCSSSSIAASYPVSRSRAASSSEEEEEGPPQLPGAQSPAYHGGHSSGSDDDRDGEGGHRWGGRPGLRPGSSLLDQDCRPDSDGL
NLSSMNSAGVSGSPEPPTSPRAPREEGLREWGSGSPPCVPGPQEGLRPMSDSVGGAFRVAKVSFPSYLASPAGSRGSSRYSSTETLKDDD
LWSSRGSGGWGVYRSPSFGAGEGLLRSQARTRAKGPGGTSRALRDGGFEPEKSRQRKSLSNPDIASETLTLLSFLRSDLSELRVRKPGGS
SGDRGSNPLDGRDSPSAGGPVGQLEPIPIPAPASPGTRPTLKDLTATLRRAKSFTCSEKPMARRLPRTSALKSSSSELLLTGPGAEEDPL
PLIVQDQYVQEARQVFEKIQRMGAQQDDGSDAPPGSPDWAGDVTRGQRSQEELSGPESSLTDEGIGADPEPPVAAFCGLGTTGMWRPLSS
SSAQTNHHGPGTEDSLGGWALVSPETPPTPGALRRRRKVPPSGSGGSELSNGEAGEAYRSLSDPIPQRHRAATSEEPTGFSVDSNLLGSL
SPKTGLPATSAMDEGLTSGHSDWSVGSEESKGYQEVIQSIVQGPGTLGRVVDDRIAGKAPKKKSLSDPSRRGELAGPGFEGPGGEPIREV
EPMLPPSSSEPILVEQRAEPEEPGATRSRAQSERALPEALPPPATAHRNFHLDPKLADILSPRLIRRGSKKRPARSSHQELRRDEGSQDQ
TGSLSRARPSSRHVRHASVPATFMPIVVPEPPTSVGPPVAVPEPIGFPTRAHPTLQAPSLEDVTKQYMLNLHSGEVPAPVPVDMPCLPLA
APPSAEAKPPEAARPADEPTPASKCCSKPQVPMGYGPRMQQPSNQGQFLPQTQFPSQGMNVTNIPLAPSSGQAPVSQAQMSSSSCPVNSP
IMPPGSQGSHIHCPQLPQPALHQNSPSPVPSRTPTPHHTPPSIGAQQPPATTIPAPVPTPPAMPPGPQSQALHPPPRQTPTPPTTQLPQQ
VQPSLPAAPSADQPQQQPRSQQSTAASVPTPTAPLLPPQPATPLSQPAVSIEGQVSNPPSTSSTEVNSQAIAEKQPSQEVKMEAKMEVDQ
PEPADTQPEDISESKVEDCKMESTETEERSTELKTEIKEEEDQPSTSATQSSPAPGQSKKKIFKPEELRQALMPTLEALYRQDPESLPFR
QPVDPQLLGIPDYFDIVKSPMDLSTIKRKLDTGQYQEPWQYVDDIWLMFNNAWLYNRKTSRVYKYCSKLSEVFEQEIDPVMQSLGYCCGR
KLEFSPQTLCCYGKQLCTIPRDATYYSYQNRYHFCEKCFNEIQGESVSLGDDPSQPQTTINKEQFSKRKNDTLDPELFVECTECGRKMHQ
ICVLHHEIIWPAGFVCDGCLKKSARTRKENKFSAKRLPSTRLGTFLENRVNDFLRRQNHPESGEVTVRVVHASDKTVEVKPGMKARFVDS
GEMAESFPYRTKALFAFEEIDGVDLCFFGMHVQEYGSDCPPPNQRRVYISYLDSVHFFRPKCLRTAVYHEILIGYLEYVKKLGYTTGHIW
ACPPSEGDDYIFHCHPPDQKIPKPKRLQEWYKKMLDKAVSERIVHDYKDIFKQATEDRLTSAKELPYFEGDFWPNVLEESIKELEQEEEE
RKREENTSNESTDVTKGDSKNAKKKNNKKTSKNKSSLSRGNKKKPGMPNVSNDLSQKLYATMEKHKEVFFVIRLIAGPAANSLPPIVDPD
PLIPCDLMDGRDAFLTLARDKHLEFSSLRRAQWSTMCMLVELHTQSQDRFVYTCNECKHHVETRWHCTVCEDYDLCITCYNTKNHDHKME
KLGLGLDDESNNQQAAATQSPGDSRRLSIQRCIQSLVHACQCRNANCSLPSCQKMKRVVQHTKGCKRKTNGGCPICKQLIALCCYHAKHC
QENKCPVPFCLNIKQKLRQQQLQHRLQQAQMLRRRMASMQRTGVVGQQQGLPSPTPATPTTPTGQQPTTPQTPQPTSQPQPTPPNSMPPY
LPRTQAAGPVSQGKAAGQVTPPTPPQTAQPPLPGPPPAAVEMAMQIQRAAETQRQMAHVQIFQRPIQHQMPPMTPMAPMGMNPPPMTRGP
SGHLEPGMGPTGMQQQPPWSQGGLPQPQQLQSGMPRPAMMSVAQHGQPLNMAPQPGLGQVGISPLKPGTVSQQALQNLLRTLRSPSSPLQ
QQQVLSILHANPQLLAAFIKQRAAKYANSNPQPIPGQPGMPQGQPGLQPPTMPGQQGVHSNPAMQNMNPMQAGVQRAGLPQQQPQQQLQP
PMGGMSPQAQQMNMNHNTMPSQFRDILRRQQMMQQQQQQGAGPGIGPGMANHNQFQQPQGVGYPPQQQQRMQHHMQQMQQGNMGQIGQLP
QALGAEAGASLQAYQQRLLQQQMGSPVQPNPMSPQQHMLPNQAQSPHLQGQQIPNSLSNQVRSPQPVPSPRPQSQPPHSSPSPRMQPQPS
PHHVSPQTSSPHPGLVAAQANPMEQGHFASPDQNSMLSQLASNPGMANLHGASATDLGLSTDNSDLNSNLSQSTLDIH

--------------------------------------------------------------
>6228_6228_2_ARHGEF17-EP300_ARHGEF17_chr11_73022875_ENST00000263674_EP300_chr22_41545042_ENST00000263253_length(transcript)=9667nt_BP=3542nt
GAGCGAGCAGCCAAGGGCGTTGGGCAGGCGGACGCAGAGTCGAGGAACCAAGCGCTGGGATCCCGCCCAGGCGGTGCCGCGGTGCCCCTG
GTCGCTCCAGCCGCGGCGGGGGCTGGGCCTGGGGGTCGGCGCTGAGGCGGGAGGGGCCGCCCGGGATGGAGACGTTGCGGCCGGTGGCCA
CAGAAACTTGAGCCGCGGCAGAGAAACCTCTGCTCCGGTCTCTGCGTCCTCTTCCCACACTCCCGTGCGCTGCTTTCGGCGTGGGCCGCT
GCGCTCCTAGGGAGTGGGGGCGCAGGGGGGGTTGGCCGCGGCTGCCCGAGGCCAGCCCCCCCGGAGTGAGTTACGCCACTATGGCGGACG
GGGCACCCCGGCCCCAGCTTTACCGCAGCGTCTCGTTCAAGCTGCTGGAGCGCTGGAGCGGCGGCCCCGGGCTGAGGGAGGAGGACACGG
ACACCCCCGGCTTGAGGCGACGCGCCTCGTGCCGGCCGACCACGGCTGCCCGGGGCCAGCCCTCTCGGCGCGTGTCCAAGCTGGCGTCTG
GGCCCCTGGCCGCCCCCGCGCAGCCGCGCCCGCTCCGCAGCCTCTCGCCGTCGGTTCGCCAGCTCTCCCGGCGCTTCGACGCGCCGCGTC
TGGACGACGGCTCCGCTGGGACCCGAGACGGAGGCGTCTTACCCGCGGCCGCGGAAGAAGCGGCCGAGGGCCCAGCGCGAGGAGCCTGGC
CCAGCGTCACCGAGATGCGCAAGCTCTTCGGCGGTCCTGGCTCCAGGAGGCCCAGCGCCGACTCTGAATCCCCAGGAACGCCCAGCCCCG
ACGGTGCCGCGTGGGAGCCTCCGGCTCGGGAGTCGCGGCAGCCACCGACGCCACCCCCTCGGACATGCTTCCCCCTGGCGGGTCTGCGTT
CGGCGCGGCCCCTGACCGGGCCGGAGACCGAAGGGAGGCTGCGCCGGCCGCAGCAGCAACAGGAGCGGGCGCAGCGTCCAGCGGATGGTT
TACATTCTTGGCATATCTTCTCCCAACCGCAGGCCGGGGCCCGGGCCTCCTGCTCCTCCTCCTCCATCGCCGCCTCCTATCCTGTCAGCC
GCAGTCGTGCTGCCAGCTCCAGCGAGGAGGAAGAGGAGGGCCCGCCGCAGCTGCCTGGAGCCCAGAGTCCGGCCTACCACGGCGGCCACT
CCTCGGGCAGTGACGACGACCGAGACGGTGAGGGCGGCCACCGCTGGGGAGGGAGGCCCGGGCTCAGGCCTGGAAGCTCCCTATTGGATC
AGGACTGCAGGCCTGACAGTGATGGGTTAAATCTAAGCAGCATGAACTCAGCAGGGGTTTCTGGGAGCCCTGAGCCCCCAACATCTCCAA
GAGCCCCTAGAGAAGAAGGACTCCGGGAGTGGGGTAGTGGCTCTCCGCCCTGCGTCCCAGGTCCCCAGGAGGGACTTCGGCCTATGTCTG
ACTCTGTGGGAGGAGCTTTCCGTGTGGCCAAGGTGAGCTTTCCCTCGTACCTGGCCAGCCCCGCAGGCTCCCGCGGTAGCAGCCGTTATT
CCAGCACGGAGACCCTCAAGGACGACGACCTATGGTCTAGTAGGGGTTCTGGGGGCTGGGGCGTGTACCGCTCCCCTAGCTTTGGAGCTG
GGGAAGGGCTCCTGCGGTCCCAGGCTCGAACCCGTGCCAAAGGACCTGGAGGCACCTCTAGGGCATTGAGGGATGGAGGATTTGAGCCTG
AAAAGAGTCGACAGCGGAAGTCCCTGTCAAATCCAGATATCGCCTCAGAGACCCTGACGCTTCTCAGTTTCCTGCGCTCAGACCTTTCAG
AGCTGAGGGTCCGAAAACCTGGTGGGAGCTCCGGGGACCGTGGAAGCAACCCCCTAGATGGCAGAGACTCACCATCCGCAGGTGGCCCTG
TGGGGCAACTTGAACCCATACCCATCCCAGCCCCAGCATCACCTGGCACGCGCCCCACACTCAAGGACTTGACAGCCACTCTGCGGAGAG
CAAAGTCATTCACCTGCTCTGAGAAGCCCATGGCCCGCCGCCTGCCCCGCACCAGTGCTCTGAAGTCCAGCTCCTCCGAGCTCCTGCTCA
CAGGCCCTGGTGCCGAGGAGGATCCGCTGCCCCTCATCGTCCAGGACCAATATGTGCAGGAGGCCCGCCAGGTTTTTGAGAAGATCCAGC
GCATGGGTGCCCAACAAGATGATGGAAGCGATGCCCCCCCTGGAAGCCCTGACTGGGCAGGGGATGTGACCCGAGGGCAGCGGTCCCAGG
AGGAGCTCTCAGGCCCTGAGTCCAGTCTGACAGATGAAGGCATTGGGGCAGACCCTGAGCCTCCTGTTGCAGCATTTTGCGGCCTGGGTA
CCACAGGGATGTGGCGACCTCTTTCCTCATCCTCGGCCCAGACGAACCACCATGGCCCTGGGACTGAGGACAGTCTGGGCGGGTGGGCCC
TGGTGTCGCCTGAGACCCCTCCCACACCAGGTGCCCTCCGCCGACGACGCAAAGTCCCACCTTCAGGTTCTGGTGGGAGCGAATTGAGCA
ATGGGGAGGCAGGGGAGGCCTACAGGTCCCTGAGTGACCCAATTCCTCAGCGCCACCGGGCTGCCACCTCTGAAGAGCCTACTGGGTTCT
CTGTGGACAGCAACCTCCTGGGCTCACTGAGCCCCAAGACAGGGCTCCCTGCCACCTCAGCCATGGATGAGGGCTTGACCAGTGGTCACA
GTGACTGGTCTGTGGGCAGTGAAGAGAGCAAGGGATATCAGGAGGTTATTCAGAGCATAGTTCAGGGGCCTGGCACCCTGGGGCGTGTGG
TGGACGACAGGATTGCTGGCAAAGCCCCCAAGAAGAAATCCCTGAGTGACCCCAGCCGCCGTGGGGAGCTGGCTGGGCCTGGATTCGAGG
GCCCTGGAGGGGAGCCCATCCGAGAAGTTGAGCCCATGCTGCCTCCATCCAGCAGCGAGCCCATCCTTGTAGAGCAGCGGGCAGAGCCAG
AAGAACCTGGTGCCACCAGGAGCCGGGCACAGTCTGAAAGGGCCCTACCTGAGGCTCTGCCTCCCCCTGCCACTGCCCACCGAAACTTTC
ACCTTGACCCCAAGCTGGCTGACATTCTGTCCCCGAGGCTAATCCGCCGAGGCTCCAAGAAGCGCCCAGCTCGGAGTAGTCACCAGGAGC
TTCGGAGAGACGAGGGCAGTCAGGACCAGACTGGCAGCCTGTCTCGGGCCCGGCCCTCCTCCAGACACGTTCGCCATGCCAGTGTGCCCG
CCACATTTATGCCTATTGTGGTGCCTGAGCCACCAACTTCTGTTGGTCCCCCTGTGGCTGTGCCAGAACCCATAGGCTTCCCTACCCGAG
CCCATCCCACGTTGCAGGCACCATCGCTCGAGGACGTCACCAAGCAGTACATGCTGAACCTGCACTCCGGTGAGGTCCCTGCCCCAGTGC
CAGTGGACATGCCCTGCTTGCCTCTGGCTGCACCGCCCTCTGCTGAGGCCAAGCCCCCTGAGGCAGCTCGGCCTGCAGATGAGCCTACCC
CTGCCAGCAAGTGCTGCAGCAAGCCACAGGTGCCTATGGGCTATGGGCCTCGTATGCAACAGCCTTCCAACCAGGGCCAGTTCCTTCCTC
AGACTCAGTTCCCATCACAGGGAATGAATGTAACAAATATCCCTTTGGCTCCGTCCAGCGGTCAAGCTCCAGTGTCTCAAGCACAAATGT
CTAGTTCTTCCTGCCCGGTGAACTCTCCTATAATGCCTCCAGGGTCTCAGGGGAGCCACATTCACTGTCCCCAGCTTCCTCAACCAGCTC
TTCATCAGAATTCACCCTCGCCTGTACCTAGTCGTACCCCCACCCCTCACCATACTCCCCCAAGCATAGGGGCTCAGCAGCCACCAGCAA
CAACAATTCCAGCCCCTGTTCCTACACCTCCTGCCATGCCACCTGGGCCACAGTCCCAGGCTCTACATCCCCCTCCAAGGCAGACACCTA
CACCACCAACAACACAACTTCCCCAACAAGTGCAGCCTTCACTTCCTGCTGCACCTTCTGCTGACCAGCCCCAGCAGCAGCCTCGCTCAC
AGCAGAGCACAGCAGCGTCTGTTCCTACCCCAACAGCACCGCTGCTTCCTCCGCAGCCTGCAACTCCACTTTCCCAGCCAGCTGTAAGCA
TTGAAGGACAGGTATCAAATCCTCCATCTACTAGTAGCACAGAAGTGAATTCTCAGGCCATTGCTGAGAAGCAGCCTTCCCAGGAAGTGA
AGATGGAGGCCAAAATGGAAGTGGATCAACCAGAACCAGCAGATACTCAGCCGGAGGATATTTCAGAGTCTAAAGTGGAAGACTGTAAAA
TGGAATCTACCGAAACAGAAGAGAGAAGCACTGAGTTAAAAACTGAAATAAAAGAGGAGGAAGACCAGCCAAGTACTTCAGCTACCCAGT
CATCTCCGGCTCCAGGACAGTCAAAGAAAAAGATTTTCAAACCAGAAGAACTACGACAGGCACTGATGCCAACTTTGGAGGCACTTTACC
GTCAGGATCCAGAATCCCTTCCCTTTCGTCAACCTGTGGACCCTCAGCTTTTAGGAATCCCTGATTACTTTGATATTGTGAAGAGCCCCA
TGGATCTTTCTACCATTAAGAGGAAGTTAGACACTGGACAGTATCAGGAGCCCTGGCAGTATGTCGATGATATTTGGCTTATGTTCAATA
ATGCCTGGTTATATAACCGGAAAACATCACGGGTATACAAATACTGCTCCAAGCTCTCTGAGGTCTTTGAACAAGAAATTGACCCAGTGA
TGCAAAGCCTTGGATACTGTTGTGGCAGAAAGTTGGAGTTCTCTCCACAGACACTGTGTTGCTACGGCAAACAGTTGTGCACAATACCTC
GTGATGCCACTTATTACAGTTACCAGAACAGGTATCATTTCTGTGAGAAGTGTTTCAATGAGATCCAAGGGGAGAGCGTTTCTTTGGGGG
ATGACCCTTCCCAGCCTCAAACTACAATAAATAAAGAACAATTTTCCAAGAGAAAAAATGACACACTGGATCCTGAACTGTTTGTTGAAT
GTACAGAGTGCGGAAGAAAGATGCATCAGATCTGTGTCCTTCACCATGAGATCATCTGGCCTGCTGGATTCGTCTGTGATGGCTGTTTAA
AGAAAAGTGCACGAACTAGGAAAGAAAATAAGTTTTCTGCTAAAAGGTTGCCATCTACCAGACTTGGCACCTTTCTAGAGAATCGTGTGA
ATGACTTTCTGAGGCGACAGAATCACCCTGAGTCAGGAGAGGTCACTGTTAGAGTAGTTCATGCTTCTGACAAAACCGTGGAAGTAAAAC
CAGGCATGAAAGCAAGGTTTGTGGACAGTGGAGAGATGGCAGAATCCTTTCCATACCGAACCAAAGCCCTCTTTGCCTTTGAAGAAATTG
ATGGTGTTGACCTGTGCTTCTTTGGCATGCATGTTCAAGAGTATGGCTCTGACTGCCCTCCACCCAACCAGAGGAGAGTATACATATCTT
ACCTCGATAGTGTTCATTTCTTCCGTCCTAAATGCTTGAGGACTGCAGTCTATCATGAAATCCTAATTGGATATTTAGAATATGTCAAGA
AATTAGGTTACACAACAGGGCATATTTGGGCATGTCCACCAAGTGAGGGAGATGATTATATCTTCCATTGCCATCCTCCTGACCAGAAGA
TACCCAAGCCCAAGCGACTGCAGGAATGGTACAAAAAAATGCTTGACAAGGCTGTATCAGAGCGTATTGTCCATGACTACAAGGATATTT
TTAAACAAGCTACTGAAGATAGATTAACAAGTGCAAAGGAATTGCCTTATTTCGAGGGTGATTTCTGGCCCAATGTTCTGGAAGAAAGCA
TTAAGGAACTGGAACAGGAGGAAGAAGAGAGAAAACGAGAGGAAAACACCAGCAATGAAAGCACAGATGTGACCAAGGGAGACAGCAAAA
ATGCTAAAAAGAAGAATAATAAGAAAACCAGCAAAAATAAGAGCAGCCTGAGTAGGGGCAACAAGAAGAAACCCGGGATGCCCAATGTAT
CTAACGACCTCTCACAGAAACTATATGCCACCATGGAGAAGCATAAAGAGGTCTTCTTTGTGATCCGCCTCATTGCTGGCCCTGCTGCCA
ACTCCCTGCCTCCCATTGTTGATCCTGATCCTCTCATCCCCTGCGATCTGATGGATGGTCGGGATGCGTTTCTCACGCTGGCAAGGGACA
AGCACCTGGAGTTCTCTTCACTCCGAAGAGCCCAGTGGTCCACCATGTGCATGCTGGTGGAGCTGCACACGCAGAGCCAGGACCGCTTTG
TCTACACCTGCAATGAATGCAAGCACCATGTGGAGACACGCTGGCACTGTACTGTCTGTGAGGATTATGACTTGTGTATCACCTGCTATA
ACACTAAAAACCATGACCACAAAATGGAGAAACTAGGCCTTGGCTTAGATGATGAGAGCAACAACCAGCAGGCTGCAGCCACCCAGAGCC
CAGGCGATTCTCGCCGCCTGAGTATCCAGCGCTGCATCCAGTCTCTGGTCCATGCTTGCCAGTGTCGGAATGCCAATTGCTCACTGCCAT
CCTGCCAGAAGATGAAGCGGGTTGTGCAGCATACCAAGGGTTGCAAACGGAAAACCAATGGCGGGTGCCCCATCTGCAAGCAGCTCATTG
CCCTCTGCTGCTACCATGCCAAGCACTGCCAGGAGAACAAATGCCCGGTGCCGTTCTGCCTAAACATCAAGCAGAAGCTCCGGCAGCAAC
AGCTGCAGCACCGACTACAGCAGGCCCAAATGCTTCGCAGGAGGATGGCCAGCATGCAGCGGACTGGTGTGGTTGGGCAGCAACAGGGCC
TCCCTTCCCCCACTCCTGCCACTCCAACGACACCAACTGGCCAACAGCCAACCACCCCGCAGACGCCCCAGCCCACTTCTCAGCCTCAGC
CTACCCCTCCCAATAGCATGCCACCCTACTTGCCCAGGACTCAAGCTGCTGGCCCTGTGTCCCAGGGTAAGGCAGCAGGCCAGGTGACCC
CTCCAACCCCTCCTCAGACTGCTCAGCCACCCCTTCCAGGGCCCCCACCTGCAGCAGTGGAAATGGCAATGCAGATTCAGAGAGCAGCGG
AGACGCAGCGCCAGATGGCCCACGTGCAAATTTTTCAAAGGCCAATCCAACACCAGATGCCCCCGATGACTCCCATGGCCCCCATGGGTA
TGAACCCACCTCCCATGACCAGAGGTCCCAGTGGGCATTTGGAGCCAGGGATGGGACCGACAGGGATGCAGCAACAGCCACCCTGGAGCC
AAGGAGGATTGCCTCAGCCCCAGCAACTACAGTCTGGGATGCCAAGGCCAGCCATGATGTCAGTGGCCCAGCATGGTCAACCTTTGAACA
TGGCTCCACAACCAGGATTGGGCCAGGTAGGTATCAGCCCACTCAAACCAGGCACTGTGTCTCAACAAGCCTTACAAAACCTTTTGCGGA
CTCTCAGGTCTCCCAGCTCTCCCCTGCAGCAGCAACAGGTGCTTAGTATCCTTCACGCCAACCCCCAGCTGTTGGCTGCATTCATCAAGC
AGCGGGCTGCCAAGTATGCCAACTCTAATCCACAACCCATCCCTGGGCAGCCTGGCATGCCCCAGGGGCAGCCAGGGCTACAGCCACCTA
CCATGCCAGGTCAGCAGGGGGTCCACTCCAATCCAGCCATGCAGAACATGAATCCAATGCAGGCGGGCGTTCAGAGGGCTGGCCTGCCCC
AGCAGCAACCACAGCAGCAACTCCAGCCACCCATGGGAGGGATGAGCCCCCAGGCTCAGCAGATGAACATGAACCACAACACCATGCCTT
CACAATTCCGAGACATCTTGAGACGACAGCAAATGATGCAACAGCAGCAGCAACAGGGAGCAGGGCCAGGAATAGGCCCTGGAATGGCCA
ACCATAACCAGTTCCAGCAACCCCAAGGAGTTGGCTACCCACCACAGCAGCAGCAGCGGATGCAGCATCACATGCAACAGATGCAACAAG
GAAATATGGGACAGATAGGCCAGCTTCCCCAGGCCTTGGGAGCAGAGGCAGGTGCCAGTCTACAGGCCTATCAGCAGCGACTCCTTCAGC
AACAGATGGGGTCCCCTGTTCAGCCCAACCCCATGAGCCCCCAGCAGCATATGCTCCCAAATCAGGCCCAGTCCCCACACCTACAAGGCC
AGCAGATCCCTAATTCTCTCTCCAATCAAGTGCGCTCTCCCCAGCCTGTCCCTTCTCCACGGCCACAGTCCCAGCCCCCCCACTCCAGTC
CTTCCCCAAGGATGCAGCCTCAGCCTTCTCCACACCACGTTTCCCCACAGACAAGTTCCCCACATCCTGGACTGGTAGCTGCCCAGGCCA
ACCCCATGGAACAAGGGCATTTTGCCAGCCCGGACCAGAATTCAATGCTTTCTCAGCTTGCTAGCAATCCAGGCATGGCAAACCTCCATG
GTGCAAGCGCCACGGACCTGGGACTCAGCACCGATAACTCAGACTTGAATTCAAACCTCTCACAGAGTACACTAGACATACACTAGAGAC
ACCTTGTAGTATTTTGGGAGCAAAAAAATTATTTTCTCTTAACAAGACTTTTTGTACTGAAAACAATTTTTTTGAATCTTTCGTAGCCTA
AAAGACAATTTTCCTTGGAACACATAAGAACTGTGCAGTAGCCGTTTGTGGTTTAAAGCAAACATGCAAGATGAACCTGAGGGATGATAG
AATACAAAGAATATATTTTTGTTATGGCTGGTTACCACCAGCCTTTCTTCCCCTTTGTGTGTGTGGTTCAAGTGTGCACTGGGAGGAGGC
TGAGGCCTGTGAAGCCAAACAATATGCTCCTGCCTTGCACCTCCAATAGGTTTTATTATTTTTTTTAAATTAATGAACATATGTAATATT
AATAGTTATTATTTACTGGTGCAGATGGTTGACATTTTTCCCTATTTTCCTCACTTTATGGAAGAGTTAAAACATTTCTAAACCAGAGGA
CAAAAGGGGTTAATGTTACTTTAAAATTACATTCTATATATATATAAATATATATAAATATATATTAAAATACCAGTTTTTTTTCTCTGG
GTGCAAAGATGTTCATTCTTTTAAAAAATGTTTAAAAAAAAAAAAAAACTGCCTTTCTTCCCCTCAAGTCAACTTTTGTGCTCCAGAAAA
TTTTCTATTCTGTAAGTCTGAGCGTAAAACTTCAAGTATTAAAATAATTTGTACATGTAGAGAGAAAAATGACTTTTTCAAAAATATACA
GGGGCAGCTGCCAAATTGATGTATTATATATTGTGGTTTCTGTTTCTTGAAAGAATTTTTTTCGTTATTTTTACATCTAACAAAGTAAAA
AAATTAAAAAGAGGGTAAGAAACGATTCCGGTGGGATGATTTTAACATGCAAAATGTCCCTGGGGGTTTCTTCTTTGCTTGCTTTCTTCC
TCCTTACCCTACCCCCCACTCACACACACACACACACACACACACACACACACACACACACACTTTCTATAAAACTTGAAAATAGCAAAA
ACCCTCAACTGTTGTAAATCATGCAATTAAAGTTGATTACTTATAAATATGAACTTTGGATCACTGTATAGACTGTTAAATTTGATTTCT
TATTACCTATTGTTAAATAAACTGTGTGAGACAGACA

>6228_6228_2_ARHGEF17-EP300_ARHGEF17_chr11_73022875_ENST00000263674_EP300_chr22_41545042_ENST00000263253_length(amino acids)=2778AA_BP=1111
MLRSLRPLPTLPCAAFGVGRCAPREWGRRGGWPRLPEASPPGVSYATMADGAPRPQLYRSVSFKLLERWSGGPGLREEDTDTPGLRRRAS
CRPTTAARGQPSRRVSKLASGPLAAPAQPRPLRSLSPSVRQLSRRFDAPRLDDGSAGTRDGGVLPAAAEEAAEGPARGAWPSVTEMRKLF
GGPGSRRPSADSESPGTPSPDGAAWEPPARESRQPPTPPPRTCFPLAGLRSARPLTGPETEGRLRRPQQQQERAQRPADGLHSWHIFSQP
QAGARASCSSSSIAASYPVSRSRAASSSEEEEEGPPQLPGAQSPAYHGGHSSGSDDDRDGEGGHRWGGRPGLRPGSSLLDQDCRPDSDGL
NLSSMNSAGVSGSPEPPTSPRAPREEGLREWGSGSPPCVPGPQEGLRPMSDSVGGAFRVAKVSFPSYLASPAGSRGSSRYSSTETLKDDD
LWSSRGSGGWGVYRSPSFGAGEGLLRSQARTRAKGPGGTSRALRDGGFEPEKSRQRKSLSNPDIASETLTLLSFLRSDLSELRVRKPGGS
SGDRGSNPLDGRDSPSAGGPVGQLEPIPIPAPASPGTRPTLKDLTATLRRAKSFTCSEKPMARRLPRTSALKSSSSELLLTGPGAEEDPL
PLIVQDQYVQEARQVFEKIQRMGAQQDDGSDAPPGSPDWAGDVTRGQRSQEELSGPESSLTDEGIGADPEPPVAAFCGLGTTGMWRPLSS
SSAQTNHHGPGTEDSLGGWALVSPETPPTPGALRRRRKVPPSGSGGSELSNGEAGEAYRSLSDPIPQRHRAATSEEPTGFSVDSNLLGSL
SPKTGLPATSAMDEGLTSGHSDWSVGSEESKGYQEVIQSIVQGPGTLGRVVDDRIAGKAPKKKSLSDPSRRGELAGPGFEGPGGEPIREV
EPMLPPSSSEPILVEQRAEPEEPGATRSRAQSERALPEALPPPATAHRNFHLDPKLADILSPRLIRRGSKKRPARSSHQELRRDEGSQDQ
TGSLSRARPSSRHVRHASVPATFMPIVVPEPPTSVGPPVAVPEPIGFPTRAHPTLQAPSLEDVTKQYMLNLHSGEVPAPVPVDMPCLPLA
APPSAEAKPPEAARPADEPTPASKCCSKPQVPMGYGPRMQQPSNQGQFLPQTQFPSQGMNVTNIPLAPSSGQAPVSQAQMSSSSCPVNSP
IMPPGSQGSHIHCPQLPQPALHQNSPSPVPSRTPTPHHTPPSIGAQQPPATTIPAPVPTPPAMPPGPQSQALHPPPRQTPTPPTTQLPQQ
VQPSLPAAPSADQPQQQPRSQQSTAASVPTPTAPLLPPQPATPLSQPAVSIEGQVSNPPSTSSTEVNSQAIAEKQPSQEVKMEAKMEVDQ
PEPADTQPEDISESKVEDCKMESTETEERSTELKTEIKEEEDQPSTSATQSSPAPGQSKKKIFKPEELRQALMPTLEALYRQDPESLPFR
QPVDPQLLGIPDYFDIVKSPMDLSTIKRKLDTGQYQEPWQYVDDIWLMFNNAWLYNRKTSRVYKYCSKLSEVFEQEIDPVMQSLGYCCGR
KLEFSPQTLCCYGKQLCTIPRDATYYSYQNRYHFCEKCFNEIQGESVSLGDDPSQPQTTINKEQFSKRKNDTLDPELFVECTECGRKMHQ
ICVLHHEIIWPAGFVCDGCLKKSARTRKENKFSAKRLPSTRLGTFLENRVNDFLRRQNHPESGEVTVRVVHASDKTVEVKPGMKARFVDS
GEMAESFPYRTKALFAFEEIDGVDLCFFGMHVQEYGSDCPPPNQRRVYISYLDSVHFFRPKCLRTAVYHEILIGYLEYVKKLGYTTGHIW
ACPPSEGDDYIFHCHPPDQKIPKPKRLQEWYKKMLDKAVSERIVHDYKDIFKQATEDRLTSAKELPYFEGDFWPNVLEESIKELEQEEEE
RKREENTSNESTDVTKGDSKNAKKKNNKKTSKNKSSLSRGNKKKPGMPNVSNDLSQKLYATMEKHKEVFFVIRLIAGPAANSLPPIVDPD
PLIPCDLMDGRDAFLTLARDKHLEFSSLRRAQWSTMCMLVELHTQSQDRFVYTCNECKHHVETRWHCTVCEDYDLCITCYNTKNHDHKME
KLGLGLDDESNNQQAAATQSPGDSRRLSIQRCIQSLVHACQCRNANCSLPSCQKMKRVVQHTKGCKRKTNGGCPICKQLIALCCYHAKHC
QENKCPVPFCLNIKQKLRQQQLQHRLQQAQMLRRRMASMQRTGVVGQQQGLPSPTPATPTTPTGQQPTTPQTPQPTSQPQPTPPNSMPPY
LPRTQAAGPVSQGKAAGQVTPPTPPQTAQPPLPGPPPAAVEMAMQIQRAAETQRQMAHVQIFQRPIQHQMPPMTPMAPMGMNPPPMTRGP
SGHLEPGMGPTGMQQQPPWSQGGLPQPQQLQSGMPRPAMMSVAQHGQPLNMAPQPGLGQVGISPLKPGTVSQQALQNLLRTLRSPSSPLQ
QQQVLSILHANPQLLAAFIKQRAAKYANSNPQPIPGQPGMPQGQPGLQPPTMPGQQGVHSNPAMQNMNPMQAGVQRAGLPQQQPQQQLQP
PMGGMSPQAQQMNMNHNTMPSQFRDILRRQQMMQQQQQQGAGPGIGPGMANHNQFQQPQGVGYPPQQQQRMQHHMQQMQQGNMGQIGQLP
QALGAEAGASLQAYQQRLLQQQMGSPVQPNPMSPQQHMLPNQAQSPHLQGQQIPNSLSNQVRSPQPVPSPRPQSQPPHSSPSPRMQPQPS
PHHVSPQTSSPHPGLVAAQANPMEQGHFASPDQNSMLSQLASNPGMANLHGASATDLGLSTDNSDLNSNLSQSTLDIH

--------------------------------------------------------------

Top

Fusion Gene PPI Analysis for ARHGEF17-EP300

Go to ChiPPI (Chimeric Protein-Protein interactions) to see the chimeric PPI interaction in
ChiPPI page.

Protein-protein interactors with each fusion partner protein in wild-type (BIOGRID-3.4.160)

Hgene

Hgene's interactors

Tgene

Tgene's interactors

- Retained PPIs in in-frame fusion.

Partner	Gene	Hbp	Tbp	ENST	Strand	BPexon	TotalExon	Protein feature loci	*BPloci	TotalLen	Still interaction with
Tgene	EP300	chr11:73022875	chr22:41545041	ENST00000263253		11	31	1397_1399	747.0	2415.0	histone
Tgene	EP300	chr11:73022875	chr22:41545042	ENST00000263253		11	31	1397_1399	747.0	2415.0	histone
Tgene	EP300	chr11:73022875	chr22:41545041	ENST00000263253		11	31	2003_2212	747.0	2415.0	HTLV-1 Tax
Tgene	EP300	chr11:73022875	chr22:41545042	ENST00000263253		11	31	2003_2212	747.0	2415.0	HTLV-1 Tax
Tgene	EP300	chr11:73022875	chr22:41545041	ENST00000263253		11	31	2041_2240	747.0	2415.0	NCOA2
Tgene	EP300	chr11:73022875	chr22:41545042	ENST00000263253		11	31	2041_2240	747.0	2415.0	NCOA2

- Lost PPIs in in-frame fusion.

Partner	Gene	Hbp	Tbp	ENST	Strand	BPexon	TotalExon	Protein feature loci	*BPloci	TotalLen	Interaction lost with
Tgene	EP300	chr11:73022875	chr22:41545041	ENST00000263253		11	31	2_139	747.0	2415.0	ALX1
Tgene	EP300	chr11:73022875	chr22:41545042	ENST00000263253		11	31	2_139	747.0	2415.0	ALX1
Tgene	EP300	chr11:73022875	chr22:41545041	ENST00000263253		11	31	2_149	747.0	2415.0	RORA
Tgene	EP300	chr11:73022875	chr22:41545042	ENST00000263253		11	31	2_149	747.0	2415.0	RORA

- Retained PPIs, but lost function due to frame-shift fusion.

Partner

Gene

Hbp

Tbp

ENST

Strand

BPexon

TotalExon

Protein feature loci

*BPloci

TotalLen

Interaction lost with

Top

Related Drugs for ARHGEF17-EP300

Drugs targeting genes involved in this fusion gene.
(DrugBank Version 5.1.8 2021-05-08)

Partner

Gene

UniProtAcc

DrugBank ID

Drug name

Drug activity

Drug type

Drug status

Top

Related Diseases for ARHGEF17-EP300

Diseases associated with fusion partners.
(DisGeNet 4.0)

Partner	Gene	Disease ID	Disease name	# pubmeds	Source
Tgene		C0279626	Squamous cell carcinoma of esophagus	2	CTD_human
Tgene		C0001973	Alcoholic Intoxication, Chronic	1	PSYGENET
Tgene		C0005684	Malignant neoplasm of urinary bladder	1	CTD_human
Tgene		C0005695	Bladder Neoplasm	1	CTD_human
Tgene		C0006142	Malignant neoplasm of breast	1	CGI;CTD_human;UNIPROT
Tgene		C0007137	Squamous cell carcinoma	1	CTD_human
Tgene		C0007138	Carcinoma, Transitional Cell	1	CTD_human
Tgene		C0010606	Adenoid Cystic Carcinoma	1	CTD_human
Tgene		C0014170	Endometrial Neoplasms	1	CTD_human
Tgene		C0014518	Toxic Epidermal Necrolysis	1	CTD_human
Tgene		C0025202	melanoma	1	CTD_human
Tgene		C0028754	Obesity	1	CTD_human
Tgene		C0038325	Stevens-Johnson Syndrome	1	CTD_human
Tgene		C0079772	T-Cell Lymphoma	1	CTD_human
Tgene		C0149925	Small cell carcinoma of lung	1	CTD_human
Tgene		C0152013	Adenocarcinoma of lung (disorder)	1	CTD_human
Tgene		C0376634	Craniofacial Abnormalities	1	CTD_human
Tgene		C0476089	Endometrial Carcinoma	1	CTD_human
Tgene		C0678222	Breast Carcinoma	1	CGI;CTD_human
Tgene		C1257931	Mammary Neoplasms, Human	1	CTD_human
Tgene		C1274933	Drug-Induced Stevens Johnson Syndrome	1	CTD_human
Tgene		C1458155	Mammary Neoplasms	1	CTD_human
Tgene		C3150941	RUBINSTEIN-TAYBI SYNDROME 2	1	GENOMICS_ENGLAND
Tgene		C3658301	Mycoplasma-Induced Stevens-Johnson Syndrome	1	CTD_human
Tgene		C3658302	Stevens-Johnson Syndrome Toxic Epidermal Necrolysis Spectrum	1	CTD_human
Tgene		C4704874	Mammary Carcinoma, Human	1	CTD_human

Fusion Gene Studies in Kim Lab

Fusion gene:ARHGEF17-EP300 (FusionGDB2 ID:HG9828TG2033)

Fusion Gene Summary for ARHGEF17-EP300

Fusion Gene ORF analysis for ARHGEF17-EP300

Fusion Genomic Features for ARHGEF17-EP300

Fusion Protein Features for ARHGEF17-EP300

Fusion Gene Sequence for ARHGEF17-EP300

Fusion Gene PPI Analysis for ARHGEF17-EP300

Related Drugs for ARHGEF17-EP300

Related Diseases for ARHGEF17-EP300

Fusion Gene Studies
in Kim Lab