Home

Download

Statistics

Examples

Help

Contact

	Fusion Gene Summary
	Fusion Gene ORF analysis
	Fusion Genomic Features
	Fusion Protein Features
	Fusion Gene Sequence
	Fusion Gene PPI analysis
	Related Drugs
	Related Diseases

Fusion gene:ARID1A-DGKA (FusionGDB2 ID:HG8289TG1606)

Fusion Gene Summary for ARID1A-DGKA

Fusion gene summary

Fusion gene information	Fusion gene name: ARID1A-DGKA
	Fusion gene ID: hg8289tg1606
		Hgene	Tgene
	Gene symbol	ARID1A	DGKA
	Gene ID	8289	1606
	Gene name	AT-rich interaction domain 1A	diacylglycerol kinase alpha
	Synonyms	B120\|BAF250\|BAF250a\|BM029\|C1orf4\|CSS2\|ELD\|MRD14\|OSA1\|P270\|SMARCF1\|hELD\|hOSA1	DAGK\|DAGK1\|DGK-alpha
	Cytomap	('ARID1A')('DGKA') 1p36.11	12q13.2
	Type of gene	protein-coding	protein-coding
	Description	AT-rich interactive domain-containing protein 1AARID domain-containing protein 1AAT rich interactive domain 1A (SWI-like)BRG1-associated factor 250aOSA1 nuclear proteinSWI-like proteinSWI/SNF complex protein p270SWI/SNF-related, matrix-associated,	diacylglycerol kinase alpha80 kDa diacylglycerol kinaseDAG kinase alphadiacylglycerol kinase, alpha 80kDadiglyceride kinase alpha
	Modification date	20200329	20200313
	UniProtAcc	O14497	.
	Ensembl transtripts involved in fusion gene	ENST00000324856, ENST00000374152, ENST00000457599, ENST00000540690,
Fusion gene scores	* DoF score	29 X 19 X 15=8265	11 X 10 X 7=770
	# samples	45	12
	** MAII score	log2(45/8265*10)=-4.19901791296264 possibly effective Gene in Pan-Cancer Fusion Genes (peGinPCFGs). DoF>8 and MAII<0	log2(12/770*10)=-2.68182403997375 possibly effective Gene in Pan-Cancer Fusion Genes (peGinPCFGs). DoF>8 and MAII<0
Context	PubMed: ARID1A [Title/Abstract] AND DGKA [Title/Abstract] AND fusion [Title/Abstract]
Most frequent breakpoint	ARID1A(27106722)-DGKA(56346689), # samples:2
Anticipated loss of major functional domain due to fusion event.	ARID1A-DGKA seems lost the major protein functional domain in Hgene partner, which is a CGC by not retaining the major functional domain in the partially deleted in-frame ORF. ARID1A-DGKA seems lost the major protein functional domain in Hgene partner, which is a CGC by not retaining the major functional domain in the partially deleted in-frame ORF. ARID1A-DGKA seems lost the major protein functional domain in Hgene partner, which is a essential gene by not retaining the major functional domain in the partially deleted in-frame ORF. ARID1A-DGKA seems lost the major protein functional domain in Hgene partner, which is a essential gene by not retaining the major functional domain in the partially deleted in-frame ORF. ARID1A-DGKA seems lost the major protein functional domain in Hgene partner, which is a CGC due to the frame-shifted ORF. ARID1A-DGKA seems lost the major protein functional domain in Hgene partner, which is a epigenetic factor due to the frame-shifted ORF. ARID1A-DGKA seems lost the major protein functional domain in Hgene partner, which is a essential gene due to the frame-shifted ORF. ARID1A-DGKA seems lost the major protein functional domain in Hgene partner, which is a tumor suppressor due to the frame-shifted ORF. ARID1A-DGKA seems lost the major protein functional domain in Tgene partner, which is a cell metabolism gene due to the frame-shifted ORF. ARID1A-DGKA seems lost the major protein functional domain in Tgene partner, which is a essential gene due to the frame-shifted ORF.

* DoF score (Degree of Frequency) = # partners X # break points X # cancer types
** MAII score (Major Active Isofusion Index) = log2(# samples/DoF score*10)

Gene ontology of each fusion partner gene with evidence of Inferred from Direct Assay (IDA) from Entrez

Partner	Gene	GO ID	GO term	PubMed ID
Hgene	ARID1A	GO:0006337	nucleosome disassembly	8895581
Hgene	ARID1A	GO:0006338	chromatin remodeling	11726552
Hgene	ARID1A	GO:0030520	intracellular estrogen receptor signaling pathway	12200431
Hgene	ARID1A	GO:0030521	androgen receptor signaling pathway	12200431
Hgene	ARID1A	GO:0042921	glucocorticoid receptor signaling pathway	12200431
Hgene	ARID1A	GO:0045893	positive regulation of transcription, DNA-templated	12200431
Tgene	DGKA	GO:0006654	phosphatidic acid biosynthetic process	22627129
Tgene	DGKA	GO:0046339	diacylglycerol metabolic process	22627129
Tgene	DGKA	GO:0046486	glycerolipid metabolic process	22627129
Tgene	DGKA	GO:0046834	lipid phosphorylation	18004883\|22627129

Fusion gene breakpoints across ARID1A (5'-gene)
* Click on the image to open the UCSC genome browser with custom track showing this image in a new window.

Fusion gene breakpoints across DGKA (3'-gene)
* Click on the image to open the UCSC genome browser with custom track showing this image in a new window.

Fusion gene information
* All genome coordinats were lifted-over on hg19.
* Click on the break point to see the gene structure around the break point region using the UCSC Genome Browser.

Source	Disease	Sample	Hgene	Hchr	Hbp	Hstrand	Tgene	Tchr	Tbp	Tstrand
ChimerDB4	SKCM	TCGA-EE-A17Z-06A	ARID1A	chr1	27106722	+	DGKA	chr12	56346689	+

Top

Fusion Gene ORF analysis for ARID1A-DGKA

Open reading frame (ORF) analsis of fusion genes based on Ensembl gene isoform structure.
* Click on the break point to see the gene structure around the break point region using the UCSC Genome Browser.

ORF	Henst	Tenst	Hgene	Hchr	Hbp	Hstrand	Tgene	Tchr	Tbp	Tstrand
5CDS-3UTR	ENST00000324856	ENST00000549079	ARID1A	chr1	27106722	+	DGKA	chr12	56346689	+
5CDS-3UTR	ENST00000374152	ENST00000549079	ARID1A	chr1	27106722	+	DGKA	chr12	56346689	+
5CDS-3UTR	ENST00000457599	ENST00000549079	ARID1A	chr1	27106722	+	DGKA	chr12	56346689	+
5CDS-3UTR	ENST00000540690	ENST00000549079	ARID1A	chr1	27106722	+	DGKA	chr12	56346689	+
Frame-shift	ENST00000324856	ENST00000331886	ARID1A	chr1	27106722	+	DGKA	chr12	56346689	+
Frame-shift	ENST00000324856	ENST00000394147	ARID1A	chr1	27106722	+	DGKA	chr12	56346689	+
Frame-shift	ENST00000324856	ENST00000551156	ARID1A	chr1	27106722	+	DGKA	chr12	56346689	+
Frame-shift	ENST00000457599	ENST00000331886	ARID1A	chr1	27106722	+	DGKA	chr12	56346689	+
Frame-shift	ENST00000457599	ENST00000394147	ARID1A	chr1	27106722	+	DGKA	chr12	56346689	+
Frame-shift	ENST00000457599	ENST00000551156	ARID1A	chr1	27106722	+	DGKA	chr12	56346689	+
Frame-shift	ENST00000540690	ENST00000331886	ARID1A	chr1	27106722	+	DGKA	chr12	56346689	+
Frame-shift	ENST00000540690	ENST00000394147	ARID1A	chr1	27106722	+	DGKA	chr12	56346689	+
Frame-shift	ENST00000540690	ENST00000551156	ARID1A	chr1	27106722	+	DGKA	chr12	56346689	+
In-frame	ENST00000374152	ENST00000331886	ARID1A	chr1	27106722	+	DGKA	chr12	56346689	+
In-frame	ENST00000374152	ENST00000394147	ARID1A	chr1	27106722	+	DGKA	chr12	56346689	+
In-frame	ENST00000374152	ENST00000551156	ARID1A	chr1	27106722	+	DGKA	chr12	56346689	+

ORFfinder result based on the fusion transcript sequence of in-frame fusion genes.

Henst

Tenst

Hgene

Hchr

Hbp

Hstrand

Tgene

Tchr

Tbp

Tstrand

Seq length
(transcript)

BP loci
(transcript)

Predicted start
(transcript)

Predicted stop
(transcript)

Seq length
(amino acids)

ENST00000374152

ARID1A

chr1

27106722

ENST00000331886

DGKA

chr12

56346689

5323

4783

283

4782

1499

ENST00000374152

ARID1A

chr1

27106722

ENST00000394147

DGKA

chr12

56346689

5329

4783

283

4782

1499

ENST00000374152

ARID1A

chr1

27106722

ENST00000551156

DGKA

chr12

56346689

5335

4783

283

4782

1499

DeepORF prediction of the coding potential based on the fusion transcript sequence of in-frame fusion genes. DeepORF is a coding potential classifier based on convolutional neural network by comparing the real Ribo-seq data. If the no-coding score < 0.5 and coding score > 0.5, then the in-frame fusion transcript is predicted as being likely translated.

Henst	Tenst	Hgene	Hchr	Hbp	Hstrand	Tgene	Tchr	Tbp	Tstrand	No-coding score	Coding score
ENST00000374152	ENST00000331886	ARID1A	chr1	27106722	+	DGKA	chr12	56346689	+	0.006443693	0.9935563
ENST00000374152	ENST00000394147	ARID1A	chr1	27106722	+	DGKA	chr12	56346689	+	0.006369842	0.9936301
ENST00000374152	ENST00000551156	ARID1A	chr1	27106722	+	DGKA	chr12	56346689	+	0.006486926	0.99351305

Top

Fusion Genomic Features for ARID1A-DGKA

FusionAI prediction of the potential fusion gene breakpoint based on the pre-mature RNA sequence context (+/- 5kb of individual partner genes, total 20kb length sequence). FusionAI is a fusion gene breakpoint classifier based on convolutional neural network by comparing the fusion positive and negative sequence context of ~ 20K fusion gene data. From here, we can have the relative potentency of the 20K genomic sequence how individual sequnce will be likely used as the gene fusion breakpoints.

Hgene

Hchr

Hbp

Hstrand

Tgene

Tchr

Tbp

Tstrand

1-p

p (fusion gene breakpoint)

Distribution of 44 human genomic features loci across 20kb length fusion breakpoint regions. We integrated a total of 44 different types of human genomic feature loci information across five big categories including virus integration sites, repeats, structural variants, chromatin states, and gene expression regulation. More details are in help page.

Top

Fusion Protein Features for ARID1A-DGKA

Four levels of functional features of fusion genes
Go to FGviewer search page for the most frequent breakpoint (https://ccsmweb.uth.edu/FGviewer/chr1:27106722/chr12:56346689)
- FGviewer provides the online visualization of the retention search of the protein functional features across DNA, RNA, protein, and pathological levels.
- How to search
1. Put your fusion gene symbol.
2. Press the tab key until there will be shown the breakpoint information filled.
4. Go down and press 'Search' tab twice.
4. Go down to have the hyperlink of the search result.
5. Click the hyperlink.
6. See the FGviewer result for your fusion gene.

Main function of each fusion partner protein. (from UniProt)

Hgene	Tgene
ARID1A O14497	.
FUNCTION: Involved in transcriptional activation and repression of select genes by chromatin remodeling (alteration of DNA-nucleosome topology). Component of SWI/SNF chromatin remodeling complexes that carry out key enzymatic activities, changing chromatin structure by altering DNA-histone contacts within a nucleosome in an ATP-dependent manner. Binds DNA non-specifically. Belongs to the neural progenitors-specific chromatin remodeling complex (npBAF complex) and the neuron-specific chromatin remodeling complex (nBAF complex). During neural development a switch from a stem/progenitor to a postmitotic chromatin remodeling mechanism occurs as neurons exit the cell cycle and become committed to their adult state. The transition from proliferating neural stem/progenitor cells to postmitotic neurons requires a switch in subunit composition of the npBAF and nBAF complexes. As neural progenitors exit mitosis and differentiate into neurons, npBAF complexes which contain ACTL6A/BAF53A and PHF10/BAF45A, are exchanged for homologous alternative ACTL6B/BAF53B and DPF1/BAF45B or DPF3/BAF45C subunits in neuron-specific complexes (nBAF). The npBAF complex is essential for the self-renewal/proliferative capacity of the multipotent neural stem cells. The nBAF complex along with CREST plays a role regulating the activity of genes essential for dendrite growth (By similarity). {ECO:0000250\|UniProtKB:A2BH40, ECO:0000303\|PubMed:12672490, ECO:0000303\|PubMed:22952240, ECO:0000303\|PubMed:26601204}.	FUNCTION: Transcriptional activator which is required for calcium-dependent dendritic growth and branching in cortical neurons. Recruits CREB-binding protein (CREBBP) to nuclear bodies. Component of the CREST-BRG1 complex, a multiprotein complex that regulates promoter activation by orchestrating a calcium-dependent release of a repressor complex and a recruitment of an activator complex. In resting neurons, transcription of the c-FOS promoter is inhibited by BRG1-dependent recruitment of a phospho-RB1-HDAC1 repressor complex. Upon calcium influx, RB1 is dephosphorylated by calcineurin, which leads to release of the repressor complex. At the same time, there is increased recruitment of CREBBP to the promoter by a CREST-dependent mechanism, which leads to transcriptional activation. The CREST-BRG1 complex also binds to the NR2B promoter, and activity-dependent induction of NR2B expression involves a release of HDAC1 and recruitment of CREBBP (By similarity). {ECO:0000250}.

Retention analysis result of each fusion partner protein across 39 protein features of UniProt such as six molecule processing features, 13 region features, four site features, six amino acid modification features, two natural variation features, five experimental info features, and 3 secondary structure features. Here, because of limited space for viewing, we only show the protein feature retention information belong to the 13 regional features. All retention annotation result can be downloaded at
download page

* Minus value of BPloci means that the break pointn is located before the CDS.

- In-frame and retained protein feature among the 13 regional features.

Partner

Gene

Hbp

Tbp

ENST

Strand

BPexon

TotalExon

Protein feature loci

*BPloci

TotalLen

Protein feature

Protein feature note

Tgene

DGKA

chr1:27106722

chr12:56346689

ENST00000331886

123_134

736.0

Calcium binding

Tgene

DGKA

chr1:27106722

chr12:56346689

ENST00000331886

168_179

736.0

Calcium binding

Tgene

DGKA

chr1:27106722

chr12:56346689

ENST00000394147

123_134

736.0

Calcium binding

Tgene

DGKA

chr1:27106722

chr12:56346689

ENST00000394147

168_179

736.0

Calcium binding

Tgene

DGKA

chr1:27106722

chr12:56346689

ENST00000551156

123_134

736.0

Calcium binding

Tgene

DGKA

chr1:27106722

chr12:56346689

ENST00000551156

168_179

736.0

Calcium binding

Tgene

DGKA

chr1:27106722

chr12:56346689

ENST00000331886

110_145

736.0

Domain

EF-hand 1

Tgene

DGKA

chr1:27106722

chr12:56346689

ENST00000331886

155_190

736.0

Domain

EF-hand 2

Tgene

DGKA

chr1:27106722

chr12:56346689

ENST00000331886

372_506

736.0

Domain

DAGKc

Tgene

DGKA

chr1:27106722

chr12:56346689

ENST00000394147

110_145

736.0

Domain

EF-hand 1

Tgene

DGKA

chr1:27106722

chr12:56346689

ENST00000394147

155_190

736.0

Domain

EF-hand 2

Tgene

DGKA

chr1:27106722

chr12:56346689

ENST00000394147

372_506

736.0

Domain

DAGKc

Tgene

DGKA

chr1:27106722

chr12:56346689

ENST00000551156

110_145

736.0

Domain

EF-hand 1

Tgene

DGKA

chr1:27106722

chr12:56346689

ENST00000551156

155_190

736.0

Domain

EF-hand 2

Tgene

DGKA

chr1:27106722

chr12:56346689

ENST00000551156

372_506

736.0

Domain

DAGKc

Tgene

DGKA

chr1:27106722

chr12:56346689

ENST00000331886

205_253

736.0

Zinc finger

Phorbol-ester/DAG-type 1

Tgene

DGKA

chr1:27106722

chr12:56346689

ENST00000331886

269_319

736.0

Zinc finger

Phorbol-ester/DAG-type 2

Tgene

DGKA

chr1:27106722

chr12:56346689

ENST00000394147

205_253

736.0

Zinc finger

Phorbol-ester/DAG-type 1

Tgene

DGKA

chr1:27106722

chr12:56346689

ENST00000394147

269_319

736.0

Zinc finger

Phorbol-ester/DAG-type 2

Tgene

DGKA

chr1:27106722

chr12:56346689

ENST00000551156

205_253

736.0

Zinc finger

Phorbol-ester/DAG-type 1

Tgene

DGKA

chr1:27106722

chr12:56346689

ENST00000551156

269_319

736.0

Zinc finger

Phorbol-ester/DAG-type 2

- In-frame and not-retained protein feature among the 13 regional features.

Partner

Gene

Hbp

Tbp

ENST

Strand

BPexon

TotalExon

Protein feature loci

*BPloci

TotalLen

Protein feature

Protein feature note

Hgene

ARID1A

chr1:27106722

chr12:56346689

ENST00000324856

1327_1404

2286.0

Compositional bias

Note=Gln-rich

Hgene

ARID1A

chr1:27106722

chr12:56346689

ENST00000324856

479_482

2286.0

Compositional bias

Note=Poly-Gln

Hgene

ARID1A

chr1:27106722

chr12:56346689

ENST00000324856

561_567

2286.0

Compositional bias

Note=Poly-Gln

Hgene

ARID1A

chr1:27106722

chr12:56346689

ENST00000324856

998_1001

2286.0

Compositional bias

Note=Poly-Ser

Hgene

ARID1A

chr1:27106722

chr12:56346689

ENST00000374152

1327_1404

1903.0

Compositional bias

Note=Gln-rich

Hgene

ARID1A

chr1:27106722

chr12:56346689

ENST00000374152

479_482

1903.0

Compositional bias

Note=Poly-Gln

Hgene

ARID1A

chr1:27106722

chr12:56346689

ENST00000374152

561_567

1903.0

Compositional bias

Note=Poly-Gln

Hgene

ARID1A

chr1:27106722

chr12:56346689

ENST00000374152

998_1001

1903.0

Compositional bias

Note=Poly-Ser

Hgene

ARID1A

chr1:27106722

chr12:56346689

ENST00000457599

1327_1404

2069.0

Compositional bias

Note=Gln-rich

Hgene

ARID1A

chr1:27106722

chr12:56346689

ENST00000457599

479_482

2069.0

Compositional bias

Note=Poly-Gln

Hgene

ARID1A

chr1:27106722

chr12:56346689

ENST00000457599

561_567

2069.0

Compositional bias

Note=Poly-Gln

Hgene

ARID1A

chr1:27106722

chr12:56346689

ENST00000457599

998_1001

2069.0

Compositional bias

Note=Poly-Ser

Hgene

ARID1A

chr1:27106722

chr12:56346689

ENST00000324856

1017_1108

2286.0

Domain

ARID

Hgene

ARID1A

chr1:27106722

chr12:56346689

ENST00000374152

1017_1108

1903.0

Domain

ARID

Hgene

ARID1A

chr1:27106722

chr12:56346689

ENST00000457599

1017_1108

2069.0

Domain

ARID

Hgene

ARID1A

chr1:27106722

chr12:56346689

ENST00000324856

1368_1387

2286.0

Motif

Nuclear localization signal

Hgene

ARID1A

chr1:27106722

chr12:56346689

ENST00000324856

1709_1713

2286.0

Motif

Note=LXXLL

Hgene

ARID1A

chr1:27106722

chr12:56346689

ENST00000324856

1967_1971

2286.0

Motif

Note=LXXLL

Hgene

ARID1A

chr1:27106722

chr12:56346689

ENST00000324856

2085_2089

2286.0

Motif

Note=LXXLL

Hgene

ARID1A

chr1:27106722

chr12:56346689

ENST00000324856

295_299

2286.0

Motif

Note=LXXLL

Hgene

ARID1A

chr1:27106722

chr12:56346689

ENST00000374152

1368_1387

1903.0

Motif

Nuclear localization signal

Hgene

ARID1A

chr1:27106722

chr12:56346689

ENST00000374152

1709_1713

1903.0

Motif

Note=LXXLL

Hgene

ARID1A

chr1:27106722

chr12:56346689

ENST00000374152

1967_1971

1903.0

Motif

Note=LXXLL

Hgene

ARID1A

chr1:27106722

chr12:56346689

ENST00000374152

2085_2089

1903.0

Motif

Note=LXXLL

Hgene

ARID1A

chr1:27106722

chr12:56346689

ENST00000374152

295_299

1903.0

Motif

Note=LXXLL

Hgene

ARID1A

chr1:27106722

chr12:56346689

ENST00000457599

1368_1387

2069.0

Motif

Nuclear localization signal

Hgene

ARID1A

chr1:27106722

chr12:56346689

ENST00000457599

1709_1713

2069.0

Motif

Note=LXXLL

Hgene

ARID1A

chr1:27106722

chr12:56346689

ENST00000457599

1967_1971

2069.0

Motif

Note=LXXLL

Hgene

ARID1A

chr1:27106722

chr12:56346689

ENST00000457599

2085_2089

2069.0

Motif

Note=LXXLL

Hgene

ARID1A

chr1:27106722

chr12:56346689

ENST00000457599

295_299

2069.0

Motif

Note=LXXLL

Top

Fusion Gene Sequence for ARID1A-DGKA

For in-frame fusion transcripts, we provide the fusion transcript sequences and fusion amino acid sequences. To have fusion amino acid sequence, we ran ORFfinder and chose the longest ORF among the all predicted ones.

>6372_6372_1_ARID1A-DGKA_ARID1A_chr1_27106722_ENST00000374152_DGKA_chr12_56346689_ENST00000331886_length(transcript)=5323nt_BP=4783nt
TGGATCTCAAGCAGTACCACAGTTACAAAGTAGTTTTTAGCTTACAAGGTGTTTTCACAAATAGGTGGTATTTTCATTTTTCAAATGACA
AAATTAGGGTTCTGAGGCGGGTCAGTTGACTTAAAGGTTACTAGGTTGGTCTCATTGCTCTTTCAAAGTAACTGTATTTCTTTATAGCAT
ACAGACTAAAAAAACCTGTGTACTTGGGTTATATATTCAGTGGCCAGAGGCCATCAAAGCTCAGGTTAATGAAATGCTCTTTATTTTGTA
GCCATCCAGTCCAATGGATCAGATGGGCAAGATGAGACCTCAGCCATATGGCGGGACTAACCCATACTCGCAGCAACAGGGACCTCCGTC
AGGACCGCAGCAAGGACATGGGTACCCAGGGCAGCCATACGGGTCCCAGACCCCGCAGCGGTACCCGATGACCATGCAGGGCCGGGCGCA
GAGTGCCATGGGCGGCCTCTCTTATACACAGCAGATTCCTCCTTATGGACAACAAGGCCCCAGCGGGTATGGTCAACAGGGCCAGACTCC
ATATTACAACCAGCAAAGTCCTCACCCTCAGCAGCAGCAGCCACCCTACTCCCAGCAACCACCGTCCCAGACCCCTCATGCCCAACCTTC
GTATCAGCAGCAGCCACAGTCTCAACCACCACAGCTCCAGTCCTCTCAGCCTCCATACTCCCAGCAGCCATCCCAGCCTCCACATCAGCA
GTCCCCGGCTCCATACCCCTCCCAGCAGTCGACGACACAGCAGCACCCCCAGAGCCAGCCCCCCTACTCACAGCCACAGGCTCAGTCTCC
TTACCAGCAGCAGCAACCTCAGCAGCCAGCACCCTCGACGCTCTCCCAGCAGGCTGCGTATCCTCAGCCCCAGTCTCAGCAGTCCCAGCA
AACTGCCTATTCCCAGCAGCGCTTCCCTCCACCGCAGGAGCTATCTCAAGATTCATTTGGGTCTCAGGCATCCTCAGCCCCCTCAATGAC
CTCCAGTAAGGGAGGGCAAGAAGATATGAACCTGAGCCTTCAGTCAAGACCCTCCAGCTTGCCTGATCTATCTGGTTCAATAGATGACCT
CCCCATGGGGACAGAAGGAGCTCTGAGTCCTGGAGTGAGCACATCAGGGATTTCCAGCAGCCAAGGAGAGCAGAGTAATCCAGCTCAGTC
TCCTTTCTCTCCTCATACCTCCCCTCACCTGCCTGGCATCCGAGGCCCTTCCCCGTCCCCTGTTGGCTCTCCCGCCAGTGTTGCTCAGTC
TCGCTCAGGACCACTCTCGCCTGCTGCAGTGCCAGGCAACCAGATGCCACCTCGGCCACCCAGTGGCCAGTCGGACAGCATCATGCATCC
TTCCATGAACCAATCAAGCATTGCCCAAGATCGAGGTTATATGCAGAGGAACCCCCAGATGCCCCAGTACAGTTCCCCCCAGCCCGGCTC
AGCCTTATCTCCGCGTCAGCCTTCCGGAGGACAGATACACACAGGCATGGGCTCCTACCAGCAGAACTCCATGGGGAGCTATGGTCCCCA
GGGGGGTCAGTATGGCCCACAAGGTGGCTACCCCAGGCAGCCAAACTATAATGCCTTGCCCAATGCCAACTACCCCAGTGCAGGCATGGC
TGGAGGCATAAACCCCATGGGTGCCGGAGGTCAAATGCATGGACAGCCTGGCATCCCACCTTATGGCACACTCCCTCCAGGGAGGATGAG
TCACGCCTCCATGGGCAACCGGCCTTATGGCCCTAACATGGCCAATATGCCACCTCAGGTTGGGTCAGGGATGTGTCCCCCACCAGGGGG
CATGAACCGGAAAACCCAAGAAACTGCTGTCGCCATGCATGTTGCTGCCAACTCTATCCAAAACAGGCCGCCAGGCTACCCCAATATGAA
TCAAGGGGGCATGATGGGAACTGGACCTCCTTATGGACAAGGGATTAATAGTATGGCTGGCATGATCAACCCTCAGGGACCCCCATATTC
CATGGGTGGAACCATGGCCAACAATTCTGCAGGGATGGCAGCCAGCCCAGAGATGATGGGCCTTGGGGATGTAAAGTTAACTCCAGCCAC
CAAAATGAACAACAAGGCAGATGGGACACCCAAGACAGAATCCAAATCCAAGAAATCCAGTTCTTCTACTACAACCAATGAGAAGATCAC
CAAGTTGTATGAGCTGGGTGGTGAGCCTGAGAGGAAGATGTGGGTGGACCGTTATCTGGCCTTCACTGAGGAGAAGGCCATGGGCATGAC
AAATCTGCCTGCTGTGGGTAGGAAACCTCTGGACCTCTATCGCCTCTATGTGTCTGTGAAGGAGATTGGTGGATTGACTCAGGTCAACAA
GAACAAAAAATGGCGGGAACTTGCAACCAACCTCAATGTGGGCACATCAAGCAGTGCTGCCAGCTCCTTGAAAAAGCAGTATATCCAGTG
TCTCTATGCCTTTGAATGCAAGATTGAACGGGGAGAAGACCCTCCCCCAGACATCTTTGCAGCTGCTGATTCCAAGAAGTCCCAGCCCAA
GATCCAGCCTCCCTCTCCTGCGGGATCAGGATCTATGCAGGGGCCCCAGACTCCCCAGTCAACCAGCAGTTCCATGGCAGAAGGAGGAGA
CTTAAAGCCACCAACTCCAGCATCCACACCACACAGTCAGATCCCCCCATTGCCAGGCATGAGCAGGAGCAATTCAGTTGGGATCCAGGA
TGCCTTTAATGATGGAAGTGACTCCACATTCCAGAAGCGGAATTCCATGACTCCAAACCCTGGGTATCAGCCCAGTATGAATACCTCTGA
CATGATGGGGCGCATGTCCTATGAGCCAAATAAGGATCCTTATGGCAGCATGAGGAAAGCTCCAGGGAGTGATCCCTTCATGTCCTCAGG
GCAGGGCCCCAACGGCGGGATGGGTGACCCCTACAGTCGTGCTGCCGGCCCTGGGCTAGGAAATGTGGCGATGGGACCACGACAGCACTA
TCCCTATGGAGGTCCTTATGACAGAGTGAGGACGGAGCCTGGAATAGGGCCTGAGGGAAACATGAGCACTGGGGCCCCACAGCCGAATCT
CATGCCTTCCAACCCAGACTCGGGGATGTATTCTCCTAGCCGCTACCCCCCGCAGCAGCAGCAGCAGCAGCAGCAACGACATGATTCCTA
TGGCAATCAGTTCTCCACCCAAGGCACCCCTTCTGGCAGCCCCTTCCCCAGCCAGCAGACTACAATGTATCAACAGCAACAGCAGAATTA
CAAGCGGCCAATGGATGGCACATATGGCCCTCCTGCCAAGCGGCACGAAGGGGAGATGTACAGCGTGCCATACAGCACTGGGCAGGGGCA
GCCTCAGCAGCAGCAGTTGCCCCCAGCCCAGCCCCAGCCTGCCAGCCAGCAACAAGCTGCCCAGCCTTCCCCTCAGCAAGATGTATACAA
CCAGTATGGCAATGCCTATCCTGCCACTGCCACAGCTGCTACTGAGCGCCGACCAGCAGGCGGCCCCCAGAACCAATTTCCATTCCAGTT
TGGCCGAGACCGTGTCTCTGCACCCCCTGGCACCAATGCCCAGCAAAACATGCCACCACAAATGATGGGCGGCCCCATACAGGCATCAGC
TGAGGTTGCTCAGCAAGGCACCATGTGGCAGGGGCGTAATGACATGACCTATAATTATGCCAACAGGCAGAGCACGGGCTCTGCCCCCCA
GGGCCCCGCCTATCATGGCGTGAACCGAACAGATGAAATGCTGCACACAGATCAGAGGGCCAACCACGAAGGCTCGTGGCCTTCCCATGG
CACACGCCAGCCCCCATATGGTCCCTCTGCCCCTGTGCCCCCCATGACAAGGCCCCCTCCATCTAACTACCAGCCCCCACCAAGCATGCA
GAATCACATTCCTCAGGTATCCAGCCCTGCTCCCCTGCCCCGGCCAATGGAGAACCGCACCTCTCCTAGCAAGTCTCCATTCCTGCACTC
TGGGATGAAAATGCAGAAGGCAGGTCCCCCAGTACCTGCCTCGCACATAGCACCTGCCCCTGTGCAGCCCCCCATGATTCGGCGGGATAT
CACCTTCCCACCTGGCTCTGTTGAAGCCACACAGCCTGTGTTGAAGCAGAGGAGGCGGCTCACAATGAAAGACATTGGAACCCCGGAGGC
ATGGCGGGTAATGATGTCCCTCAAGTCTGGTCTCCTGGCAGAGAGCACATGGGCATTAGATACCATCAACATCCTGCTGTATGATGACAA
CAGCATCATGACCTTCAACCTCAGTCAGCTTTCCCCGCAGAGACTGGTCTTGGAAACCCTCAGCAAACTCAGCATCCAGGACAACAATGT
GGACCTGATTCTGGCCACACCCCCCTTCAGCCGCCTGGAGAAGTTGTATAGCACTATGGTGCGCTTCCTCAGTGACCGAAAGAACCCGGT
GTGCCGGGAGATGGCTGTGGTACTGCTGGCCAACCTGGCTCAGGGGGACAGCCTGGCAGCTCGTGCCATTGCAGTGCAGAAGGGCAGTAT
CGGCAACCTCCTGGGCTTCCTAGAGGACAGCCTTGCCGCCACACAGTTCCAGCAGAGCCAGGCCAGCCTCCTCCACATGCAGAACCCACC
CTTTGAGCCAACTAGTGTGGACATGATGCGGCGGGCTGCCCGCGCGCTGCTTGCCTTGGCCAAGGTGGACGAGAACCACTCAGAGTTTAC
TCTGTACGAATCACGGCTGTTGGACATCTCGGTATCACCGTTGATGAACTCATTGGTTTCACAAGTCATTTGTGATGTACTGTTTTTGAT
TGGCCAGTCATGACTGATATCCTGAAAACCTGTGTACCAGACCTAAGTGACAAGAGACTGGAAGTGGTTGGGCTGGAGGGTGCAATTGAG
ATGGGCCAAATCTATACCAAGCTCAAGAATGCTGGACGTCGGCTGGCCAAGTGCTCTGAGATCACCTTCCACACCACAAAAACCCTTCCC
ATGCAAATTGACGGAGAACCCTGGATGCAGACGCCCTGTACAATCAAGATCACCCACAAGAACCAGATGCCCATGCTCATGGGCCCACCC
CCCCGCTCCACCAATTTCTTTGGCTTCTTGAGCTAAGGGGGACACCCTTGGCCTCCAAGCCAGCCTTGAACCCACCTCCCTGTCCCTGGA
CTCTACTCCCGAGGCTCTGTACATTGCTGCCACATACTCCTGCCAGCTTGGGGGAGTGTTCCTTCACCCTCACAGTATTTATTATCCTGC
ACCACCTCACTGTTCCCCATGCGCACACACATACACACACCCCAAAACACATACATTGAAAGTGCCTCATCTGAATAAAATGACTTGTGT
TTCCCCTTTGGGA

>6372_6372_1_ARID1A-DGKA_ARID1A_chr1_27106722_ENST00000374152_DGKA_chr12_56346689_ENST00000331886_length(amino acids)=1499AA_BP=
MDQMGKMRPQPYGGTNPYSQQQGPPSGPQQGHGYPGQPYGSQTPQRYPMTMQGRAQSAMGGLSYTQQIPPYGQQGPSGYGQQGQTPYYNQ
QSPHPQQQQPPYSQQPPSQTPHAQPSYQQQPQSQPPQLQSSQPPYSQQPSQPPHQQSPAPYPSQQSTTQQHPQSQPPYSQPQAQSPYQQQ
QPQQPAPSTLSQQAAYPQPQSQQSQQTAYSQQRFPPPQELSQDSFGSQASSAPSMTSSKGGQEDMNLSLQSRPSSLPDLSGSIDDLPMGT
EGALSPGVSTSGISSSQGEQSNPAQSPFSPHTSPHLPGIRGPSPSPVGSPASVAQSRSGPLSPAAVPGNQMPPRPPSGQSDSIMHPSMNQ
SSIAQDRGYMQRNPQMPQYSSPQPGSALSPRQPSGGQIHTGMGSYQQNSMGSYGPQGGQYGPQGGYPRQPNYNALPNANYPSAGMAGGIN
PMGAGGQMHGQPGIPPYGTLPPGRMSHASMGNRPYGPNMANMPPQVGSGMCPPPGGMNRKTQETAVAMHVAANSIQNRPPGYPNMNQGGM
MGTGPPYGQGINSMAGMINPQGPPYSMGGTMANNSAGMAASPEMMGLGDVKLTPATKMNNKADGTPKTESKSKKSSSSTTTNEKITKLYE
LGGEPERKMWVDRYLAFTEEKAMGMTNLPAVGRKPLDLYRLYVSVKEIGGLTQVNKNKKWRELATNLNVGTSSSAASSLKKQYIQCLYAF
ECKIERGEDPPPDIFAAADSKKSQPKIQPPSPAGSGSMQGPQTPQSTSSSMAEGGDLKPPTPASTPHSQIPPLPGMSRSNSVGIQDAFND
GSDSTFQKRNSMTPNPGYQPSMNTSDMMGRMSYEPNKDPYGSMRKAPGSDPFMSSGQGPNGGMGDPYSRAAGPGLGNVAMGPRQHYPYGG
PYDRVRTEPGIGPEGNMSTGAPQPNLMPSNPDSGMYSPSRYPPQQQQQQQQRHDSYGNQFSTQGTPSGSPFPSQQTTMYQQQQQNYKRPM
DGTYGPPAKRHEGEMYSVPYSTGQGQPQQQQLPPAQPQPASQQQAAQPSPQQDVYNQYGNAYPATATAATERRPAGGPQNQFPFQFGRDR
VSAPPGTNAQQNMPPQMMGGPIQASAEVAQQGTMWQGRNDMTYNYANRQSTGSAPQGPAYHGVNRTDEMLHTDQRANHEGSWPSHGTRQP
PYGPSAPVPPMTRPPPSNYQPPPSMQNHIPQVSSPAPLPRPMENRTSPSKSPFLHSGMKMQKAGPPVPASHIAPAPVQPPMIRRDITFPP
GSVEATQPVLKQRRRLTMKDIGTPEAWRVMMSLKSGLLAESTWALDTINILLYDDNSIMTFNLSQLSPQRLVLETLSKLSIQDNNVDLIL
ATPPFSRLEKLYSTMVRFLSDRKNPVCREMAVVLLANLAQGDSLAARAIAVQKGSIGNLLGFLEDSLAATQFQQSQASLLHMQNPPFEPT
SVDMMRRAARALLALAKVDENHSEFTLYESRLLDISVSPLMNSLVSQVICDVLFLIGQS

--------------------------------------------------------------
>6372_6372_2_ARID1A-DGKA_ARID1A_chr1_27106722_ENST00000374152_DGKA_chr12_56346689_ENST00000394147_length(transcript)=5329nt_BP=4783nt
TGGATCTCAAGCAGTACCACAGTTACAAAGTAGTTTTTAGCTTACAAGGTGTTTTCACAAATAGGTGGTATTTTCATTTTTCAAATGACA
AAATTAGGGTTCTGAGGCGGGTCAGTTGACTTAAAGGTTACTAGGTTGGTCTCATTGCTCTTTCAAAGTAACTGTATTTCTTTATAGCAT
ACAGACTAAAAAAACCTGTGTACTTGGGTTATATATTCAGTGGCCAGAGGCCATCAAAGCTCAGGTTAATGAAATGCTCTTTATTTTGTA
GCCATCCAGTCCAATGGATCAGATGGGCAAGATGAGACCTCAGCCATATGGCGGGACTAACCCATACTCGCAGCAACAGGGACCTCCGTC
AGGACCGCAGCAAGGACATGGGTACCCAGGGCAGCCATACGGGTCCCAGACCCCGCAGCGGTACCCGATGACCATGCAGGGCCGGGCGCA
GAGTGCCATGGGCGGCCTCTCTTATACACAGCAGATTCCTCCTTATGGACAACAAGGCCCCAGCGGGTATGGTCAACAGGGCCAGACTCC
ATATTACAACCAGCAAAGTCCTCACCCTCAGCAGCAGCAGCCACCCTACTCCCAGCAACCACCGTCCCAGACCCCTCATGCCCAACCTTC
GTATCAGCAGCAGCCACAGTCTCAACCACCACAGCTCCAGTCCTCTCAGCCTCCATACTCCCAGCAGCCATCCCAGCCTCCACATCAGCA
GTCCCCGGCTCCATACCCCTCCCAGCAGTCGACGACACAGCAGCACCCCCAGAGCCAGCCCCCCTACTCACAGCCACAGGCTCAGTCTCC
TTACCAGCAGCAGCAACCTCAGCAGCCAGCACCCTCGACGCTCTCCCAGCAGGCTGCGTATCCTCAGCCCCAGTCTCAGCAGTCCCAGCA
AACTGCCTATTCCCAGCAGCGCTTCCCTCCACCGCAGGAGCTATCTCAAGATTCATTTGGGTCTCAGGCATCCTCAGCCCCCTCAATGAC
CTCCAGTAAGGGAGGGCAAGAAGATATGAACCTGAGCCTTCAGTCAAGACCCTCCAGCTTGCCTGATCTATCTGGTTCAATAGATGACCT
CCCCATGGGGACAGAAGGAGCTCTGAGTCCTGGAGTGAGCACATCAGGGATTTCCAGCAGCCAAGGAGAGCAGAGTAATCCAGCTCAGTC
TCCTTTCTCTCCTCATACCTCCCCTCACCTGCCTGGCATCCGAGGCCCTTCCCCGTCCCCTGTTGGCTCTCCCGCCAGTGTTGCTCAGTC
TCGCTCAGGACCACTCTCGCCTGCTGCAGTGCCAGGCAACCAGATGCCACCTCGGCCACCCAGTGGCCAGTCGGACAGCATCATGCATCC
TTCCATGAACCAATCAAGCATTGCCCAAGATCGAGGTTATATGCAGAGGAACCCCCAGATGCCCCAGTACAGTTCCCCCCAGCCCGGCTC
AGCCTTATCTCCGCGTCAGCCTTCCGGAGGACAGATACACACAGGCATGGGCTCCTACCAGCAGAACTCCATGGGGAGCTATGGTCCCCA
GGGGGGTCAGTATGGCCCACAAGGTGGCTACCCCAGGCAGCCAAACTATAATGCCTTGCCCAATGCCAACTACCCCAGTGCAGGCATGGC
TGGAGGCATAAACCCCATGGGTGCCGGAGGTCAAATGCATGGACAGCCTGGCATCCCACCTTATGGCACACTCCCTCCAGGGAGGATGAG
TCACGCCTCCATGGGCAACCGGCCTTATGGCCCTAACATGGCCAATATGCCACCTCAGGTTGGGTCAGGGATGTGTCCCCCACCAGGGGG
CATGAACCGGAAAACCCAAGAAACTGCTGTCGCCATGCATGTTGCTGCCAACTCTATCCAAAACAGGCCGCCAGGCTACCCCAATATGAA
TCAAGGGGGCATGATGGGAACTGGACCTCCTTATGGACAAGGGATTAATAGTATGGCTGGCATGATCAACCCTCAGGGACCCCCATATTC
CATGGGTGGAACCATGGCCAACAATTCTGCAGGGATGGCAGCCAGCCCAGAGATGATGGGCCTTGGGGATGTAAAGTTAACTCCAGCCAC
CAAAATGAACAACAAGGCAGATGGGACACCCAAGACAGAATCCAAATCCAAGAAATCCAGTTCTTCTACTACAACCAATGAGAAGATCAC
CAAGTTGTATGAGCTGGGTGGTGAGCCTGAGAGGAAGATGTGGGTGGACCGTTATCTGGCCTTCACTGAGGAGAAGGCCATGGGCATGAC
AAATCTGCCTGCTGTGGGTAGGAAACCTCTGGACCTCTATCGCCTCTATGTGTCTGTGAAGGAGATTGGTGGATTGACTCAGGTCAACAA
GAACAAAAAATGGCGGGAACTTGCAACCAACCTCAATGTGGGCACATCAAGCAGTGCTGCCAGCTCCTTGAAAAAGCAGTATATCCAGTG
TCTCTATGCCTTTGAATGCAAGATTGAACGGGGAGAAGACCCTCCCCCAGACATCTTTGCAGCTGCTGATTCCAAGAAGTCCCAGCCCAA
GATCCAGCCTCCCTCTCCTGCGGGATCAGGATCTATGCAGGGGCCCCAGACTCCCCAGTCAACCAGCAGTTCCATGGCAGAAGGAGGAGA
CTTAAAGCCACCAACTCCAGCATCCACACCACACAGTCAGATCCCCCCATTGCCAGGCATGAGCAGGAGCAATTCAGTTGGGATCCAGGA
TGCCTTTAATGATGGAAGTGACTCCACATTCCAGAAGCGGAATTCCATGACTCCAAACCCTGGGTATCAGCCCAGTATGAATACCTCTGA
CATGATGGGGCGCATGTCCTATGAGCCAAATAAGGATCCTTATGGCAGCATGAGGAAAGCTCCAGGGAGTGATCCCTTCATGTCCTCAGG
GCAGGGCCCCAACGGCGGGATGGGTGACCCCTACAGTCGTGCTGCCGGCCCTGGGCTAGGAAATGTGGCGATGGGACCACGACAGCACTA
TCCCTATGGAGGTCCTTATGACAGAGTGAGGACGGAGCCTGGAATAGGGCCTGAGGGAAACATGAGCACTGGGGCCCCACAGCCGAATCT
CATGCCTTCCAACCCAGACTCGGGGATGTATTCTCCTAGCCGCTACCCCCCGCAGCAGCAGCAGCAGCAGCAGCAACGACATGATTCCTA
TGGCAATCAGTTCTCCACCCAAGGCACCCCTTCTGGCAGCCCCTTCCCCAGCCAGCAGACTACAATGTATCAACAGCAACAGCAGAATTA
CAAGCGGCCAATGGATGGCACATATGGCCCTCCTGCCAAGCGGCACGAAGGGGAGATGTACAGCGTGCCATACAGCACTGGGCAGGGGCA
GCCTCAGCAGCAGCAGTTGCCCCCAGCCCAGCCCCAGCCTGCCAGCCAGCAACAAGCTGCCCAGCCTTCCCCTCAGCAAGATGTATACAA
CCAGTATGGCAATGCCTATCCTGCCACTGCCACAGCTGCTACTGAGCGCCGACCAGCAGGCGGCCCCCAGAACCAATTTCCATTCCAGTT
TGGCCGAGACCGTGTCTCTGCACCCCCTGGCACCAATGCCCAGCAAAACATGCCACCACAAATGATGGGCGGCCCCATACAGGCATCAGC
TGAGGTTGCTCAGCAAGGCACCATGTGGCAGGGGCGTAATGACATGACCTATAATTATGCCAACAGGCAGAGCACGGGCTCTGCCCCCCA
GGGCCCCGCCTATCATGGCGTGAACCGAACAGATGAAATGCTGCACACAGATCAGAGGGCCAACCACGAAGGCTCGTGGCCTTCCCATGG
CACACGCCAGCCCCCATATGGTCCCTCTGCCCCTGTGCCCCCCATGACAAGGCCCCCTCCATCTAACTACCAGCCCCCACCAAGCATGCA
GAATCACATTCCTCAGGTATCCAGCCCTGCTCCCCTGCCCCGGCCAATGGAGAACCGCACCTCTCCTAGCAAGTCTCCATTCCTGCACTC
TGGGATGAAAATGCAGAAGGCAGGTCCCCCAGTACCTGCCTCGCACATAGCACCTGCCCCTGTGCAGCCCCCCATGATTCGGCGGGATAT
CACCTTCCCACCTGGCTCTGTTGAAGCCACACAGCCTGTGTTGAAGCAGAGGAGGCGGCTCACAATGAAAGACATTGGAACCCCGGAGGC
ATGGCGGGTAATGATGTCCCTCAAGTCTGGTCTCCTGGCAGAGAGCACATGGGCATTAGATACCATCAACATCCTGCTGTATGATGACAA
CAGCATCATGACCTTCAACCTCAGTCAGCTTTCCCCGCAGAGACTGGTCTTGGAAACCCTCAGCAAACTCAGCATCCAGGACAACAATGT
GGACCTGATTCTGGCCACACCCCCCTTCAGCCGCCTGGAGAAGTTGTATAGCACTATGGTGCGCTTCCTCAGTGACCGAAAGAACCCGGT
GTGCCGGGAGATGGCTGTGGTACTGCTGGCCAACCTGGCTCAGGGGGACAGCCTGGCAGCTCGTGCCATTGCAGTGCAGAAGGGCAGTAT
CGGCAACCTCCTGGGCTTCCTAGAGGACAGCCTTGCCGCCACACAGTTCCAGCAGAGCCAGGCCAGCCTCCTCCACATGCAGAACCCACC
CTTTGAGCCAACTAGTGTGGACATGATGCGGCGGGCTGCCCGCGCGCTGCTTGCCTTGGCCAAGGTGGACGAGAACCACTCAGAGTTTAC
TCTGTACGAATCACGGCTGTTGGACATCTCGGTATCACCGTTGATGAACTCATTGGTTTCACAAGTCATTTGTGATGTACTGTTTTTGAT
TGGCCAGTCATGACTGATATCCTGAAAACCTGTGTACCAGACCTAAGTGACAAGAGACTGGAAGTGGTTGGGCTGGAGGGTGCAATTGAG
ATGGGCCAAATCTATACCAAGCTCAAGAATGCTGGACGTCGGCTGGCCAAGTGCTCTGAGATCACCTTCCACACCACAAAAACCCTTCCC
ATGCAAATTGACGGAGAACCCTGGATGCAGACGCCCTGTACAATCAAGATCACCCACAAGAACCAGATGCCCATGCTCATGGGCCCACCC
CCCCGCTCCACCAATTTCTTTGGCTTCTTGAGCTAAGGGGGACACCCTTGGCCTCCAAGCCAGCCTTGAACCCACCTCCCTGTCCCTGGA
CTCTACTCCCGAGGCTCTGTACATTGCTGCCACATACTCCTGCCAGCTTGGGGGAGTGTTCCTTCACCCTCACAGTATTTATTATCCTGC
ACCACCTCACTGTTCCCCATGCGCACACACATACACACACCCCAAAACACATACATTGAAAGTGCCTCATCTGAATAAAATGACTTGTGT
TTCCCCTTTGGGATCTGCT

>6372_6372_2_ARID1A-DGKA_ARID1A_chr1_27106722_ENST00000374152_DGKA_chr12_56346689_ENST00000394147_length(amino acids)=1499AA_BP=
MDQMGKMRPQPYGGTNPYSQQQGPPSGPQQGHGYPGQPYGSQTPQRYPMTMQGRAQSAMGGLSYTQQIPPYGQQGPSGYGQQGQTPYYNQ
QSPHPQQQQPPYSQQPPSQTPHAQPSYQQQPQSQPPQLQSSQPPYSQQPSQPPHQQSPAPYPSQQSTTQQHPQSQPPYSQPQAQSPYQQQ
QPQQPAPSTLSQQAAYPQPQSQQSQQTAYSQQRFPPPQELSQDSFGSQASSAPSMTSSKGGQEDMNLSLQSRPSSLPDLSGSIDDLPMGT
EGALSPGVSTSGISSSQGEQSNPAQSPFSPHTSPHLPGIRGPSPSPVGSPASVAQSRSGPLSPAAVPGNQMPPRPPSGQSDSIMHPSMNQ
SSIAQDRGYMQRNPQMPQYSSPQPGSALSPRQPSGGQIHTGMGSYQQNSMGSYGPQGGQYGPQGGYPRQPNYNALPNANYPSAGMAGGIN
PMGAGGQMHGQPGIPPYGTLPPGRMSHASMGNRPYGPNMANMPPQVGSGMCPPPGGMNRKTQETAVAMHVAANSIQNRPPGYPNMNQGGM
MGTGPPYGQGINSMAGMINPQGPPYSMGGTMANNSAGMAASPEMMGLGDVKLTPATKMNNKADGTPKTESKSKKSSSSTTTNEKITKLYE
LGGEPERKMWVDRYLAFTEEKAMGMTNLPAVGRKPLDLYRLYVSVKEIGGLTQVNKNKKWRELATNLNVGTSSSAASSLKKQYIQCLYAF
ECKIERGEDPPPDIFAAADSKKSQPKIQPPSPAGSGSMQGPQTPQSTSSSMAEGGDLKPPTPASTPHSQIPPLPGMSRSNSVGIQDAFND
GSDSTFQKRNSMTPNPGYQPSMNTSDMMGRMSYEPNKDPYGSMRKAPGSDPFMSSGQGPNGGMGDPYSRAAGPGLGNVAMGPRQHYPYGG
PYDRVRTEPGIGPEGNMSTGAPQPNLMPSNPDSGMYSPSRYPPQQQQQQQQRHDSYGNQFSTQGTPSGSPFPSQQTTMYQQQQQNYKRPM
DGTYGPPAKRHEGEMYSVPYSTGQGQPQQQQLPPAQPQPASQQQAAQPSPQQDVYNQYGNAYPATATAATERRPAGGPQNQFPFQFGRDR
VSAPPGTNAQQNMPPQMMGGPIQASAEVAQQGTMWQGRNDMTYNYANRQSTGSAPQGPAYHGVNRTDEMLHTDQRANHEGSWPSHGTRQP
PYGPSAPVPPMTRPPPSNYQPPPSMQNHIPQVSSPAPLPRPMENRTSPSKSPFLHSGMKMQKAGPPVPASHIAPAPVQPPMIRRDITFPP
GSVEATQPVLKQRRRLTMKDIGTPEAWRVMMSLKSGLLAESTWALDTINILLYDDNSIMTFNLSQLSPQRLVLETLSKLSIQDNNVDLIL
ATPPFSRLEKLYSTMVRFLSDRKNPVCREMAVVLLANLAQGDSLAARAIAVQKGSIGNLLGFLEDSLAATQFQQSQASLLHMQNPPFEPT
SVDMMRRAARALLALAKVDENHSEFTLYESRLLDISVSPLMNSLVSQVICDVLFLIGQS

--------------------------------------------------------------
>6372_6372_3_ARID1A-DGKA_ARID1A_chr1_27106722_ENST00000374152_DGKA_chr12_56346689_ENST00000551156_length(transcript)=5335nt_BP=4783nt
TGGATCTCAAGCAGTACCACAGTTACAAAGTAGTTTTTAGCTTACAAGGTGTTTTCACAAATAGGTGGTATTTTCATTTTTCAAATGACA
AAATTAGGGTTCTGAGGCGGGTCAGTTGACTTAAAGGTTACTAGGTTGGTCTCATTGCTCTTTCAAAGTAACTGTATTTCTTTATAGCAT
ACAGACTAAAAAAACCTGTGTACTTGGGTTATATATTCAGTGGCCAGAGGCCATCAAAGCTCAGGTTAATGAAATGCTCTTTATTTTGTA
GCCATCCAGTCCAATGGATCAGATGGGCAAGATGAGACCTCAGCCATATGGCGGGACTAACCCATACTCGCAGCAACAGGGACCTCCGTC
AGGACCGCAGCAAGGACATGGGTACCCAGGGCAGCCATACGGGTCCCAGACCCCGCAGCGGTACCCGATGACCATGCAGGGCCGGGCGCA
GAGTGCCATGGGCGGCCTCTCTTATACACAGCAGATTCCTCCTTATGGACAACAAGGCCCCAGCGGGTATGGTCAACAGGGCCAGACTCC
ATATTACAACCAGCAAAGTCCTCACCCTCAGCAGCAGCAGCCACCCTACTCCCAGCAACCACCGTCCCAGACCCCTCATGCCCAACCTTC
GTATCAGCAGCAGCCACAGTCTCAACCACCACAGCTCCAGTCCTCTCAGCCTCCATACTCCCAGCAGCCATCCCAGCCTCCACATCAGCA
GTCCCCGGCTCCATACCCCTCCCAGCAGTCGACGACACAGCAGCACCCCCAGAGCCAGCCCCCCTACTCACAGCCACAGGCTCAGTCTCC
TTACCAGCAGCAGCAACCTCAGCAGCCAGCACCCTCGACGCTCTCCCAGCAGGCTGCGTATCCTCAGCCCCAGTCTCAGCAGTCCCAGCA
AACTGCCTATTCCCAGCAGCGCTTCCCTCCACCGCAGGAGCTATCTCAAGATTCATTTGGGTCTCAGGCATCCTCAGCCCCCTCAATGAC
CTCCAGTAAGGGAGGGCAAGAAGATATGAACCTGAGCCTTCAGTCAAGACCCTCCAGCTTGCCTGATCTATCTGGTTCAATAGATGACCT
CCCCATGGGGACAGAAGGAGCTCTGAGTCCTGGAGTGAGCACATCAGGGATTTCCAGCAGCCAAGGAGAGCAGAGTAATCCAGCTCAGTC
TCCTTTCTCTCCTCATACCTCCCCTCACCTGCCTGGCATCCGAGGCCCTTCCCCGTCCCCTGTTGGCTCTCCCGCCAGTGTTGCTCAGTC
TCGCTCAGGACCACTCTCGCCTGCTGCAGTGCCAGGCAACCAGATGCCACCTCGGCCACCCAGTGGCCAGTCGGACAGCATCATGCATCC
TTCCATGAACCAATCAAGCATTGCCCAAGATCGAGGTTATATGCAGAGGAACCCCCAGATGCCCCAGTACAGTTCCCCCCAGCCCGGCTC
AGCCTTATCTCCGCGTCAGCCTTCCGGAGGACAGATACACACAGGCATGGGCTCCTACCAGCAGAACTCCATGGGGAGCTATGGTCCCCA
GGGGGGTCAGTATGGCCCACAAGGTGGCTACCCCAGGCAGCCAAACTATAATGCCTTGCCCAATGCCAACTACCCCAGTGCAGGCATGGC
TGGAGGCATAAACCCCATGGGTGCCGGAGGTCAAATGCATGGACAGCCTGGCATCCCACCTTATGGCACACTCCCTCCAGGGAGGATGAG
TCACGCCTCCATGGGCAACCGGCCTTATGGCCCTAACATGGCCAATATGCCACCTCAGGTTGGGTCAGGGATGTGTCCCCCACCAGGGGG
CATGAACCGGAAAACCCAAGAAACTGCTGTCGCCATGCATGTTGCTGCCAACTCTATCCAAAACAGGCCGCCAGGCTACCCCAATATGAA
TCAAGGGGGCATGATGGGAACTGGACCTCCTTATGGACAAGGGATTAATAGTATGGCTGGCATGATCAACCCTCAGGGACCCCCATATTC
CATGGGTGGAACCATGGCCAACAATTCTGCAGGGATGGCAGCCAGCCCAGAGATGATGGGCCTTGGGGATGTAAAGTTAACTCCAGCCAC
CAAAATGAACAACAAGGCAGATGGGACACCCAAGACAGAATCCAAATCCAAGAAATCCAGTTCTTCTACTACAACCAATGAGAAGATCAC
CAAGTTGTATGAGCTGGGTGGTGAGCCTGAGAGGAAGATGTGGGTGGACCGTTATCTGGCCTTCACTGAGGAGAAGGCCATGGGCATGAC
AAATCTGCCTGCTGTGGGTAGGAAACCTCTGGACCTCTATCGCCTCTATGTGTCTGTGAAGGAGATTGGTGGATTGACTCAGGTCAACAA
GAACAAAAAATGGCGGGAACTTGCAACCAACCTCAATGTGGGCACATCAAGCAGTGCTGCCAGCTCCTTGAAAAAGCAGTATATCCAGTG
TCTCTATGCCTTTGAATGCAAGATTGAACGGGGAGAAGACCCTCCCCCAGACATCTTTGCAGCTGCTGATTCCAAGAAGTCCCAGCCCAA
GATCCAGCCTCCCTCTCCTGCGGGATCAGGATCTATGCAGGGGCCCCAGACTCCCCAGTCAACCAGCAGTTCCATGGCAGAAGGAGGAGA
CTTAAAGCCACCAACTCCAGCATCCACACCACACAGTCAGATCCCCCCATTGCCAGGCATGAGCAGGAGCAATTCAGTTGGGATCCAGGA
TGCCTTTAATGATGGAAGTGACTCCACATTCCAGAAGCGGAATTCCATGACTCCAAACCCTGGGTATCAGCCCAGTATGAATACCTCTGA
CATGATGGGGCGCATGTCCTATGAGCCAAATAAGGATCCTTATGGCAGCATGAGGAAAGCTCCAGGGAGTGATCCCTTCATGTCCTCAGG
GCAGGGCCCCAACGGCGGGATGGGTGACCCCTACAGTCGTGCTGCCGGCCCTGGGCTAGGAAATGTGGCGATGGGACCACGACAGCACTA
TCCCTATGGAGGTCCTTATGACAGAGTGAGGACGGAGCCTGGAATAGGGCCTGAGGGAAACATGAGCACTGGGGCCCCACAGCCGAATCT
CATGCCTTCCAACCCAGACTCGGGGATGTATTCTCCTAGCCGCTACCCCCCGCAGCAGCAGCAGCAGCAGCAGCAACGACATGATTCCTA
TGGCAATCAGTTCTCCACCCAAGGCACCCCTTCTGGCAGCCCCTTCCCCAGCCAGCAGACTACAATGTATCAACAGCAACAGCAGAATTA
CAAGCGGCCAATGGATGGCACATATGGCCCTCCTGCCAAGCGGCACGAAGGGGAGATGTACAGCGTGCCATACAGCACTGGGCAGGGGCA
GCCTCAGCAGCAGCAGTTGCCCCCAGCCCAGCCCCAGCCTGCCAGCCAGCAACAAGCTGCCCAGCCTTCCCCTCAGCAAGATGTATACAA
CCAGTATGGCAATGCCTATCCTGCCACTGCCACAGCTGCTACTGAGCGCCGACCAGCAGGCGGCCCCCAGAACCAATTTCCATTCCAGTT
TGGCCGAGACCGTGTCTCTGCACCCCCTGGCACCAATGCCCAGCAAAACATGCCACCACAAATGATGGGCGGCCCCATACAGGCATCAGC
TGAGGTTGCTCAGCAAGGCACCATGTGGCAGGGGCGTAATGACATGACCTATAATTATGCCAACAGGCAGAGCACGGGCTCTGCCCCCCA
GGGCCCCGCCTATCATGGCGTGAACCGAACAGATGAAATGCTGCACACAGATCAGAGGGCCAACCACGAAGGCTCGTGGCCTTCCCATGG
CACACGCCAGCCCCCATATGGTCCCTCTGCCCCTGTGCCCCCCATGACAAGGCCCCCTCCATCTAACTACCAGCCCCCACCAAGCATGCA
GAATCACATTCCTCAGGTATCCAGCCCTGCTCCCCTGCCCCGGCCAATGGAGAACCGCACCTCTCCTAGCAAGTCTCCATTCCTGCACTC
TGGGATGAAAATGCAGAAGGCAGGTCCCCCAGTACCTGCCTCGCACATAGCACCTGCCCCTGTGCAGCCCCCCATGATTCGGCGGGATAT
CACCTTCCCACCTGGCTCTGTTGAAGCCACACAGCCTGTGTTGAAGCAGAGGAGGCGGCTCACAATGAAAGACATTGGAACCCCGGAGGC
ATGGCGGGTAATGATGTCCCTCAAGTCTGGTCTCCTGGCAGAGAGCACATGGGCATTAGATACCATCAACATCCTGCTGTATGATGACAA
CAGCATCATGACCTTCAACCTCAGTCAGCTTTCCCCGCAGAGACTGGTCTTGGAAACCCTCAGCAAACTCAGCATCCAGGACAACAATGT
GGACCTGATTCTGGCCACACCCCCCTTCAGCCGCCTGGAGAAGTTGTATAGCACTATGGTGCGCTTCCTCAGTGACCGAAAGAACCCGGT
GTGCCGGGAGATGGCTGTGGTACTGCTGGCCAACCTGGCTCAGGGGGACAGCCTGGCAGCTCGTGCCATTGCAGTGCAGAAGGGCAGTAT
CGGCAACCTCCTGGGCTTCCTAGAGGACAGCCTTGCCGCCACACAGTTCCAGCAGAGCCAGGCCAGCCTCCTCCACATGCAGAACCCACC
CTTTGAGCCAACTAGTGTGGACATGATGCGGCGGGCTGCCCGCGCGCTGCTTGCCTTGGCCAAGGTGGACGAGAACCACTCAGAGTTTAC
TCTGTACGAATCACGGCTGTTGGACATCTCGGTATCACCGTTGATGAACTCATTGGTTTCACAAGTCATTTGTGATGTACTGTTTTTGAT
TGGCCAGTCATGACTGATATCCTGAAAACCTGTGTACCAGACCTAAGTGACAAGAGACTGGAAGTGGTTGGGCTGGAGGGTGCAATTGAG
ATGGGCCAAATCTATACCAAGCTCAAGAATGCTGGACGTCGGCTGGCCAAGTGCTCTGAGATCACCTTCCACACCACAAAAACCCTTCCC
ATGCAAATTGACGGAGAACCCTGGATGCAGACGCCCTGTACAATCAAGATCACCCACAAGAACCAGATGCCCATGCTCATGGGCCCACCC
CCCCGCTCCACCAATTTCTTTGGCTTCTTGAGCTAAGGGGGACACCCTTGGCCTCCAAGCCAGCCTTGAACCCACCTCCCTGTCCCTGGA
CTCTACTCCCGAGGCTCTGTACATTGCTGCCACATACTCCTGCCAGCTTGGGGGAGTGTTCCTTCACCCTCACAGTATTTATTATCCTGC
ACCACCTCACTGTTCCCCATGCGCACACACATACACACACCCCAAAACACATACATTGAAAGTGCCTCATCTGAATAAAATGACTTGTGT
TTCCCCTTTGGGATCTGCTAAGTAA

>6372_6372_3_ARID1A-DGKA_ARID1A_chr1_27106722_ENST00000374152_DGKA_chr12_56346689_ENST00000551156_length(amino acids)=1499AA_BP=
MDQMGKMRPQPYGGTNPYSQQQGPPSGPQQGHGYPGQPYGSQTPQRYPMTMQGRAQSAMGGLSYTQQIPPYGQQGPSGYGQQGQTPYYNQ
QSPHPQQQQPPYSQQPPSQTPHAQPSYQQQPQSQPPQLQSSQPPYSQQPSQPPHQQSPAPYPSQQSTTQQHPQSQPPYSQPQAQSPYQQQ
QPQQPAPSTLSQQAAYPQPQSQQSQQTAYSQQRFPPPQELSQDSFGSQASSAPSMTSSKGGQEDMNLSLQSRPSSLPDLSGSIDDLPMGT
EGALSPGVSTSGISSSQGEQSNPAQSPFSPHTSPHLPGIRGPSPSPVGSPASVAQSRSGPLSPAAVPGNQMPPRPPSGQSDSIMHPSMNQ
SSIAQDRGYMQRNPQMPQYSSPQPGSALSPRQPSGGQIHTGMGSYQQNSMGSYGPQGGQYGPQGGYPRQPNYNALPNANYPSAGMAGGIN
PMGAGGQMHGQPGIPPYGTLPPGRMSHASMGNRPYGPNMANMPPQVGSGMCPPPGGMNRKTQETAVAMHVAANSIQNRPPGYPNMNQGGM
MGTGPPYGQGINSMAGMINPQGPPYSMGGTMANNSAGMAASPEMMGLGDVKLTPATKMNNKADGTPKTESKSKKSSSSTTTNEKITKLYE
LGGEPERKMWVDRYLAFTEEKAMGMTNLPAVGRKPLDLYRLYVSVKEIGGLTQVNKNKKWRELATNLNVGTSSSAASSLKKQYIQCLYAF
ECKIERGEDPPPDIFAAADSKKSQPKIQPPSPAGSGSMQGPQTPQSTSSSMAEGGDLKPPTPASTPHSQIPPLPGMSRSNSVGIQDAFND
GSDSTFQKRNSMTPNPGYQPSMNTSDMMGRMSYEPNKDPYGSMRKAPGSDPFMSSGQGPNGGMGDPYSRAAGPGLGNVAMGPRQHYPYGG
PYDRVRTEPGIGPEGNMSTGAPQPNLMPSNPDSGMYSPSRYPPQQQQQQQQRHDSYGNQFSTQGTPSGSPFPSQQTTMYQQQQQNYKRPM
DGTYGPPAKRHEGEMYSVPYSTGQGQPQQQQLPPAQPQPASQQQAAQPSPQQDVYNQYGNAYPATATAATERRPAGGPQNQFPFQFGRDR
VSAPPGTNAQQNMPPQMMGGPIQASAEVAQQGTMWQGRNDMTYNYANRQSTGSAPQGPAYHGVNRTDEMLHTDQRANHEGSWPSHGTRQP
PYGPSAPVPPMTRPPPSNYQPPPSMQNHIPQVSSPAPLPRPMENRTSPSKSPFLHSGMKMQKAGPPVPASHIAPAPVQPPMIRRDITFPP
GSVEATQPVLKQRRRLTMKDIGTPEAWRVMMSLKSGLLAESTWALDTINILLYDDNSIMTFNLSQLSPQRLVLETLSKLSIQDNNVDLIL
ATPPFSRLEKLYSTMVRFLSDRKNPVCREMAVVLLANLAQGDSLAARAIAVQKGSIGNLLGFLEDSLAATQFQQSQASLLHMQNPPFEPT
SVDMMRRAARALLALAKVDENHSEFTLYESRLLDISVSPLMNSLVSQVICDVLFLIGQS

--------------------------------------------------------------

Top

Fusion Gene PPI Analysis for ARID1A-DGKA

Go to ChiPPI (Chimeric Protein-Protein interactions) to see the chimeric PPI interaction in
ChiPPI page.

Protein-protein interactors with each fusion partner protein in wild-type (BIOGRID-3.4.160)

Hgene

Hgene's interactors

Tgene

Tgene's interactors

- Retained PPIs in in-frame fusion.

Partner

Gene

Hbp

Tbp

ENST

Strand

BPexon

TotalExon

Protein feature loci

*BPloci

TotalLen

Still interaction with

- Lost PPIs in in-frame fusion.

Partner

Gene

Hbp

Tbp

ENST

Strand

BPexon

TotalExon

Protein feature loci

*BPloci

TotalLen

Interaction lost with

- Retained PPIs, but lost function due to frame-shift fusion.

Partner

Gene

Hbp

Tbp

ENST

Strand

BPexon

TotalExon

Protein feature loci

*BPloci

TotalLen

Interaction lost with

Top

Related Drugs for ARID1A-DGKA

Drugs targeting genes involved in this fusion gene.
(DrugBank Version 5.1.8 2021-05-08)

Partner

Gene

UniProtAcc

DrugBank ID

Drug name

Drug activity

Drug type

Drug status

Top

Related Diseases for ARID1A-DGKA

Diseases associated with fusion partners.
(DisGeNet 4.0)

Partner	Gene	Disease ID	Disease name	# pubmeds	Source
Hgene	ARID1A	C0024623	Malignant neoplasm of stomach	3	CTD_human
Hgene	ARID1A	C0038356	Stomach Neoplasms	3	CTD_human
Hgene	ARID1A	C1708349	Hereditary Diffuse Gastric Cancer	3	CTD_human
Hgene	ARID1A	C2239176	Liver carcinoma	3	CTD_human
Hgene	ARID1A	C0033578	Prostatic Neoplasms	2	CTD_human
Hgene	ARID1A	C0376358	Malignant neoplasm of prostate	2	CTD_human
Hgene	ARID1A	C0001418	Adenocarcinoma	1	CTD_human
Hgene	ARID1A	C0005684	Malignant neoplasm of urinary bladder	1	CTD_human
Hgene	ARID1A	C0005695	Bladder Neoplasm	1	CTD_human
Hgene	ARID1A	C0006413	Burkitt Lymphoma	1	CTD_human
Hgene	ARID1A	C0007138	Carcinoma, Transitional Cell	1	CTD_human
Hgene	ARID1A	C0009402	Colorectal Carcinoma	1	CTD_human
Hgene	ARID1A	C0009404	Colorectal Neoplasms	1	CTD_human
Hgene	ARID1A	C0010606	Adenoid Cystic Carcinoma	1	CTD_human
Hgene	ARID1A	C0014170	Endometrial Neoplasms	1	CTD_human
Hgene	ARID1A	C0027708	Nephroblastoma	1	CTD_human
Hgene	ARID1A	C0027819	Neuroblastoma	1	CTD_human
Hgene	ARID1A	C0036920	Sezary Syndrome	1	CTD_human
Hgene	ARID1A	C0079772	T-Cell Lymphoma	1	CTD_human
Hgene	ARID1A	C0079773	Lymphoma, T-Cell, Cutaneous	1	CTD_human
Hgene	ARID1A	C0205641	Adenocarcinoma, Basal Cell	1	CTD_human
Hgene	ARID1A	C0205642	Adenocarcinoma, Oxyphilic	1	CTD_human
Hgene	ARID1A	C0205643	Carcinoma, Cribriform	1	CTD_human
Hgene	ARID1A	C0205644	Carcinoma, Granular Cell	1	CTD_human
Hgene	ARID1A	C0205645	Adenocarcinoma, Tubular	1	CTD_human
Hgene	ARID1A	C0206656	Embryonal Rhabdomyosarcoma	1	CTD_human
Hgene	ARID1A	C0206698	Cholangiocarcinoma	1	CTD_human
Hgene	ARID1A	C0265338	Coffin-Siris syndrome	1	CTD_human;GENOMICS_ENGLAND
Hgene	ARID1A	C0279628	Adenocarcinoma Of Esophagus	1	CTD_human
Hgene	ARID1A	C0343640	African Burkitt's lymphoma	1	CTD_human
Hgene	ARID1A	C0345905	Intrahepatic Cholangiocarcinoma	1	CTD_human
Hgene	ARID1A	C0376407	Granulomatous Slack Skin	1	CTD_human
Hgene	ARID1A	C0476089	Endometrial Carcinoma	1	CTD_human
Hgene	ARID1A	C0920269	Microsatellite Instability	1	CTD_human
Hgene	ARID1A	C1721098	Replication Error Phenotype	1	CTD_human
Hgene	ARID1A	C2930471	Bilateral Wilms Tumor	1	CTD_human
Hgene	ARID1A	C2931822	Nasopharyngeal carcinoma	1	CTD_human
Hgene	ARID1A	C3805278	Extrahepatic Cholangiocarcinoma	1	CTD_human
Hgene	ARID1A	C4721444	Burkitt Leukemia	1	CTD_human

Fusion Gene Studies in Kim Lab

Fusion gene:ARID1A-DGKA (FusionGDB2 ID:HG8289TG1606)

Fusion Gene Summary for ARID1A-DGKA

Fusion Gene ORF analysis for ARID1A-DGKA

Fusion Genomic Features for ARID1A-DGKA

Fusion Protein Features for ARID1A-DGKA

Fusion Gene Sequence for ARID1A-DGKA

Fusion Gene PPI Analysis for ARID1A-DGKA

Related Drugs for ARID1A-DGKA

Related Diseases for ARID1A-DGKA

Fusion Gene Studies
in Kim Lab