Home

Download

Statistics

Examples

Help

Contact

	Fusion Gene Summary
	Fusion Gene ORF analysis
	Fusion Genomic Features
	Fusion Protein Features
	Fusion Gene Sequence
	Fusion Gene PPI analysis
	Related Drugs
	Related Diseases

Fusion gene:PTPN18-ARID1A (FusionGDB2 ID:69797)

Fusion Gene Summary for PTPN18-ARID1A

Fusion gene summary

Fusion gene information	Fusion gene name: PTPN18-ARID1A
	Fusion gene ID: 69797
		Hgene	Tgene
	Gene symbol	PTPN18	ARID1A
	Gene ID	26469	8289
	Gene name	protein tyrosine phosphatase non-receptor type 18	AT-rich interaction domain 1A
	Synonyms	BDP1\|PTP-HSCF	B120\|BAF250\|BAF250a\|BM029\|C1orf4\|CSS2\|ELD\|MRD14\|OSA1\|P270\|SMARCF1\|hELD\|hOSA1
	Cytomap	2q21.1	1p36.11
	Type of gene	protein-coding	protein-coding
	Description	tyrosine-protein phosphatase non-receptor type 18brain-derived phosphataseprotein tyrosine phosphatase, non-receptor type 18 (brain-derived)	AT-rich interactive domain-containing protein 1AARID domain-containing protein 1AAT rich interactive domain 1A (SWI-like)BRG1-associated factor 250aOSA1 nuclear proteinSWI-like proteinSWI/SNF complex protein p270SWI/SNF-related, matrix-associated,
	Modification date	20200313	20200329
	UniProtAcc	Q99952	O14497
	Ensembl transtripts involved in fusion gene	ENST00000175756, ENST00000347849, ENST00000420717,	ENST00000324856, ENST00000457599, ENST00000374152, ENST00000540690,
Fusion gene scores	* DoF score	4 X 4 X 2=32	13 X 16 X 6=1248
	# samples	4	17
	** MAII score	log2(4/32*10)=0.321928094887362 effective Gene in Pan-Cancer Fusion Genes (eGinPCFGs). DoF>8 and MAII>0	log2(17/1248*10)=-2.87601128272455 possibly effective Gene in Pan-Cancer Fusion Genes (peGinPCFGs). DoF>8 and MAII<0
Context	PubMed: PTPN18 [Title/Abstract] AND ARID1A [Title/Abstract] AND fusion [Title/Abstract]
Most frequent breakpoint	PTPN18(131117219)-ARID1A(27056142), # samples:1
Anticipated loss of major functional domain due to fusion event.

* DoF score (Degree of Frequency) = # partners X # break points X # cancer types
** MAII score (Major Active Isofusion Index) = log2(# samples/DoF score*10)

Gene ontology of each fusion partner gene with evidence of Inferred from Direct Assay (IDA) from Entrez

Partner	Gene	GO ID	GO term	PubMed ID
Tgene	ARID1A	GO:0006337	nucleosome disassembly	8895581
Tgene	ARID1A	GO:0006338	chromatin remodeling	11726552
Tgene	ARID1A	GO:0030520	intracellular estrogen receptor signaling pathway	12200431
Tgene	ARID1A	GO:0030521	androgen receptor signaling pathway	12200431
Tgene	ARID1A	GO:0042921	glucocorticoid receptor signaling pathway	12200431
Tgene	ARID1A	GO:0045893	positive regulation of transcription, DNA-templated	12200431

Fusion gene breakpoints across PTPN18 (5'-gene)
* Click on the image to open the UCSC genome browser with custom track showing this image in a new window.

Fusion gene breakpoints across ARID1A (3'-gene)
* Click on the image to open the UCSC genome browser with custom track showing this image in a new window.

Fusion gene information from two resources (ChiTars 5.0 and ChimerDB 4.0)
* All genome coordinats were lifted-over on hg19.
* Click on the break point to see the gene structure around the break point region using the UCSC Genome Browser.

Source	Disease	Sample	Hgene	Hchr	Hbp	Hstrand	Tgene	Tchr	Tbp	Tstrand
ChimerDB4	Non-Cancer	TCGA-BR-7851-11A	PTPN18	chr2	131117219	+	ARID1A	chr1	27056142	+

Top

Fusion Gene ORF analysis for PTPN18-ARID1A

Open reading frame (ORF) analsis of fusion genes based on Ensembl gene isoform structure.
* Click on the break point to see the gene structure around the break point region using the UCSC Genome Browser.

ORF	Henst	Tenst	Hgene	Hchr	Hbp	Hstrand	Tgene	Tchr	Tbp	Tstrand
In-frame	ENST00000175756	ENST00000324856	PTPN18	chr2	131117219	+	ARID1A	chr1	27056142	+
In-frame	ENST00000175756	ENST00000457599	PTPN18	chr2	131117219	+	ARID1A	chr1	27056142	+
5CDS-5UTR	ENST00000175756	ENST00000374152	PTPN18	chr2	131117219	+	ARID1A	chr1	27056142	+
5CDS-intron	ENST00000175756	ENST00000540690	PTPN18	chr2	131117219	+	ARID1A	chr1	27056142	+
intron-3CDS	ENST00000347849	ENST00000324856	PTPN18	chr2	131117219	+	ARID1A	chr1	27056142	+
intron-3CDS	ENST00000347849	ENST00000457599	PTPN18	chr2	131117219	+	ARID1A	chr1	27056142	+
intron-5UTR	ENST00000347849	ENST00000374152	PTPN18	chr2	131117219	+	ARID1A	chr1	27056142	+
intron-intron	ENST00000347849	ENST00000540690	PTPN18	chr2	131117219	+	ARID1A	chr1	27056142	+
3UTR-3CDS	ENST00000420717	ENST00000324856	PTPN18	chr2	131117219	+	ARID1A	chr1	27056142	+
3UTR-3CDS	ENST00000420717	ENST00000457599	PTPN18	chr2	131117219	+	ARID1A	chr1	27056142	+
3UTR-5UTR	ENST00000420717	ENST00000374152	PTPN18	chr2	131117219	+	ARID1A	chr1	27056142	+
3UTR-intron	ENST00000420717	ENST00000540690	PTPN18	chr2	131117219	+	ARID1A	chr1	27056142	+

ORFfinder result based on the fusion transcript sequence of in-frame fusion genes.

Henst

Tenst

Hgene

Hchr

Hbp

Hstrand

Tgene

Tchr

Tbp

Tstrand

Seq length
(transcript)

BP loci
(transcript)

Predicted start
(transcript)

Predicted stop
(transcript)

Seq length
(amino acids)

ENST00000175756

PTPN18

chr2

131117219

ENST00000324856

ARID1A

chr1

27056142

7584

515

6235

2050

ENST00000175756

PTPN18

chr2

131117219

ENST00000457599

ARID1A

chr1

27056142

5646

515

5584

1833

DeepORF prediction of the coding potential based on the fusion transcript sequence of in-frame fusion genes. DeepORF is a coding potential classifier based on convolutional neural network by comparing the real Ribo-seq data. If the no-coding score < 0.5 and coding score > 0.5, then the in-frame fusion transcript is predicted as being likely translated.

Henst	Tenst	Hgene	Hchr	Hbp	Hstrand	Tgene	Tchr	Tbp	Tstrand	No-coding score	Coding score
ENST00000175756	ENST00000324856	PTPN18	chr2	131117219	+	ARID1A	chr1	27056142	+	0.003965035	0.9960349
ENST00000175756	ENST00000457599	PTPN18	chr2	131117219	+	ARID1A	chr1	27056142	+	0.007187977	0.992812

Top

Fusion Genomic Features for PTPN18-ARID1A

FusionAI prediction of the potential fusion gene breakpoint based on the pre-mature RNA sequence context (+/- 5kb of individual partner genes, total 20kb length sequence). FusionAI is a fusion gene breakpoint classifier based on convolutional neural network by comparing the fusion positive and negative sequence context of ~ 20K fusion gene data. From here, we can have the relative potentency of the 20K genomic sequence how individual sequnce will be likely used as the gene fusion breakpoints.

Hgene	Hchr	Hbp	Hstrand	Tgene	Tchr	Tbp	Tstrand	1-p	p (fusion gene breakpoint)
PTPN18	chr2	131117219	+	ARID1A	chr1	27056141	+	0.000148124	0.9998518
PTPN18	chr2	131117219	+	ARID1A	chr1	27056141	+	0.000148124	0.9998518

Distribution of 44 human genomic features loci across 20kb length fusion breakpoint regions. We integrated a total of 44 different types of human genomic feature loci information across five big categories including virus integration sites, repeats, structural variants, chromatin states, and gene expression regulation. More details are in help page.

Distribution of 44 human genomic features loci across 20kb length fusion breakpoint regions that are ovelapped with the top 1% feature importance score regions. More details are in help page.

Top

Fusion Protein Features for PTPN18-ARID1A

Go to
FGviewer for the breakpoints of chr2:131117219-chr1:27056142
.
- FGviewer provides the online visualization of the retention search of the protein functional features across DNA, RNA, protein, and pathological levels.

Main function of each fusion partner protein. (from UniProt)

Hgene	Tgene
PTPN18 Q99952	ARID1A O14497
FUNCTION: Differentially dephosphorylate autophosphorylated tyrosine kinases which are known to be overexpressed in tumor tissues.	FUNCTION: Involved in transcriptional activation and repression of select genes by chromatin remodeling (alteration of DNA-nucleosome topology). Component of SWI/SNF chromatin remodeling complexes that carry out key enzymatic activities, changing chromatin structure by altering DNA-histone contacts within a nucleosome in an ATP-dependent manner. Binds DNA non-specifically. Belongs to the neural progenitors-specific chromatin remodeling complex (npBAF complex) and the neuron-specific chromatin remodeling complex (nBAF complex). During neural development a switch from a stem/progenitor to a postmitotic chromatin remodeling mechanism occurs as neurons exit the cell cycle and become committed to their adult state. The transition from proliferating neural stem/progenitor cells to postmitotic neurons requires a switch in subunit composition of the npBAF and nBAF complexes. As neural progenitors exit mitosis and differentiate into neurons, npBAF complexes which contain ACTL6A/BAF53A and PHF10/BAF45A, are exchanged for homologous alternative ACTL6B/BAF53B and DPF1/BAF45B or DPF3/BAF45C subunits in neuron-specific complexes (nBAF). The npBAF complex is essential for the self-renewal/proliferative capacity of the multipotent neural stem cells. The nBAF complex along with CREST plays a role regulating the activity of genes essential for dendrite growth (By similarity). {ECO:0000250\|UniProtKB:A2BH40, ECO:0000303\|PubMed:12672490, ECO:0000303\|PubMed:22952240, ECO:0000303\|PubMed:26601204}.

Retention analysis result of each fusion partner protein across 39 protein features of UniProt such as six molecule processing features, 13 region features, four site features, six amino acid modification features, two natural variation features, five experimental info features, and 3 secondary structure features. Here, because of limited space for viewing, we only show the protein feature retention information belong to the 13 regional features. All retention annotation result can be downloaded at
download page

* Minus value of BPloci means that the break pointn is located before the CDS.

- In-frame and retained protein feature among the 13 regional features.

Partner

Gene

Hbp

Tbp

ENST

Strand

BPexon

TotalExon

Protein feature loci

*BPloci

TotalLen

Protein feature

Protein feature note

Tgene

ARID1A

chr2:131117219

chr1:27056142

ENST00000324856

1327_1404

379.0

2286.0

Compositional bias

Note=Gln-rich

Tgene

ARID1A

chr2:131117219

chr1:27056142

ENST00000324856

479_482

379.0

2286.0

Compositional bias

Note=Poly-Gln

Tgene

ARID1A

chr2:131117219

chr1:27056142

ENST00000324856

561_567

379.0

2286.0

Compositional bias

Note=Poly-Gln

Tgene

ARID1A

chr2:131117219

chr1:27056142

ENST00000324856

998_1001

379.0

2286.0

Compositional bias

Note=Poly-Ser

Tgene

ARID1A

chr2:131117219

chr1:27056142

ENST00000374152

1327_1404

1903.0

Compositional bias

Note=Gln-rich

Tgene

ARID1A

chr2:131117219

chr1:27056142

ENST00000374152

479_482

1903.0

Compositional bias

Note=Poly-Gln

Tgene

ARID1A

chr2:131117219

chr1:27056142

ENST00000374152

561_567

1903.0

Compositional bias

Note=Poly-Gln

Tgene

ARID1A

chr2:131117219

chr1:27056142

ENST00000374152

998_1001

1903.0

Compositional bias

Note=Poly-Ser

Tgene

ARID1A

chr2:131117219

chr1:27056142

ENST00000457599

1327_1404

379.0

2069.0

Compositional bias

Note=Gln-rich

Tgene

ARID1A

chr2:131117219

chr1:27056142

ENST00000457599

479_482

379.0

2069.0

Compositional bias

Note=Poly-Gln

Tgene

ARID1A

chr2:131117219

chr1:27056142

ENST00000457599

561_567

379.0

2069.0

Compositional bias

Note=Poly-Gln

Tgene

ARID1A

chr2:131117219

chr1:27056142

ENST00000457599

998_1001

379.0

2069.0

Compositional bias

Note=Poly-Ser

Tgene

ARID1A

chr2:131117219

chr1:27056142

ENST00000324856

1017_1108

379.0

2286.0

Domain

ARID

Tgene

ARID1A

chr2:131117219

chr1:27056142

ENST00000374152

1017_1108

1903.0

Domain

ARID

Tgene

ARID1A

chr2:131117219

chr1:27056142

ENST00000457599

1017_1108

379.0

2069.0

Domain

ARID

Tgene

ARID1A

chr2:131117219

chr1:27056142

ENST00000324856

1368_1387

379.0

2286.0

Motif

Nuclear localization signal

Tgene

ARID1A

chr2:131117219

chr1:27056142

ENST00000324856

1709_1713

379.0

2286.0

Motif

Note=LXXLL

Tgene

ARID1A

chr2:131117219

chr1:27056142

ENST00000324856

1967_1971

379.0

2286.0

Motif

Note=LXXLL

Tgene

ARID1A

chr2:131117219

chr1:27056142

ENST00000324856

2085_2089

379.0

2286.0

Motif

Note=LXXLL

Tgene

ARID1A

chr2:131117219

chr1:27056142

ENST00000374152

1368_1387

1903.0

Motif

Nuclear localization signal

Tgene

ARID1A

chr2:131117219

chr1:27056142

ENST00000374152

1709_1713

1903.0

Motif

Note=LXXLL

Tgene

ARID1A

chr2:131117219

chr1:27056142

ENST00000374152

1967_1971

1903.0

Motif

Note=LXXLL

Tgene

ARID1A

chr2:131117219

chr1:27056142

ENST00000374152

2085_2089

1903.0

Motif

Note=LXXLL

Tgene

ARID1A

chr2:131117219

chr1:27056142

ENST00000374152

295_299

1903.0

Motif

Note=LXXLL

Tgene

ARID1A

chr2:131117219

chr1:27056142

ENST00000457599

1368_1387

379.0

2069.0

Motif

Nuclear localization signal

Tgene

ARID1A

chr2:131117219

chr1:27056142

ENST00000457599

1709_1713

379.0

2069.0

Motif

Note=LXXLL

Tgene

ARID1A

chr2:131117219

chr1:27056142

ENST00000457599

1967_1971

379.0

2069.0

Motif

Note=LXXLL

Tgene

ARID1A

chr2:131117219

chr1:27056142

ENST00000457599

2085_2089

379.0

2069.0

Motif

Note=LXXLL

- In-frame and not-retained protein feature among the 13 regional features.

Partner

Gene

Hbp

Tbp

ENST

Strand

BPexon

TotalExon

Protein feature loci

*BPloci

TotalLen

Protein feature

Protein feature note

Hgene

PTPN18

chr2:131117219

chr1:27056142

ENST00000175756

26_291

138.0

461.0

Domain

Tyrosine-protein phosphatase

Hgene

PTPN18

chr2:131117219

chr1:27056142

ENST00000347849

26_291

354.0

Domain

Tyrosine-protein phosphatase

Hgene

PTPN18

chr2:131117219

chr1:27056142

ENST00000175756

229_235

138.0

461.0

Region

Substrate binding

Hgene

PTPN18

chr2:131117219

chr1:27056142

ENST00000347849

229_235

354.0

Region

Substrate binding

Tgene

ARID1A

chr2:131117219

chr1:27056142

ENST00000324856

295_299

379.0

2286.0

Motif

Note=LXXLL

Tgene

ARID1A

chr2:131117219

chr1:27056142

ENST00000457599

295_299

379.0

2069.0

Motif

Note=LXXLL

Top

Fusion Gene Sequence for PTPN18-ARID1A

For in-frame fusion transcripts, we provide the fusion transcript sequences and fusion amino acid sequences. To have fusion amino acid sequence, we ran ORFfinder and chose the longest ORF among the all predicted ones.

>In-frame_ENST00000175756_ENST00000324856_TCGA-BR-7851-11A_PTPN18_chr2_131117219_+_ARID1A_chr1_27056142_length(transcript)=7584nt_BP=515nt
GAGGCAAGGGCGGGGACTCAGTCACCGGCCTCCGCCTCCCGCGGCGTCCACACTCGCCGCGCGCGCGGCGGCCGGGCTGGACCTTGCTGG
CCCGCGGCGCCATGAGCCGCAGCCTGGACTCGGCGCGGAGCTTCCTGGAGCGGCTGGAAGCGCGGGGCGGCCGGGAGGGGGCAGTCCTCG
CCGGCGAGTTCAGCGACATCCAGGCCTGCTCGGCCGCCTGGAAGGCTGACGGCGTGTGCTCCACCGTGGCCGGCAGTCGGCCAGAGAACG
TGAGGAAGAACCGCTACAAAGACGTGCTGCCTTATGATCAGACGCGAGTAATCCTCTCCCTGCTCCAGGAAGAGGGACACAGCGACTACA
TTAATGGCAACTTCATCCGGGGCGTGGATGGAAGCCTGGCCTACATTGCCACGCAAGGACCCTTGCCTCACACCCTGCTAGACTTCTGGA
GACTGGTCTGGGAGTTTGGGGTCAAGGTGATCCTGATGGCCTGTCGAGAGATAGAGAATGGGCGGCCATCCAGTCCAATGGATCAGATGG
GCAAGATGAGACCTCAGCCATATGGCGGGACTAACCCATACTCGCAGCAACAGGGACCTCCGTCAGGACCGCAGCAAGGACATGGGTACC
CAGGGCAGCCATACGGGTCCCAGACCCCGCAGCGGTACCCGATGACCATGCAGGGCCGGGCGCAGAGTGCCATGGGCGGCCTCTCTTATA
CACAGCAGATTCCTCCTTATGGACAACAAGGCCCCAGCGGGTATGGTCAACAGGGCCAGACTCCATATTACAACCAGCAAAGTCCTCACC
CTCAGCAGCAGCAGCCACCCTACTCCCAGCAACCACCGTCCCAGACCCCTCATGCCCAACCTTCGTATCAGCAGCAGCCACAGTCTCAAC
CACCACAGCTCCAGTCCTCTCAGCCTCCATACTCCCAGCAGCCATCCCAGCCTCCACATCAGCAGTCCCCGGCTCCATACCCCTCCCAGC
AGTCGACGACACAGCAGCACCCCCAGAGCCAGCCCCCCTACTCACAGCCACAGGCTCAGTCTCCTTACCAGCAGCAGCAACCTCAGCAGC
CAGCACCCTCGACGCTCTCCCAGCAGGCTGCGTATCCTCAGCCCCAGTCTCAGCAGTCCCAGCAAACTGCCTATTCCCAGCAGCGCTTCC
CTCCACCGCAGGAGCTATCTCAAGATTCATTTGGGTCTCAGGCATCCTCAGCCCCCTCAATGACCTCCAGTAAGGGAGGGCAAGAAGATA
TGAACCTGAGCCTTCAGTCAAGACCCTCCAGCTTGCCTGATCTATCTGGTTCAATAGATGACCTCCCCATGGGGACAGAAGGAGCTCTGA
GTCCTGGAGTGAGCACATCAGGGATTTCCAGCAGCCAAGGAGAGCAGAGTAATCCAGCTCAGTCTCCTTTCTCTCCTCATACCTCCCCTC
ACCTGCCTGGCATCCGAGGCCCTTCCCCGTCCCCTGTTGGCTCTCCCGCCAGTGTTGCTCAGTCTCGCTCAGGACCACTCTCGCCTGCTG
CAGTGCCAGGCAACCAGATGCCACCTCGGCCACCCAGTGGCCAGTCGGACAGCATCATGCATCCTTCCATGAACCAATCAAGCATTGCCC
AAGATCGAGGTTATATGCAGAGGAACCCCCAGATGCCCCAGTACAGTTCCCCCCAGCCCGGCTCAGCCTTATCTCCGCGTCAGCCTTCCG
GAGGACAGATACACACAGGCATGGGCTCCTACCAGCAGAACTCCATGGGGAGCTATGGTCCCCAGGGGGGTCAGTATGGCCCACAAGGTG
GCTACCCCAGGCAGCCAAACTATAATGCCTTGCCCAATGCCAACTACCCCAGTGCAGGCATGGCTGGAGGCATAAACCCCATGGGTGCCG
GAGGTCAAATGCATGGACAGCCTGGCATCCCACCTTATGGCACACTCCCTCCAGGGAGGATGAGTCACGCCTCCATGGGCAACCGGCCTT
ATGGCCCTAACATGGCCAATATGCCACCTCAGGTTGGGTCAGGGATGTGTCCCCCACCAGGGGGCATGAACCGGAAAACCCAAGAAACTG
CTGTCGCCATGCATGTTGCTGCCAACTCTATCCAAAACAGGCCGCCAGGCTACCCCAATATGAATCAAGGGGGCATGATGGGAACTGGAC
CTCCTTATGGACAAGGGATTAATAGTATGGCTGGCATGATCAACCCTCAGGGACCCCCATATTCCATGGGTGGAACCATGGCCAACAATT
CTGCAGGGATGGCAGCCAGCCCAGAGATGATGGGCCTTGGGGATGTAAAGTTAACTCCAGCCACCAAAATGAACAACAAGGCAGATGGGA
CACCCAAGACAGAATCCAAATCCAAGAAATCCAGTTCTTCTACTACAACCAATGAGAAGATCACCAAGTTGTATGAGCTGGGTGGTGAGC
CTGAGAGGAAGATGTGGGTGGACCGTTATCTGGCCTTCACTGAGGAGAAGGCCATGGGCATGACAAATCTGCCTGCTGTGGGTAGGAAAC
CTCTGGACCTCTATCGCCTCTATGTGTCTGTGAAGGAGATTGGTGGATTGACTCAGGTCAACAAGAACAAAAAATGGCGGGAACTTGCAA
CCAACCTCAATGTGGGCACATCAAGCAGTGCTGCCAGCTCCTTGAAAAAGCAGTATATCCAGTGTCTCTATGCCTTTGAATGCAAGATTG
AACGGGGAGAAGACCCTCCCCCAGACATCTTTGCAGCTGCTGATTCCAAGAAGTCCCAGCCCAAGATCCAGCCTCCCTCTCCTGCGGGAT
CAGGATCTATGCAGGGGCCCCAGACTCCCCAGTCAACCAGCAGTTCCATGGCAGAAGGAGGAGACTTAAAGCCACCAACTCCAGCATCCA
CACCACACAGTCAGATCCCCCCATTGCCAGGCATGAGCAGGAGCAATTCAGTTGGGATCCAGGATGCCTTTAATGATGGAAGTGACTCCA
CATTCCAGAAGCGGAATTCCATGACTCCAAACCCTGGGTATCAGCCCAGTATGAATACCTCTGACATGATGGGGCGCATGTCCTATGAGC
CAAATAAGGATCCTTATGGCAGCATGAGGAAAGCTCCAGGGAGTGATCCCTTCATGTCCTCAGGGCAGGGCCCCAACGGCGGGATGGGTG
ACCCCTACAGTCGTGCTGCCGGCCCTGGGCTAGGAAATGTGGCGATGGGACCACGACAGCACTATCCCTATGGAGGTCCTTATGACAGAG
TGAGGACGGAGCCTGGAATAGGGCCTGAGGGAAACATGAGCACTGGGGCCCCACAGCCGAATCTCATGCCTTCCAACCCAGACTCGGGGA
TGTATTCTCCTAGCCGCTACCCCCCGCAGCAGCAGCAGCAGCAGCAGCAACGACATGATTCCTATGGCAATCAGTTCTCCACCCAAGGCA
CCCCTTCTGGCAGCCCCTTCCCCAGCCAGCAGACTACAATGTATCAACAGCAACAGCAGAATTACAAGCGGCCAATGGATGGCACATATG
GCCCTCCTGCCAAGCGGCACGAAGGGGAGATGTACAGCGTGCCATACAGCACTGGGCAGGGGCAGCCTCAGCAGCAGCAGTTGCCCCCAG
CCCAGCCCCAGCCTGCCAGCCAGCAACAAGCTGCCCAGCCTTCCCCTCAGCAAGATGTATACAACCAGTATGGCAATGCCTATCCTGCCA
CTGCCACAGCTGCTACTGAGCGCCGACCAGCAGGCGGCCCCCAGAACCAATTTCCATTCCAGTTTGGCCGAGACCGTGTCTCTGCACCCC
CTGGCACCAATGCCCAGCAAAACATGCCACCACAAATGATGGGCGGCCCCATACAGGCATCAGCTGAGGTTGCTCAGCAAGGCACCATGT
GGCAGGGGCGTAATGACATGACCTATAATTATGCCAACAGGCAGAGCACGGGCTCTGCCCCCCAGGGCCCCGCCTATCATGGCGTGAACC
GAACAGATGAAATGCTGCACACAGATCAGAGGGCCAACCACGAAGGCTCGTGGCCTTCCCATGGCACACGCCAGCCCCCATATGGTCCCT
CTGCCCCTGTGCCCCCCATGACAAGGCCCCCTCCATCTAACTACCAGCCCCCACCAAGCATGCAGAATCACATTCCTCAGGTATCCAGCC
CTGCTCCCCTGCCCCGGCCAATGGAGAACCGCACCTCTCCTAGCAAGTCTCCATTCCTGCACTCTGGGATGAAAATGCAGAAGGCAGGTC
CCCCAGTACCTGCCTCGCACATAGCACCTGCCCCTGTGCAGCCCCCCATGATTCGGCGGGATATCACCTTCCCACCTGGCTCTGTTGAAG
CCACACAGCCTGTGTTGAAGCAGAGGAGGCGGCTCACAATGAAAGACATTGGAACCCCGGAGGCATGGCGGGTAATGATGTCCCTCAAGT
CTGGTCTCCTGGCAGAGAGCACATGGGCATTAGATACCATCAACATCCTGCTGTATGATGACAACAGCATCATGACCTTCAACCTCAGTC
AGCTCCCAGGGTTGCTAGAGCTCCTTGTAGAATATTTCCGACGATGCCTGATTGAGATCTTTGGCATTTTAAAGGAGTATGAGGTGGGTG
ACCCAGGACAGAGAACGCTACTGGATCCTGGGAGGTTCAGCAAGGTGTCTAGTCCAGCTCCCATGGAGGGTGGGGAAGAAGAAGAAGAAC
TTCTAGGTCCTAAACTAGAAGAGGAAGAAGAAGAGGAAGTAGTTGAAAATGATGAGGAGATAGCCTTTTCAGGCAAGGACAAGCCAGCTT
CAGAGAATAGTGAGGAGAAGCTGATCAGTAAGTTTGACAAGCTTCCAGTAAAGATCGTACAGAAGAATGATCCATTTGTGGTGGACTGCT
CAGATAAGCTTGGGCGTGTGCAGGAGTTTGACAGTGGCCTGCTGCACTGGCGGATTGGTGGGGGGGACACCACTGAGCATATCCAGACCC
ACTTCGAGAGCAAGACAGAGCTGCTGCCTTCCCGGCCTCACGCACCCTGCCCACCAGCCCCTCGGAAGCATGTGACAACAGCAGAGGGTA
CACCAGGGACAACAGACCAGGAGGGGCCCCCACCTGATGGACCTCCAGAAAAACGGATCACAGCCACTATGGATGACATGTTGTCTACTC
GGTCTAGCACCTTGACCGAGGATGGAGCTAAGAGTTCAGAGGCCATCAAGGAGAGCAGCAAGTTTCCATTTGGCATTAGCCCAGCACAGA
GCCACCGGAACATCAAGATCCTAGAGGACGAACCCCACAGTAAGGATGAGACCCCACTGTGTACCCTTCTGGACTGGCAGGATTCTCTTG
CCAAGCGCTGCGTCTGTGTGTCCAATACCATTCGAAGCCTGTCATTTGTGCCAGGCAATGACTTTGAGATGTCCAAACACCCAGGGCTGC
TGCTCATCCTGGGCAAGCTGATCCTGCTGCACCACAAGCACCCAGAACGGAAGCAGGCACCACTAACTTATGAAAAGGAGGAGGAACAGG
ACCAAGGGGTGAGCTGCAACAAAGTGGAGTGGTGGTGGGACTGCTTGGAGATGCTCCGGGAAAACACCTTGGTTACACTCGCCAACATCT
CGGGGCAGTTGGACCTATCTCCATACCCCGAGAGCATTTGCCTGCCTGTCCTGGACGGACTCCTACACTGGGCAGTTTGCCCTTCAGCTG
AAGCCCAGGACCCCTTTTCCACCCTGGGCCCCAATGCCGTCCTTTCCCCGCAGAGACTGGTCTTGGAAACCCTCAGCAAACTCAGCATCC
AGGACAACAATGTGGACCTGATTCTGGCCACACCCCCCTTCAGCCGCCTGGAGAAGTTGTATAGCACTATGGTGCGCTTCCTCAGTGACC
GAAAGAACCCGGTGTGCCGGGAGATGGCTGTGGTACTGCTGGCCAACCTGGCTCAGGGGGACAGCCTGGCAGCTCGTGCCATTGCAGTGC
AGAAGGGCAGTATCGGCAACCTCCTGGGCTTCCTAGAGGACAGCCTTGCCGCCACACAGTTCCAGCAGAGCCAGGCCAGCCTCCTCCACA
TGCAGAACCCACCCTTTGAGCCAACTAGTGTGGACATGATGCGGCGGGCTGCCCGCGCGCTGCTTGCCTTGGCCAAGGTGGACGAGAACC
ACTCAGAGTTTACTCTGTACGAATCACGGCTGTTGGACATCTCGGTATCACCGTTGATGAACTCATTGGTTTCACAAGTCATTTGTGATG
TACTGTTTTTGATTGGCCAGTCATGACAGCCGTGGGACACCTCCCCCCCCCGTGTGTGTGTGCGTGTGTGGAGAACTTAGAAACTGACTG
TTGCCCTTTATTTATGCAAAACCACCTCAGAATCCAGTTTACCCTGTGCTGTCCAGCTTCTCCCTTGGGAAAAAGTCTCTCCTGTTTCTC
TCTCCTCCTTCCACCTCCCCTCCCTCCATCACCTCACGCCTTTCTGTTCCTTGTCCTCACCTTACTCCCCTCAGGACCCTACCCCACCCT
CTTTGAAAAGACAAAGCTCTGCCTACATAGAAGACTTTTTTTATTTTAACCAAAGTTACTGTTGTTTACAGTGAGTTTGGGGAAAAAAAA
TAAAATAAAAATGGCTTTCCCAGTCCTTGCATCAACGGGATGCCACATTTCATAACTGTTTTTAATGGTAAAAAAAAAAAAAAAAAATAC
AAAAAAAAATTCTGAAGGACAAAAAAGGTGACTGCTGAACTGTGTGTGGTTTATTGTTGTACATTCACAATCTTGCAGGAGCCAAGAAGT
TCGCAGTTGTGAACAGACCCTGTTCACTGGAGAGGCCTGTGCAGTAGAGTGTAGACCCTTTCATGTACTGTACTGTACACCTGATACTGT
AAACATACTGTAATAATAATGTCTCACATGGAAACAGAAAACGCTGGGTCAGCAGCAAGCTGTAGTTTTTAAAAATGTTTTTAGTTAAAC
GTTGAGGAGAAAAAAAAAAAAGGCTTTTCCCCCAAAGTATCATGTGTGAACCTACAACACCCTGACCTCTTTCTCTCCTCCTTGATTGTA
TGAATAACCCTGAGATCACCTCTTAGAACTGGTTTTAACCTTTAGCTGCAGCGGCTACGCTGCCACGTGTGTATATATATGACGTTGTAC
ATTGCACATACCCTTGGATCCCCACAGTTTGGTCCTCCTCCCAGCTACCCCTTTATAGTATGACGAGTTAACAAGTTGGTGACCTGCACA
AAGCGAGACACAGCTATTTAATCTCTTGCCAGATATCGCCCCTCTTGGTGCGATGCTGTACAGGTCTCTGTAAAAAGTCCTTGCTGTCTC
AGCAGCCAATCAACTTATAGTTTATTTTTTTCTGGGTTTTTGTTTTGTTTTGTTTTCTTTCTAATCGAGGTGTGAAAAAGTTCTAGGTTC
AGTTGAAGTTCTGATGAAGAAACACAATTGAGATTTTTTCAGTGATAAAATCTGCATATTTGTATTTCAACAATGTAGCTAAAACTTGAT
GTAAATTCCTCCTTTTTTTCCTTTTTTGGCTTAATGAATATCATTTATTCAGTATGAAATCTTTATACTATATGTTCCACGTGTTAAGAA

>In-frame_ENST00000175756_ENST00000324856_TCGA-BR-7851-11A_PTPN18_chr2_131117219_+_ARID1A_chr1_27056142_length(amino acids)=2050AA_start in transcript=83_stop in transcript=6235
MLARGAMSRSLDSARSFLERLEARGGREGAVLAGEFSDIQACSAAWKADGVCSTVAGSRPENVRKNRYKDVLPYDQTRVILSLLQEEGHS
DYINGNFIRGVDGSLAYIATQGPLPHTLLDFWRLVWEFGVKVILMACREIENGRPSSPMDQMGKMRPQPYGGTNPYSQQQGPPSGPQQGH
GYPGQPYGSQTPQRYPMTMQGRAQSAMGGLSYTQQIPPYGQQGPSGYGQQGQTPYYNQQSPHPQQQQPPYSQQPPSQTPHAQPSYQQQPQ
SQPPQLQSSQPPYSQQPSQPPHQQSPAPYPSQQSTTQQHPQSQPPYSQPQAQSPYQQQQPQQPAPSTLSQQAAYPQPQSQQSQQTAYSQQ
RFPPPQELSQDSFGSQASSAPSMTSSKGGQEDMNLSLQSRPSSLPDLSGSIDDLPMGTEGALSPGVSTSGISSSQGEQSNPAQSPFSPHT
SPHLPGIRGPSPSPVGSPASVAQSRSGPLSPAAVPGNQMPPRPPSGQSDSIMHPSMNQSSIAQDRGYMQRNPQMPQYSSPQPGSALSPRQ
PSGGQIHTGMGSYQQNSMGSYGPQGGQYGPQGGYPRQPNYNALPNANYPSAGMAGGINPMGAGGQMHGQPGIPPYGTLPPGRMSHASMGN
RPYGPNMANMPPQVGSGMCPPPGGMNRKTQETAVAMHVAANSIQNRPPGYPNMNQGGMMGTGPPYGQGINSMAGMINPQGPPYSMGGTMA
NNSAGMAASPEMMGLGDVKLTPATKMNNKADGTPKTESKSKKSSSSTTTNEKITKLYELGGEPERKMWVDRYLAFTEEKAMGMTNLPAVG
RKPLDLYRLYVSVKEIGGLTQVNKNKKWRELATNLNVGTSSSAASSLKKQYIQCLYAFECKIERGEDPPPDIFAAADSKKSQPKIQPPSP
AGSGSMQGPQTPQSTSSSMAEGGDLKPPTPASTPHSQIPPLPGMSRSNSVGIQDAFNDGSDSTFQKRNSMTPNPGYQPSMNTSDMMGRMS
YEPNKDPYGSMRKAPGSDPFMSSGQGPNGGMGDPYSRAAGPGLGNVAMGPRQHYPYGGPYDRVRTEPGIGPEGNMSTGAPQPNLMPSNPD
SGMYSPSRYPPQQQQQQQQRHDSYGNQFSTQGTPSGSPFPSQQTTMYQQQQQNYKRPMDGTYGPPAKRHEGEMYSVPYSTGQGQPQQQQL
PPAQPQPASQQQAAQPSPQQDVYNQYGNAYPATATAATERRPAGGPQNQFPFQFGRDRVSAPPGTNAQQNMPPQMMGGPIQASAEVAQQG
TMWQGRNDMTYNYANRQSTGSAPQGPAYHGVNRTDEMLHTDQRANHEGSWPSHGTRQPPYGPSAPVPPMTRPPPSNYQPPPSMQNHIPQV
SSPAPLPRPMENRTSPSKSPFLHSGMKMQKAGPPVPASHIAPAPVQPPMIRRDITFPPGSVEATQPVLKQRRRLTMKDIGTPEAWRVMMS
LKSGLLAESTWALDTINILLYDDNSIMTFNLSQLPGLLELLVEYFRRCLIEIFGILKEYEVGDPGQRTLLDPGRFSKVSSPAPMEGGEEE
EELLGPKLEEEEEEEVVENDEEIAFSGKDKPASENSEEKLISKFDKLPVKIVQKNDPFVVDCSDKLGRVQEFDSGLLHWRIGGGDTTEHI
QTHFESKTELLPSRPHAPCPPAPRKHVTTAEGTPGTTDQEGPPPDGPPEKRITATMDDMLSTRSSTLTEDGAKSSEAIKESSKFPFGISP
AQSHRNIKILEDEPHSKDETPLCTLLDWQDSLAKRCVCVSNTIRSLSFVPGNDFEMSKHPGLLLILGKLILLHHKHPERKQAPLTYEKEE
EQDQGVSCNKVEWWWDCLEMLRENTLVTLANISGQLDLSPYPESICLPVLDGLLHWAVCPSAEAQDPFSTLGPNAVLSPQRLVLETLSKL
SIQDNNVDLILATPPFSRLEKLYSTMVRFLSDRKNPVCREMAVVLLANLAQGDSLAARAIAVQKGSIGNLLGFLEDSLAATQFQQSQASL

--------------------------------------------------------------
>In-frame_ENST00000175756_ENST00000457599_TCGA-BR-7851-11A_PTPN18_chr2_131117219_+_ARID1A_chr1_27056142_length(transcript)=5646nt_BP=515nt
GAGGCAAGGGCGGGGACTCAGTCACCGGCCTCCGCCTCCCGCGGCGTCCACACTCGCCGCGCGCGCGGCGGCCGGGCTGGACCTTGCTGG
CCCGCGGCGCCATGAGCCGCAGCCTGGACTCGGCGCGGAGCTTCCTGGAGCGGCTGGAAGCGCGGGGCGGCCGGGAGGGGGCAGTCCTCG
CCGGCGAGTTCAGCGACATCCAGGCCTGCTCGGCCGCCTGGAAGGCTGACGGCGTGTGCTCCACCGTGGCCGGCAGTCGGCCAGAGAACG
TGAGGAAGAACCGCTACAAAGACGTGCTGCCTTATGATCAGACGCGAGTAATCCTCTCCCTGCTCCAGGAAGAGGGACACAGCGACTACA
TTAATGGCAACTTCATCCGGGGCGTGGATGGAAGCCTGGCCTACATTGCCACGCAAGGACCCTTGCCTCACACCCTGCTAGACTTCTGGA
GACTGGTCTGGGAGTTTGGGGTCAAGGTGATCCTGATGGCCTGTCGAGAGATAGAGAATGGGCGGCCATCCAGTCCAATGGATCAGATGG
GCAAGATGAGACCTCAGCCATATGGCGGGACTAACCCATACTCGCAGCAACAGGGACCTCCGTCAGGACCGCAGCAAGGACATGGGTACC
CAGGGCAGCCATACGGGTCCCAGACCCCGCAGCGGTACCCGATGACCATGCAGGGCCGGGCGCAGAGTGCCATGGGCGGCCTCTCTTATA
CACAGCAGATTCCTCCTTATGGACAACAAGGCCCCAGCGGGTATGGTCAACAGGGCCAGACTCCATATTACAACCAGCAAAGTCCTCACC
CTCAGCAGCAGCAGCCACCCTACTCCCAGCAACCACCGTCCCAGACCCCTCATGCCCAACCTTCGTATCAGCAGCAGCCACAGTCTCAAC
CACCACAGCTCCAGTCCTCTCAGCCTCCATACTCCCAGCAGCCATCCCAGCCTCCACATCAGCAGTCCCCGGCTCCATACCCCTCCCAGC
AGTCGACGACACAGCAGCACCCCCAGAGCCAGCCCCCCTACTCACAGCCACAGGCTCAGTCTCCTTACCAGCAGCAGCAACCTCAGCAGC
CAGCACCCTCGACGCTCTCCCAGCAGGCTGCGTATCCTCAGCCCCAGTCTCAGCAGTCCCAGCAAACTGCCTATTCCCAGCAGCGCTTCC
CTCCACCGCAGGAGCTATCTCAAGATTCATTTGGGTCTCAGGCATCCTCAGCCCCCTCAATGACCTCCAGTAAGGGAGGGCAAGAAGATA
TGAACCTGAGCCTTCAGTCAAGACCCTCCAGCTTGCCTGATCTATCTGGTTCAATAGATGACCTCCCCATGGGGACAGAAGGAGCTCTGA
GTCCTGGAGTGAGCACATCAGGGATTTCCAGCAGCCAAGGAGAGCAGAGTAATCCAGCTCAGTCTCCTTTCTCTCCTCATACCTCCCCTC
ACCTGCCTGGCATCCGAGGCCCTTCCCCGTCCCCTGTTGGCTCTCCCGCCAGTGTTGCTCAGTCTCGCTCAGGACCACTCTCGCCTGCTG
CAGTGCCAGGCAACCAGATGCCACCTCGGCCACCCAGTGGCCAGTCGGACAGCATCATGCATCCTTCCATGAACCAATCAAGCATTGCCC
AAGATCGAGGTTATATGCAGAGGAACCCCCAGATGCCCCAGTACAGTTCCCCCCAGCCCGGCTCAGCCTTATCTCCGCGTCAGCCTTCCG
GAGGACAGATACACACAGGCATGGGCTCCTACCAGCAGAACTCCATGGGGAGCTATGGTCCCCAGGGGGGTCAGTATGGCCCACAAGGTG
GCTACCCCAGGCAGCCAAACTATAATGCCTTGCCCAATGCCAACTACCCCAGTGCAGGCATGGCTGGAGGCATAAACCCCATGGGTGCCG
GAGGTCAAATGCATGGACAGCCTGGCATCCCACCTTATGGCACACTCCCTCCAGGGAGGATGAGTCACGCCTCCATGGGCAACCGGCCTT
ATGGCCCTAACATGGCCAATATGCCACCTCAGGTTGGGTCAGGGATGTGTCCCCCACCAGGGGGCATGAACCGGAAAACCCAAGAAACTG
CTGTCGCCATGCATGTTGCTGCCAACTCTATCCAAAACAGGCCGCCAGGCTACCCCAATATGAATCAAGGGGGCATGATGGGAACTGGAC
CTCCTTATGGACAAGGGATTAATAGTATGGCTGGCATGATCAACCCTCAGGGACCCCCATATTCCATGGGTGGAACCATGGCCAACAATT
CTGCAGGGATGGCAGCCAGCCCAGAGATGATGGGCCTTGGGGATGTAAAGTTAACTCCAGCCACCAAAATGAACAACAAGGCAGATGGGA
CACCCAAGACAGAATCCAAATCCAAGAAATCCAGTTCTTCTACTACAACCAATGAGAAGATCACCAAGTTGTATGAGCTGGGTGGTGAGC
CTGAGAGGAAGATGTGGGTGGACCGTTATCTGGCCTTCACTGAGGAGAAGGCCATGGGCATGACAAATCTGCCTGCTGTGGGTAGGAAAC
CTCTGGACCTCTATCGCCTCTATGTGTCTGTGAAGGAGATTGGTGGATTGACTCAGGTCAACAAGAACAAAAAATGGCGGGAACTTGCAA
CCAACCTCAATGTGGGCACATCAAGCAGTGCTGCCAGCTCCTTGAAAAAGCAGTATATCCAGTGTCTCTATGCCTTTGAATGCAAGATTG
AACGGGGAGAAGACCCTCCCCCAGACATCTTTGCAGCTGCTGATTCCAAGAAGTCCCAGCCCAAGATCCAGCCTCCCTCTCCTGCGGGAT
CAGGATCTATGCAGGGGCCCCAGACTCCCCAGTCAACCAGCAGTTCCATGGCAGAAGGAGGAGACTTAAAGCCACCAACTCCAGCATCCA
CACCACACAGTCAGATCCCCCCATTGCCAGGCATGAGCAGGAGCAATTCAGTTGGGATCCAGGATGCCTTTAATGATGGAAGTGACTCCA
CATTCCAGAAGCGGAATTCCATGACTCCAAACCCTGGGTATCAGCCCAGTATGAATACCTCTGACATGATGGGGCGCATGTCCTATGAGC
CAAATAAGGATCCTTATGGCAGCATGAGGAAAGCTCCAGGGAGTGATCCCTTCATGTCCTCAGGGCAGGGCCCCAACGGCGGGATGGGTG
ACCCCTACAGTCGTGCTGCCGGCCCTGGGCTAGGAAATGTGGCGATGGGACCACGACAGCACTATCCCTATGGAGGTCCTTATGACAGAG
TGAGGACGGAGCCTGGAATAGGGCCTGAGGGAAACATGAGCACTGGGGCCCCACAGCCGAATCTCATGCCTTCCAACCCAGACTCGGGGA
TGTATTCTCCTAGCCGCTACCCCCCGCAGCAGCAGCAGCAGCAGCAGCAACGACATGATTCCTATGGCAATCAGTTCTCCACCCAAGGCA
CCCCTTCTGGCAGCCCCTTCCCCAGCCAGCAGACTACAATGTATCAACAGCAACAGCAGGTATCCAGCCCTGCTCCCCTGCCCCGGCCAA
TGGAGAACCGCACCTCTCCTAGCAAGTCTCCATTCCTGCACTCTGGGATGAAAATGCAGAAGGCAGGTCCCCCAGTACCTGCCTCGCACA
TAGCACCTGCCCCTGTGCAGCCCCCCATGATTCGGCGGGATATCACCTTCCCACCTGGCTCTGTTGAAGCCACACAGCCTGTGTTGAAGC
AGAGGAGGCGGCTCACAATGAAAGACATTGGAACCCCGGAGGCATGGCGGGTAATGATGTCCCTCAAGTCTGGTCTCCTGGCAGAGAGCA
CATGGGCATTAGATACCATCAACATCCTGCTGTATGATGACAACAGCATCATGACCTTCAACCTCAGTCAGCTCCCAGGGTTGCTAGAGC
TCCTTGTAGAATATTTCCGACGATGCCTGATTGAGATCTTTGGCATTTTAAAGGAGTATGAGGTGGGTGACCCAGGACAGAGAACGCTAC
TGGATCCTGGGAGGTTCAGCAAGGTGTCTAGTCCAGCTCCCATGGAGGGTGGGGAAGAAGAAGAAGAACTTCTAGGTCCTAAACTAGAAG
AGGAAGAAGAAGAGGAAGTAGTTGAAAATGATGAGGAGATAGCCTTTTCAGGCAAGGACAAGCCAGCTTCAGAGAATAGTGAGGAGAAGC
TGATCAGTAAGTTTGACAAGCTTCCAGTAAAGATCGTACAGAAGAATGATCCATTTGTGGTGGACTGCTCAGATAAGCTTGGGCGTGTGC
AGGAGTTTGACAGTGGCCTGCTGCACTGGCGGATTGGTGGGGGGGACACCACTGAGCATATCCAGACCCACTTCGAGAGCAAGACAGAGC
TGCTGCCTTCCCGGCCTCACGCACCCTGCCCACCAGCCCCTCGGAAGCATGTGACAACAGCAGAGGGTACACCAGGGACAACAGACCAGG
AGGGGCCCCCACCTGATGGACCTCCAGAAAAACGGATCACAGCCACTATGGATGACATGTTGTCTACTCGGTCTAGCACCTTGACCGAGG
ATGGAGCTAAGAGTTCAGAGGCCATCAAGGAGAGCAGCAAGTTTCCATTTGGCATTAGCCCAGCACAGAGCCACCGGAACATCAAGATCC
TAGAGGACGAACCCCACAGTAAGGATGAGACCCCACTGTGTACCCTTCTGGACTGGCAGGATTCTCTTGCCAAGCGCTGCGTCTGTGTGT
CCAATACCATTCGAAGCCTGTCATTTGTGCCAGGCAATGACTTTGAGATGTCCAAACACCCAGGGCTGCTGCTCATCCTGGGCAAGCTGA
TCCTGCTGCACCACAAGCACCCAGAACGGAAGCAGGCACCACTAACTTATGAAAAGGAGGAGGAACAGGACCAAGGGGTGAGCTGCAACA
AAGTGGAGTGGTGGTGGGACTGCTTGGAGATGCTCCGGGAAAACACCTTGGTTACACTCGCCAACATCTCGGGGCAGTTGGACCTATCTC
CATACCCCGAGAGCATTTGCCTGCCTGTCCTGGACGGACTCCTACACTGGGCAGTTTGCCCTTCAGCTGAAGCCCAGGACCCCTTTTCCA
CCCTGGGCCCCAATGCCGTCCTTTCCCCGCAGAGACTGGTCTTGGAAACCCTCAGCAAACTCAGCATCCAGGACAACAATGTGGACCTGA
TTCTGGCCACACCCCCCTTCAGCCGCCTGGAGAAGTTGTATAGCACTATGGTGCGCTTCCTCAGTGACCGAAAGAACCCGGTGTGCCGGG
AGATGGCTGTGGTACTGCTGGCCAACCTGGCTCAGGGGGACAGCCTGGCAGCTCGTGCCATTGCAGTGCAGAAGGGCAGTATCGGCAACC
TCCTGGGCTTCCTAGAGGACAGCCTTGCCGCCACACAGTTCCAGCAGAGCCAGGCCAGCCTCCTCCACATGCAGAACCCACCCTTTGAGC
CAACTAGTGTGGACATGATGCGGCGGGCTGCCCGCGCGCTGCTTGCCTTGGCCAAGGTGGACGAGAACCACTCAGAGTTTACTCTGTACG
AATCACGGCTGTTGGACATCTCGGTATCACCGTTGATGAACTCATTGGTTTCACAAGTCATTTGTGATGTACTGTTTTTGATTGGCCAGT

>In-frame_ENST00000175756_ENST00000457599_TCGA-BR-7851-11A_PTPN18_chr2_131117219_+_ARID1A_chr1_27056142_length(amino acids)=1833AA_start in transcript=83_stop in transcript=5584
MLARGAMSRSLDSARSFLERLEARGGREGAVLAGEFSDIQACSAAWKADGVCSTVAGSRPENVRKNRYKDVLPYDQTRVILSLLQEEGHS
DYINGNFIRGVDGSLAYIATQGPLPHTLLDFWRLVWEFGVKVILMACREIENGRPSSPMDQMGKMRPQPYGGTNPYSQQQGPPSGPQQGH
GYPGQPYGSQTPQRYPMTMQGRAQSAMGGLSYTQQIPPYGQQGPSGYGQQGQTPYYNQQSPHPQQQQPPYSQQPPSQTPHAQPSYQQQPQ
SQPPQLQSSQPPYSQQPSQPPHQQSPAPYPSQQSTTQQHPQSQPPYSQPQAQSPYQQQQPQQPAPSTLSQQAAYPQPQSQQSQQTAYSQQ
RFPPPQELSQDSFGSQASSAPSMTSSKGGQEDMNLSLQSRPSSLPDLSGSIDDLPMGTEGALSPGVSTSGISSSQGEQSNPAQSPFSPHT
SPHLPGIRGPSPSPVGSPASVAQSRSGPLSPAAVPGNQMPPRPPSGQSDSIMHPSMNQSSIAQDRGYMQRNPQMPQYSSPQPGSALSPRQ
PSGGQIHTGMGSYQQNSMGSYGPQGGQYGPQGGYPRQPNYNALPNANYPSAGMAGGINPMGAGGQMHGQPGIPPYGTLPPGRMSHASMGN
RPYGPNMANMPPQVGSGMCPPPGGMNRKTQETAVAMHVAANSIQNRPPGYPNMNQGGMMGTGPPYGQGINSMAGMINPQGPPYSMGGTMA
NNSAGMAASPEMMGLGDVKLTPATKMNNKADGTPKTESKSKKSSSSTTTNEKITKLYELGGEPERKMWVDRYLAFTEEKAMGMTNLPAVG
RKPLDLYRLYVSVKEIGGLTQVNKNKKWRELATNLNVGTSSSAASSLKKQYIQCLYAFECKIERGEDPPPDIFAAADSKKSQPKIQPPSP
AGSGSMQGPQTPQSTSSSMAEGGDLKPPTPASTPHSQIPPLPGMSRSNSVGIQDAFNDGSDSTFQKRNSMTPNPGYQPSMNTSDMMGRMS
YEPNKDPYGSMRKAPGSDPFMSSGQGPNGGMGDPYSRAAGPGLGNVAMGPRQHYPYGGPYDRVRTEPGIGPEGNMSTGAPQPNLMPSNPD
SGMYSPSRYPPQQQQQQQQRHDSYGNQFSTQGTPSGSPFPSQQTTMYQQQQQVSSPAPLPRPMENRTSPSKSPFLHSGMKMQKAGPPVPA
SHIAPAPVQPPMIRRDITFPPGSVEATQPVLKQRRRLTMKDIGTPEAWRVMMSLKSGLLAESTWALDTINILLYDDNSIMTFNLSQLPGL
LELLVEYFRRCLIEIFGILKEYEVGDPGQRTLLDPGRFSKVSSPAPMEGGEEEEELLGPKLEEEEEEEVVENDEEIAFSGKDKPASENSE
EKLISKFDKLPVKIVQKNDPFVVDCSDKLGRVQEFDSGLLHWRIGGGDTTEHIQTHFESKTELLPSRPHAPCPPAPRKHVTTAEGTPGTT
DQEGPPPDGPPEKRITATMDDMLSTRSSTLTEDGAKSSEAIKESSKFPFGISPAQSHRNIKILEDEPHSKDETPLCTLLDWQDSLAKRCV
CVSNTIRSLSFVPGNDFEMSKHPGLLLILGKLILLHHKHPERKQAPLTYEKEEEQDQGVSCNKVEWWWDCLEMLRENTLVTLANISGQLD
LSPYPESICLPVLDGLLHWAVCPSAEAQDPFSTLGPNAVLSPQRLVLETLSKLSIQDNNVDLILATPPFSRLEKLYSTMVRFLSDRKNPV
CREMAVVLLANLAQGDSLAARAIAVQKGSIGNLLGFLEDSLAATQFQQSQASLLHMQNPPFEPTSVDMMRRAARALLALAKVDENHSEFT

--------------------------------------------------------------

Top

Fusion Gene PPI Analysis for PTPN18-ARID1A

Go to ChiPPI (Chimeric Protein-Protein interactions) to see the chimeric PPI interaction in
ChiPPI page.

Protein-protein interactors with each fusion partner protein in wild-type (BIOGRID-3.4.160)

Hgene

Hgene's interactors

Tgene

Tgene's interactors

- Retained PPIs in in-frame fusion.

Partner

Gene

Hbp

Tbp

ENST

Strand

BPexon

TotalExon

Protein feature loci

*BPloci

TotalLen

Still interaction with

- Lost PPIs in in-frame fusion.

Partner

Gene

Hbp

Tbp

ENST

Strand

BPexon

TotalExon

Protein feature loci

*BPloci

TotalLen

Interaction lost with

- Retained PPIs, but lost function due to frame-shift fusion.

Partner

Gene

Hbp

Tbp

ENST

Strand

BPexon

TotalExon

Protein feature loci

*BPloci

TotalLen

Interaction lost with

Top

Related Drugs for PTPN18-ARID1A

Drugs targeting genes involved in this fusion gene.
(DrugBank Version 5.1.8 2021-05-08)

Partner

Gene

UniProtAcc

DrugBank ID

Drug name

Drug activity

Drug type

Drug status

Top

Related Diseases for PTPN18-ARID1A

Diseases associated with fusion partners.
(DisGeNet 4.0)

Partner	Gene	Disease ID	Disease name	# pubmeds	Source
Hgene	PTPN18	C0023893	Liver Cirrhosis, Experimental	1	CTD_human
Tgene	ARID1A	C0024623	Malignant neoplasm of stomach	3	CTD_human
Tgene	ARID1A	C0038356	Stomach Neoplasms	3	CTD_human
Tgene	ARID1A	C1708349	Hereditary Diffuse Gastric Cancer	3	CTD_human
Tgene	ARID1A	C2239176	Liver carcinoma	3	CTD_human
Tgene	ARID1A	C0033578	Prostatic Neoplasms	2	CTD_human
Tgene	ARID1A	C0376358	Malignant neoplasm of prostate	2	CTD_human
Tgene	ARID1A	C0001418	Adenocarcinoma	1	CTD_human
Tgene	ARID1A	C0005684	Malignant neoplasm of urinary bladder	1	CTD_human
Tgene	ARID1A	C0005695	Bladder Neoplasm	1	CTD_human
Tgene	ARID1A	C0006413	Burkitt Lymphoma	1	CTD_human
Tgene	ARID1A	C0007138	Carcinoma, Transitional Cell	1	CTD_human
Tgene	ARID1A	C0009402	Colorectal Carcinoma	1	CTD_human
Tgene	ARID1A	C0009404	Colorectal Neoplasms	1	CTD_human
Tgene	ARID1A	C0010606	Adenoid Cystic Carcinoma	1	CTD_human
Tgene	ARID1A	C0014170	Endometrial Neoplasms	1	CTD_human
Tgene	ARID1A	C0027708	Nephroblastoma	1	CTD_human
Tgene	ARID1A	C0027819	Neuroblastoma	1	CTD_human
Tgene	ARID1A	C0036920	Sezary Syndrome	1	CTD_human
Tgene	ARID1A	C0079772	T-Cell Lymphoma	1	CTD_human
Tgene	ARID1A	C0079773	Lymphoma, T-Cell, Cutaneous	1	CTD_human
Tgene	ARID1A	C0205641	Adenocarcinoma, Basal Cell	1	CTD_human
Tgene	ARID1A	C0205642	Adenocarcinoma, Oxyphilic	1	CTD_human
Tgene	ARID1A	C0205643	Carcinoma, Cribriform	1	CTD_human
Tgene	ARID1A	C0205644	Carcinoma, Granular Cell	1	CTD_human
Tgene	ARID1A	C0205645	Adenocarcinoma, Tubular	1	CTD_human
Tgene	ARID1A	C0206656	Embryonal Rhabdomyosarcoma	1	CTD_human
Tgene	ARID1A	C0206698	Cholangiocarcinoma	1	CTD_human
Tgene	ARID1A	C0265338	Coffin-Siris syndrome	1	CTD_human;GENOMICS_ENGLAND
Tgene	ARID1A	C0279628	Adenocarcinoma Of Esophagus	1	CTD_human
Tgene	ARID1A	C0343640	African Burkitt's lymphoma	1	CTD_human
Tgene	ARID1A	C0345905	Intrahepatic Cholangiocarcinoma	1	CTD_human
Tgene	ARID1A	C0376407	Granulomatous Slack Skin	1	CTD_human
Tgene	ARID1A	C0476089	Endometrial Carcinoma	1	CTD_human
Tgene	ARID1A	C0920269	Microsatellite Instability	1	CTD_human
Tgene	ARID1A	C1721098	Replication Error Phenotype	1	CTD_human
Tgene	ARID1A	C2930471	Bilateral Wilms Tumor	1	CTD_human
Tgene	ARID1A	C2931822	Nasopharyngeal carcinoma	1	CTD_human
Tgene	ARID1A	C3805278	Extrahepatic Cholangiocarcinoma	1	CTD_human
Tgene	ARID1A	C4721444	Burkitt Leukemia	1	CTD_human