UTHEALTH HOME ABOUT SBMI A-Z WEBMAIL INSIDE THE UNIVERSITY

Home

Download

Statistics

Examples

Help

Contact

level2

	Fusion Gene Summary
	Fusion Gene Sample Information
	Fusion ORF Analysis
	Fusion Amino Acid Sequences
	Fusion Protein Functional Features
	Fusion Protein Structure
	pLDDT scores
	Ramachandran Plot of Fusion Protein Structure
	Fusion Protein-Protein Interaction
	Related drugs with this fusion protein
	Related disease with this fusion protein

Fusion Protein:TMPRSS2-DIAPH1

Fusion Protein Summary

Fusion gene summary

Fusion partner gene information	Fusion gene name: TMPRSS2-DIAPH1
	FusionPDB ID: 92374
	FusionGDB2.0 ID: 92374
		Hgene	Tgene
	Gene symbol	TMPRSS2	DIAPH1
	Gene ID	7113	1729
	Gene name	transmembrane serine protease 2	diaphanous related formin 1
	Synonyms	PP9284\|PRSS10	DFNA1\|DIA1\|DRF1\|LFHL1\|SCBMS\|hDIA1
	Cytomap	21q22.3	5q31.3
	Type of gene	protein-coding	protein-coding
	Description	transmembrane protease serine 2epitheliasinserine protease 10transmembrane protease, serine 2	protein diaphanous homolog 1
	Modification date	20200313	20200313
	UniProtAcc	O15393	O60610
Ensembl transtripts involved in fusion gene	ENST ids	ENST00000332149, ENST00000398585, ENST00000458356, ENST00000497881,	ENST00000494967, ENST00000253811, ENST00000389054, ENST00000389057, ENST00000398557, ENST00000398562, ENST00000398566, ENST00000518047, ENST00000520569,
Fusion gene scores for assessment (based on all fusion genes of FusionGDB 2.0)	* DoF score	40 X 73 X 10=29200	10 X 8 X 6=480
	# samples	130	10
	** MAII score	log2(130/29200*10)=-4.48938484073892 possibly effective Gene in Pan-Cancer Fusion Genes (peGinPCFGs). DoF>8 and MAII<0	log2(10/480*10)=-2.26303440583379 possibly effective Gene in Pan-Cancer Fusion Genes (peGinPCFGs). DoF>8 and MAII<0
Context (manual curation of fusion genes in FusionPDB)	PubMed: TMPRSS2 [Title/Abstract] AND DIAPH1 [Title/Abstract] AND fusion [Title/Abstract]
Most frequent breakpoint (based on all fusion genes of FusionGDB 2.0)	TMPRSS2(42842575)-DIAPH1(140914000), # samples:2
Anticipated loss of major functional domain due to fusion event.	TMPRSS2-DIAPH1 seems lost the major protein functional domain in Hgene partner, which is a CGC by not retaining the major functional domain in the partially deleted in-frame ORF. TMPRSS2-DIAPH1 seems lost the major protein functional domain in Hgene partner, which is a CGC by not retaining the major functional domain in the partially deleted in-frame ORF. TMPRSS2-DIAPH1 seems lost the major protein functional domain in Hgene partner, which is a essential gene by not retaining the major functional domain in the partially deleted in-frame ORF. TMPRSS2-DIAPH1 seems lost the major protein functional domain in Hgene partner, which is a essential gene by not retaining the major functional domain in the partially deleted in-frame ORF. TMPRSS2-DIAPH1 seems lost the major protein functional domain in Hgene partner, which is a CGC due to the frame-shifted ORF. TMPRSS2-DIAPH1 seems lost the major protein functional domain in Hgene partner, which is a IUPHAR drug target due to the frame-shifted ORF. TMPRSS2-DIAPH1 seems lost the major protein functional domain in Tgene partner, which is a essential gene due to the frame-shifted ORF.

* DoF score (Degree of Frequency) = # partners X # break points X # cancer types
** MAII score (Major Active Isofusion Index) = log2(# samples/DoF score*10)

Gene ontology of each fusion partner gene with evidence of Inferred from Direct Assay (IDA) from Entrez

Partner	Gene	GO ID	GO term	PubMed ID
Hgene	TMPRSS2	GO:0006508	proteolysis	21068237\|24227843
Hgene	TMPRSS2	GO:0046598	positive regulation of viral entry into host cell	21068237\|24227843

Fusion gene breakpoints across TMPRSS2 (5'-gene)
* Click on the image to open the UCSC genome browser with custom track showing this image in a new window.

Fusion gene breakpoints across DIAPH1 (3'-gene)
* Click on the image to open the UCSC genome browser with custom track showing this image in a new window.

Top

Fusion Gene Sample Information

Fusion gene information from FusionGDB2.0.

Fusion gene information from two resources (ChiTars 5.0 and ChimerDB 4.0)
* All genome coordinats were lifted-over on hg19.
* Click on the break point to see the gene structure around the break point region using the UCSC Genome Browser.

Source	Disease	Sample	Hgene	Hchr	Hbp	Hstrand	Tgene	Tchr	Tbp	Tstrand
ChimerDB4	PRAD	TCGA-EJ-5526-01A	TMPRSS2	chr21	42842575	-	DIAPH1	chr5	140914000	-
ChimerDB4	PRAD	TCGA-EJ-5526	TMPRSS2	chr21	42842575	-	DIAPH1	chr5	140914000	-

Top

Fusion ORF Analysis

Fusion information from ORFfinder translation from full-length transcript sequence from FusionPDB.

Henst	Tenst	Hgene	Hchr	Hbp	Hstrand	Tgene	Tchr	Tbp	Tstrand	Seq length (transcript)	BP loci (transcript)	Predicted start (transcript)	Predicted stop (transcript)	Seq length (amino acids)
ENST00000332149	TMPRSS2	chr21	42842575	-	ENST00000389054	DIAPH1	chr5	140914000	-	4478	1306	135	2642	835
ENST00000332149	TMPRSS2	chr21	42842575	-	ENST00000520569	DIAPH1	chr5	140914000	-	4472	1306	135	2642	835
ENST00000332149	TMPRSS2	chr21	42842575	-	ENST00000253811	DIAPH1	chr5	140914000	-	4472	1306	135	2642	835
ENST00000332149	TMPRSS2	chr21	42842575	-	ENST00000398566	DIAPH1	chr5	140914000	-	4472	1306	135	2642	835
ENST00000332149	TMPRSS2	chr21	42842575	-	ENST00000398562	DIAPH1	chr5	140914000	-	4472	1306	135	2642	835
ENST00000332149	TMPRSS2	chr21	42842575	-	ENST00000398557	DIAPH1	chr5	140914000	-	4472	1306	135	2642	835
ENST00000332149	TMPRSS2	chr21	42842575	-	ENST00000389057	DIAPH1	chr5	140914000	-	4472	1306	135	2642	835
ENST00000332149	TMPRSS2	chr21	42842575	-	ENST00000518047	DIAPH1	chr5	140914000	-	3519	1306	135	2642	835
ENST00000398585	TMPRSS2	chr21	42842575	-	ENST00000389054	DIAPH1	chr5	140914000	-	4515	1343	40	2679	879
ENST00000398585	TMPRSS2	chr21	42842575	-	ENST00000520569	DIAPH1	chr5	140914000	-	4509	1343	40	2679	879
ENST00000398585	TMPRSS2	chr21	42842575	-	ENST00000253811	DIAPH1	chr5	140914000	-	4509	1343	40	2679	879
ENST00000398585	TMPRSS2	chr21	42842575	-	ENST00000398566	DIAPH1	chr5	140914000	-	4509	1343	40	2679	879
ENST00000398585	TMPRSS2	chr21	42842575	-	ENST00000398562	DIAPH1	chr5	140914000	-	4509	1343	40	2679	879
ENST00000398585	TMPRSS2	chr21	42842575	-	ENST00000398557	DIAPH1	chr5	140914000	-	4509	1343	40	2679	879
ENST00000398585	TMPRSS2	chr21	42842575	-	ENST00000389057	DIAPH1	chr5	140914000	-	4509	1343	40	2679	879
ENST00000398585	TMPRSS2	chr21	42842575	-	ENST00000518047	DIAPH1	chr5	140914000	-	3556	1343	40	2679	879

DeepORF prediction of the coding potential based on the fusion transcript sequence of in-frame fusion genes. DeepORF is a coding potential classifier based on convolutional neural network by comparing the real Ribo-seq data. If the no-coding score < 0.5 and coding score > 0.5, then the in-frame fusion transcript is predicted as being likely translated.

Henst	Tenst	Hgene	Hchr	Hbp	Hstrand	Tgene	Tchr	Tbp	Tstrand	No-coding score	Coding score
ENST00000332149	ENST00000389054	TMPRSS2	chr21	42842575	-	DIAPH1	chr5	140914000	-	0.001924766	0.99807525
ENST00000332149	ENST00000520569	TMPRSS2	chr21	42842575	-	DIAPH1	chr5	140914000	-	0.001905171	0.99809486
ENST00000332149	ENST00000253811	TMPRSS2	chr21	42842575	-	DIAPH1	chr5	140914000	-	0.00190891	0.99809104
ENST00000332149	ENST00000398566	TMPRSS2	chr21	42842575	-	DIAPH1	chr5	140914000	-	0.00190891	0.99809104
ENST00000332149	ENST00000398562	TMPRSS2	chr21	42842575	-	DIAPH1	chr5	140914000	-	0.00190891	0.99809104
ENST00000332149	ENST00000398557	TMPRSS2	chr21	42842575	-	DIAPH1	chr5	140914000	-	0.001905171	0.99809486
ENST00000332149	ENST00000389057	TMPRSS2	chr21	42842575	-	DIAPH1	chr5	140914000	-	0.001905171	0.99809486
ENST00000332149	ENST00000518047	TMPRSS2	chr21	42842575	-	DIAPH1	chr5	140914000	-	0.003287176	0.9967128
ENST00000398585	ENST00000389054	TMPRSS2	chr21	42842575	-	DIAPH1	chr5	140914000	-	0.002500078	0.9974999
ENST00000398585	ENST00000520569	TMPRSS2	chr21	42842575	-	DIAPH1	chr5	140914000	-	0.002479393	0.9975206
ENST00000398585	ENST00000253811	TMPRSS2	chr21	42842575	-	DIAPH1	chr5	140914000	-	0.002455911	0.9975441
ENST00000398585	ENST00000398566	TMPRSS2	chr21	42842575	-	DIAPH1	chr5	140914000	-	0.002455911	0.9975441
ENST00000398585	ENST00000398562	TMPRSS2	chr21	42842575	-	DIAPH1	chr5	140914000	-	0.002455911	0.9975441
ENST00000398585	ENST00000398557	TMPRSS2	chr21	42842575	-	DIAPH1	chr5	140914000	-	0.002479393	0.9975206
ENST00000398585	ENST00000389057	TMPRSS2	chr21	42842575	-	DIAPH1	chr5	140914000	-	0.002479393	0.9975206
ENST00000398585	ENST00000518047	TMPRSS2	chr21	42842575	-	DIAPH1	chr5	140914000	-	0.003860557	0.99613947

Top

Fusion Amino Acid Sequences

For individual full-length fusion transcript sequence from FusionPDB, we ran ORFfinder and chose the longest ORF among the all predicted ones.

>FusionGDB ID_FusionGDB isoform ID_FGname_Hgene_Hchr_Hbp_Henst_Tgene_Tchr_Tbp_Tenst_length(fusion AA) seq_BP

>92374_92374_1_TMPRSS2-DIAPH1_TMPRSS2_chr21_42842575_ENST00000332149_DIAPH1_chr5_140914000_ENST00000253811_length(amino acids)=835AA_BP=390
MALNSGSPPAIGPYYENHGYQPENPYPAQPTVVPTVYEVHPAQYYPSPVPQYAPRVLTQASNPVVCTQPKSPSGTVCTSKTKKALCITLT
LGTFLVGAALAAGLLWKFMGSKCSNSGIECDSSGTCINPSNWCDGVSHCPGGEDENRCVRLYGPNFILQVYSSQRKSWHPVCQDDWNENY
GRAACRDMGYKNNFYSSQGIVDDSGSTSFMKLNTSAGNVDIYKKLYHSDACSSKAVVSLRCIACGVNLNSSRQSRIVGGESALPGAWPWQ
VSLHVQNVHVCGGSIITPEWIVTAAHCVEKPLNNPWHWTAFAGILRQSFMFYGAGYQVEKVISHPNYDSKTKNNDIALMKLQKPLTFNDL
VKPVCLPNPGMMLQPEQLCWISGWGATEEKAKKDQEGGEEKKSVQKKKVKELKVLDSKTAQNLSIFLGSFRMPYQEIKNVILEVNEAVLT
ESMIQNLIKQMPEPEQLKMLSELKDEYDDLAESEQFGVVMGTVPRLRPRLNAILFKLQFSEQVENIKPEIVSVTAACEELRKSESFSNLL
EITLLVGNYMNAGSRNAGAFGFNISFLCKLRDTKSTDQKMTLLHFLAELCENDYPDVLKFPDELAHVEKASRVSAENLQKNLDQMKKQIS
DVERDVQNFPAATDEKDKFVEKMTIFVKDAQEQYNKLRMMHSNMETLYKELGEYFLFDPKKLSVEEFFMDLHNFRNMFLQAVKENQKRRE
TEEKMRRAKLAKEKAEKERLEKQQKREQLIDMNAEGDETGVMDSLLEALQSGAAFRRKRGPRQANRKAGCAVTSLLASELTKDDAMAAVP

--------------------------------------------------------------

>92374_92374_2_TMPRSS2-DIAPH1_TMPRSS2_chr21_42842575_ENST00000332149_DIAPH1_chr5_140914000_ENST00000389054_length(amino acids)=835AA_BP=390
MALNSGSPPAIGPYYENHGYQPENPYPAQPTVVPTVYEVHPAQYYPSPVPQYAPRVLTQASNPVVCTQPKSPSGTVCTSKTKKALCITLT
LGTFLVGAALAAGLLWKFMGSKCSNSGIECDSSGTCINPSNWCDGVSHCPGGEDENRCVRLYGPNFILQVYSSQRKSWHPVCQDDWNENY
GRAACRDMGYKNNFYSSQGIVDDSGSTSFMKLNTSAGNVDIYKKLYHSDACSSKAVVSLRCIACGVNLNSSRQSRIVGGESALPGAWPWQ
VSLHVQNVHVCGGSIITPEWIVTAAHCVEKPLNNPWHWTAFAGILRQSFMFYGAGYQVEKVISHPNYDSKTKNNDIALMKLQKPLTFNDL
VKPVCLPNPGMMLQPEQLCWISGWGATEEKAKKDQEGGEEKKSVQKKKVKELKVLDSKTAQNLSIFLGSFRMPYQEIKNVILEVNEAVLT
ESMIQNLIKQMPEPEQLKMLSELKDEYDDLAESEQFGVVMGTVPRLRPRLNAILFKLQFSEQVENIKPEIVSVTAACEELRKSESFSNLL
EITLLVGNYMNAGSRNAGAFGFNISFLCKLRDTKSTDQKMTLLHFLAELCENDYPDVLKFPDELAHVEKASRVSAENLQKNLDQMKKQIS
DVERDVQNFPAATDEKDKFVEKMTSFVKDAQEQYNKLRMMHSNMETLYKELGEYFLFDPKKLSVEEFFMDLHNFRNMFLQAVKENQKRRE
TEEKMRRAKLAKEKAEKERLEKQQKREQLIDMNAEGDETGVMDSLLEALQSGAAFRRKRGPRQANRKAGCAVTSLLASELTKDDAMAAVP

--------------------------------------------------------------

>92374_92374_3_TMPRSS2-DIAPH1_TMPRSS2_chr21_42842575_ENST00000332149_DIAPH1_chr5_140914000_ENST00000389057_length(amino acids)=835AA_BP=390
MALNSGSPPAIGPYYENHGYQPENPYPAQPTVVPTVYEVHPAQYYPSPVPQYAPRVLTQASNPVVCTQPKSPSGTVCTSKTKKALCITLT
LGTFLVGAALAAGLLWKFMGSKCSNSGIECDSSGTCINPSNWCDGVSHCPGGEDENRCVRLYGPNFILQVYSSQRKSWHPVCQDDWNENY
GRAACRDMGYKNNFYSSQGIVDDSGSTSFMKLNTSAGNVDIYKKLYHSDACSSKAVVSLRCIACGVNLNSSRQSRIVGGESALPGAWPWQ
VSLHVQNVHVCGGSIITPEWIVTAAHCVEKPLNNPWHWTAFAGILRQSFMFYGAGYQVEKVISHPNYDSKTKNNDIALMKLQKPLTFNDL
VKPVCLPNPGMMLQPEQLCWISGWGATEEKAKKDQEGGEEKKSVQKKKVKELKVLDSKTAQNLSIFLGSFRMPYQEIKNVILEVNEAVLT
ESMIQNLIKQMPEPEQLKMLSELKDEYDDLAESEQFGVVMGTVPRLRPRLNAILFKLQFSEQVENIKPEIVSVTAACEELRKSESFSNLL
EITLLVGNYMNAGSRNAGAFGFNISFLCKLRDTKSTDQKMTLLHFLAELCENDYPDVLKFPDELAHVEKASRVSAENLQKNLDQMKKQIS
DVERDVQNFPAATDEKDKFVEKMTSFVKDAQEQYNKLRMMHSNMETLYKELGEYFLFDPKKLSVEEFFMDLHNFRNMFLQAVKENQKRRE
TEEKMRRAKLAKEKAEKERLEKQQKREQLIDMNAEGDETGVMDSLLEALQSGAAFRRKRGPRQANRKAGCAVTSLLASELTKDDAMAAVP

--------------------------------------------------------------

>92374_92374_4_TMPRSS2-DIAPH1_TMPRSS2_chr21_42842575_ENST00000332149_DIAPH1_chr5_140914000_ENST00000398557_length(amino acids)=835AA_BP=390
MALNSGSPPAIGPYYENHGYQPENPYPAQPTVVPTVYEVHPAQYYPSPVPQYAPRVLTQASNPVVCTQPKSPSGTVCTSKTKKALCITLT
LGTFLVGAALAAGLLWKFMGSKCSNSGIECDSSGTCINPSNWCDGVSHCPGGEDENRCVRLYGPNFILQVYSSQRKSWHPVCQDDWNENY
GRAACRDMGYKNNFYSSQGIVDDSGSTSFMKLNTSAGNVDIYKKLYHSDACSSKAVVSLRCIACGVNLNSSRQSRIVGGESALPGAWPWQ
VSLHVQNVHVCGGSIITPEWIVTAAHCVEKPLNNPWHWTAFAGILRQSFMFYGAGYQVEKVISHPNYDSKTKNNDIALMKLQKPLTFNDL
VKPVCLPNPGMMLQPEQLCWISGWGATEEKAKKDQEGGEEKKSVQKKKVKELKVLDSKTAQNLSIFLGSFRMPYQEIKNVILEVNEAVLT
ESMIQNLIKQMPEPEQLKMLSELKDEYDDLAESEQFGVVMGTVPRLRPRLNAILFKLQFSEQVENIKPEIVSVTAACEELRKSESFSNLL
EITLLVGNYMNAGSRNAGAFGFNISFLCKLRDTKSTDQKMTLLHFLAELCENDYPDVLKFPDELAHVEKASRVSAENLQKNLDQMKKQIS
DVERDVQNFPAATDEKDKFVEKMTSFVKDAQEQYNKLRMMHSNMETLYKELGEYFLFDPKKLSVEEFFMDLHNFRNMFLQAVKENQKRRE
TEEKMRRAKLAKEKAEKERLEKQQKREQLIDMNAEGDETGVMDSLLEALQSGAAFRRKRGPRQANRKAGCAVTSLLASELTKDDAMAAVP

--------------------------------------------------------------

>92374_92374_5_TMPRSS2-DIAPH1_TMPRSS2_chr21_42842575_ENST00000332149_DIAPH1_chr5_140914000_ENST00000398562_length(amino acids)=835AA_BP=390
MALNSGSPPAIGPYYENHGYQPENPYPAQPTVVPTVYEVHPAQYYPSPVPQYAPRVLTQASNPVVCTQPKSPSGTVCTSKTKKALCITLT
LGTFLVGAALAAGLLWKFMGSKCSNSGIECDSSGTCINPSNWCDGVSHCPGGEDENRCVRLYGPNFILQVYSSQRKSWHPVCQDDWNENY
GRAACRDMGYKNNFYSSQGIVDDSGSTSFMKLNTSAGNVDIYKKLYHSDACSSKAVVSLRCIACGVNLNSSRQSRIVGGESALPGAWPWQ
VSLHVQNVHVCGGSIITPEWIVTAAHCVEKPLNNPWHWTAFAGILRQSFMFYGAGYQVEKVISHPNYDSKTKNNDIALMKLQKPLTFNDL
VKPVCLPNPGMMLQPEQLCWISGWGATEEKAKKDQEGGEEKKSVQKKKVKELKVLDSKTAQNLSIFLGSFRMPYQEIKNVILEVNEAVLT
ESMIQNLIKQMPEPEQLKMLSELKDEYDDLAESEQFGVVMGTVPRLRPRLNAILFKLQFSEQVENIKPEIVSVTAACEELRKSESFSNLL
EITLLVGNYMNAGSRNAGAFGFNISFLCKLRDTKSTDQKMTLLHFLAELCENDYPDVLKFPDELAHVEKASRVSAENLQKNLDQMKKQIS
DVERDVQNFPAATDEKDKFVEKMTIFVKDAQEQYNKLRMMHSNMETLYKELGEYFLFDPKKLSVEEFFMDLHNFRNMFLQAVKENQKRRE
TEEKMRRAKLAKEKAEKERLEKQQKREQLIDMNAEGDETGVMDSLLEALQSGAAFRRKRGPRQANRKAGCAVTSLLASELTKDDAMAAVP

--------------------------------------------------------------

>92374_92374_6_TMPRSS2-DIAPH1_TMPRSS2_chr21_42842575_ENST00000332149_DIAPH1_chr5_140914000_ENST00000398566_length(amino acids)=835AA_BP=390
MALNSGSPPAIGPYYENHGYQPENPYPAQPTVVPTVYEVHPAQYYPSPVPQYAPRVLTQASNPVVCTQPKSPSGTVCTSKTKKALCITLT
LGTFLVGAALAAGLLWKFMGSKCSNSGIECDSSGTCINPSNWCDGVSHCPGGEDENRCVRLYGPNFILQVYSSQRKSWHPVCQDDWNENY
GRAACRDMGYKNNFYSSQGIVDDSGSTSFMKLNTSAGNVDIYKKLYHSDACSSKAVVSLRCIACGVNLNSSRQSRIVGGESALPGAWPWQ
VSLHVQNVHVCGGSIITPEWIVTAAHCVEKPLNNPWHWTAFAGILRQSFMFYGAGYQVEKVISHPNYDSKTKNNDIALMKLQKPLTFNDL
VKPVCLPNPGMMLQPEQLCWISGWGATEEKAKKDQEGGEEKKSVQKKKVKELKVLDSKTAQNLSIFLGSFRMPYQEIKNVILEVNEAVLT
ESMIQNLIKQMPEPEQLKMLSELKDEYDDLAESEQFGVVMGTVPRLRPRLNAILFKLQFSEQVENIKPEIVSVTAACEELRKSESFSNLL
EITLLVGNYMNAGSRNAGAFGFNISFLCKLRDTKSTDQKMTLLHFLAELCENDYPDVLKFPDELAHVEKASRVSAENLQKNLDQMKKQIS
DVERDVQNFPAATDEKDKFVEKMTIFVKDAQEQYNKLRMMHSNMETLYKELGEYFLFDPKKLSVEEFFMDLHNFRNMFLQAVKENQKRRE
TEEKMRRAKLAKEKAEKERLEKQQKREQLIDMNAEGDETGVMDSLLEALQSGAAFRRKRGPRQANRKAGCAVTSLLASELTKDDAMAAVP

--------------------------------------------------------------

>92374_92374_7_TMPRSS2-DIAPH1_TMPRSS2_chr21_42842575_ENST00000332149_DIAPH1_chr5_140914000_ENST00000518047_length(amino acids)=835AA_BP=390
MALNSGSPPAIGPYYENHGYQPENPYPAQPTVVPTVYEVHPAQYYPSPVPQYAPRVLTQASNPVVCTQPKSPSGTVCTSKTKKALCITLT
LGTFLVGAALAAGLLWKFMGSKCSNSGIECDSSGTCINPSNWCDGVSHCPGGEDENRCVRLYGPNFILQVYSSQRKSWHPVCQDDWNENY
GRAACRDMGYKNNFYSSQGIVDDSGSTSFMKLNTSAGNVDIYKKLYHSDACSSKAVVSLRCIACGVNLNSSRQSRIVGGESALPGAWPWQ
VSLHVQNVHVCGGSIITPEWIVTAAHCVEKPLNNPWHWTAFAGILRQSFMFYGAGYQVEKVISHPNYDSKTKNNDIALMKLQKPLTFNDL
VKPVCLPNPGMMLQPEQLCWISGWGATEEKAKKDQEGGEEKKSVQKKKVKELKVLDSKTAQNLSIFLGSFRMPYQEIKNVILEVNEAVLT
ESMIQNLIKQMPEPEQLKMLSELKDEYDDLAESEQFGVVMGTVPRLRPRLNAILFKLQFSEQVENIKPEIVSVTAACEELRKSESFSNLL
EITLLVGNYMNAGSRNAGAFGFNISFLCKLRDTKSTDQKMTLLHFLAELCENDYPDVLKFPDELAHVEKASRVSAENLQKNLDQMKKQIS
DVERDVQNFPAATDEKDKFVEKMTSFVKDAQEQYNKLRMMHSNMETLYKELGEYFLFDPKKLSVEEFFMDLHNFRNMFLQAVKENQKRRE
TEEKMRRAKLAKEKAEKERLEKQQKREQLIDMNAEGDETGVMDSLLEALQSGAAFRRKRGPRQANRKAGCAVTSLLASELTKDDAMAAVP

--------------------------------------------------------------

>92374_92374_8_TMPRSS2-DIAPH1_TMPRSS2_chr21_42842575_ENST00000332149_DIAPH1_chr5_140914000_ENST00000520569_length(amino acids)=835AA_BP=390
MALNSGSPPAIGPYYENHGYQPENPYPAQPTVVPTVYEVHPAQYYPSPVPQYAPRVLTQASNPVVCTQPKSPSGTVCTSKTKKALCITLT
LGTFLVGAALAAGLLWKFMGSKCSNSGIECDSSGTCINPSNWCDGVSHCPGGEDENRCVRLYGPNFILQVYSSQRKSWHPVCQDDWNENY
GRAACRDMGYKNNFYSSQGIVDDSGSTSFMKLNTSAGNVDIYKKLYHSDACSSKAVVSLRCIACGVNLNSSRQSRIVGGESALPGAWPWQ
VSLHVQNVHVCGGSIITPEWIVTAAHCVEKPLNNPWHWTAFAGILRQSFMFYGAGYQVEKVISHPNYDSKTKNNDIALMKLQKPLTFNDL
VKPVCLPNPGMMLQPEQLCWISGWGATEEKAKKDQEGGEEKKSVQKKKVKELKVLDSKTAQNLSIFLGSFRMPYQEIKNVILEVNEAVLT
ESMIQNLIKQMPEPEQLKMLSELKDEYDDLAESEQFGVVMGTVPRLRPRLNAILFKLQFSEQVENIKPEIVSVTAACEELRKSESFSNLL
EITLLVGNYMNAGSRNAGAFGFNISFLCKLRDTKSTDQKMTLLHFLAELCENDYPDVLKFPDELAHVEKASRVSAENLQKNLDQMKKQIS
DVERDVQNFPAATDEKDKFVEKMTSFVKDAQEQYNKLRMMHSNMETLYKELGEYFLFDPKKLSVEEFFMDLHNFRNMFLQAVKENQKRRE
TEEKMRRAKLAKEKAEKERLEKQQKREQLIDMNAEGDETGVMDSLLEALQSGAAFRRKRGPRQANRKAGCAVTSLLASELTKDDAMAAVP

--------------------------------------------------------------

>92374_92374_9_TMPRSS2-DIAPH1_TMPRSS2_chr21_42842575_ENST00000398585_DIAPH1_chr5_140914000_ENST00000253811_length(amino acids)=879AA_BP=434
MGAWDPPMPPAPPGGESGCEERGAAGHIEHSRYLSLLDAVDNSKMALNSGSPPAIGPYYENHGYQPENPYPAQPTVVPTVYEVHPAQYYP
SPVPQYAPRVLTQASNPVVCTQPKSPSGTVCTSKTKKALCITLTLGTFLVGAALAAGLLWKFMGSKCSNSGIECDSSGTCINPSNWCDGV
SHCPGGEDENRCVRLYGPNFILQVYSSQRKSWHPVCQDDWNENYGRAACRDMGYKNNFYSSQGIVDDSGSTSFMKLNTSAGNVDIYKKLY
HSDACSSKAVVSLRCIACGVNLNSSRQSRIVGGESALPGAWPWQVSLHVQNVHVCGGSIITPEWIVTAAHCVEKPLNNPWHWTAFAGILR
QSFMFYGAGYQVEKVISHPNYDSKTKNNDIALMKLQKPLTFNDLVKPVCLPNPGMMLQPEQLCWISGWGATEEKAKKDQEGGEEKKSVQK
KKVKELKVLDSKTAQNLSIFLGSFRMPYQEIKNVILEVNEAVLTESMIQNLIKQMPEPEQLKMLSELKDEYDDLAESEQFGVVMGTVPRL
RPRLNAILFKLQFSEQVENIKPEIVSVTAACEELRKSESFSNLLEITLLVGNYMNAGSRNAGAFGFNISFLCKLRDTKSTDQKMTLLHFL
AELCENDYPDVLKFPDELAHVEKASRVSAENLQKNLDQMKKQISDVERDVQNFPAATDEKDKFVEKMTIFVKDAQEQYNKLRMMHSNMET
LYKELGEYFLFDPKKLSVEEFFMDLHNFRNMFLQAVKENQKRRETEEKMRRAKLAKEKAEKERLEKQQKREQLIDMNAEGDETGVMDSLL

--------------------------------------------------------------

>92374_92374_10_TMPRSS2-DIAPH1_TMPRSS2_chr21_42842575_ENST00000398585_DIAPH1_chr5_140914000_ENST00000389054_length(amino acids)=879AA_BP=434
MGAWDPPMPPAPPGGESGCEERGAAGHIEHSRYLSLLDAVDNSKMALNSGSPPAIGPYYENHGYQPENPYPAQPTVVPTVYEVHPAQYYP
SPVPQYAPRVLTQASNPVVCTQPKSPSGTVCTSKTKKALCITLTLGTFLVGAALAAGLLWKFMGSKCSNSGIECDSSGTCINPSNWCDGV
SHCPGGEDENRCVRLYGPNFILQVYSSQRKSWHPVCQDDWNENYGRAACRDMGYKNNFYSSQGIVDDSGSTSFMKLNTSAGNVDIYKKLY
HSDACSSKAVVSLRCIACGVNLNSSRQSRIVGGESALPGAWPWQVSLHVQNVHVCGGSIITPEWIVTAAHCVEKPLNNPWHWTAFAGILR
QSFMFYGAGYQVEKVISHPNYDSKTKNNDIALMKLQKPLTFNDLVKPVCLPNPGMMLQPEQLCWISGWGATEEKAKKDQEGGEEKKSVQK
KKVKELKVLDSKTAQNLSIFLGSFRMPYQEIKNVILEVNEAVLTESMIQNLIKQMPEPEQLKMLSELKDEYDDLAESEQFGVVMGTVPRL
RPRLNAILFKLQFSEQVENIKPEIVSVTAACEELRKSESFSNLLEITLLVGNYMNAGSRNAGAFGFNISFLCKLRDTKSTDQKMTLLHFL
AELCENDYPDVLKFPDELAHVEKASRVSAENLQKNLDQMKKQISDVERDVQNFPAATDEKDKFVEKMTSFVKDAQEQYNKLRMMHSNMET
LYKELGEYFLFDPKKLSVEEFFMDLHNFRNMFLQAVKENQKRRETEEKMRRAKLAKEKAEKERLEKQQKREQLIDMNAEGDETGVMDSLL

--------------------------------------------------------------

>92374_92374_11_TMPRSS2-DIAPH1_TMPRSS2_chr21_42842575_ENST00000398585_DIAPH1_chr5_140914000_ENST00000389057_length(amino acids)=879AA_BP=434
MGAWDPPMPPAPPGGESGCEERGAAGHIEHSRYLSLLDAVDNSKMALNSGSPPAIGPYYENHGYQPENPYPAQPTVVPTVYEVHPAQYYP
SPVPQYAPRVLTQASNPVVCTQPKSPSGTVCTSKTKKALCITLTLGTFLVGAALAAGLLWKFMGSKCSNSGIECDSSGTCINPSNWCDGV
SHCPGGEDENRCVRLYGPNFILQVYSSQRKSWHPVCQDDWNENYGRAACRDMGYKNNFYSSQGIVDDSGSTSFMKLNTSAGNVDIYKKLY
HSDACSSKAVVSLRCIACGVNLNSSRQSRIVGGESALPGAWPWQVSLHVQNVHVCGGSIITPEWIVTAAHCVEKPLNNPWHWTAFAGILR
QSFMFYGAGYQVEKVISHPNYDSKTKNNDIALMKLQKPLTFNDLVKPVCLPNPGMMLQPEQLCWISGWGATEEKAKKDQEGGEEKKSVQK
KKVKELKVLDSKTAQNLSIFLGSFRMPYQEIKNVILEVNEAVLTESMIQNLIKQMPEPEQLKMLSELKDEYDDLAESEQFGVVMGTVPRL
RPRLNAILFKLQFSEQVENIKPEIVSVTAACEELRKSESFSNLLEITLLVGNYMNAGSRNAGAFGFNISFLCKLRDTKSTDQKMTLLHFL
AELCENDYPDVLKFPDELAHVEKASRVSAENLQKNLDQMKKQISDVERDVQNFPAATDEKDKFVEKMTSFVKDAQEQYNKLRMMHSNMET
LYKELGEYFLFDPKKLSVEEFFMDLHNFRNMFLQAVKENQKRRETEEKMRRAKLAKEKAEKERLEKQQKREQLIDMNAEGDETGVMDSLL

--------------------------------------------------------------

>92374_92374_12_TMPRSS2-DIAPH1_TMPRSS2_chr21_42842575_ENST00000398585_DIAPH1_chr5_140914000_ENST00000398557_length(amino acids)=879AA_BP=434
MGAWDPPMPPAPPGGESGCEERGAAGHIEHSRYLSLLDAVDNSKMALNSGSPPAIGPYYENHGYQPENPYPAQPTVVPTVYEVHPAQYYP
SPVPQYAPRVLTQASNPVVCTQPKSPSGTVCTSKTKKALCITLTLGTFLVGAALAAGLLWKFMGSKCSNSGIECDSSGTCINPSNWCDGV
SHCPGGEDENRCVRLYGPNFILQVYSSQRKSWHPVCQDDWNENYGRAACRDMGYKNNFYSSQGIVDDSGSTSFMKLNTSAGNVDIYKKLY
HSDACSSKAVVSLRCIACGVNLNSSRQSRIVGGESALPGAWPWQVSLHVQNVHVCGGSIITPEWIVTAAHCVEKPLNNPWHWTAFAGILR
QSFMFYGAGYQVEKVISHPNYDSKTKNNDIALMKLQKPLTFNDLVKPVCLPNPGMMLQPEQLCWISGWGATEEKAKKDQEGGEEKKSVQK
KKVKELKVLDSKTAQNLSIFLGSFRMPYQEIKNVILEVNEAVLTESMIQNLIKQMPEPEQLKMLSELKDEYDDLAESEQFGVVMGTVPRL
RPRLNAILFKLQFSEQVENIKPEIVSVTAACEELRKSESFSNLLEITLLVGNYMNAGSRNAGAFGFNISFLCKLRDTKSTDQKMTLLHFL
AELCENDYPDVLKFPDELAHVEKASRVSAENLQKNLDQMKKQISDVERDVQNFPAATDEKDKFVEKMTSFVKDAQEQYNKLRMMHSNMET
LYKELGEYFLFDPKKLSVEEFFMDLHNFRNMFLQAVKENQKRRETEEKMRRAKLAKEKAEKERLEKQQKREQLIDMNAEGDETGVMDSLL

--------------------------------------------------------------

>92374_92374_13_TMPRSS2-DIAPH1_TMPRSS2_chr21_42842575_ENST00000398585_DIAPH1_chr5_140914000_ENST00000398562_length(amino acids)=879AA_BP=434
MGAWDPPMPPAPPGGESGCEERGAAGHIEHSRYLSLLDAVDNSKMALNSGSPPAIGPYYENHGYQPENPYPAQPTVVPTVYEVHPAQYYP
SPVPQYAPRVLTQASNPVVCTQPKSPSGTVCTSKTKKALCITLTLGTFLVGAALAAGLLWKFMGSKCSNSGIECDSSGTCINPSNWCDGV
SHCPGGEDENRCVRLYGPNFILQVYSSQRKSWHPVCQDDWNENYGRAACRDMGYKNNFYSSQGIVDDSGSTSFMKLNTSAGNVDIYKKLY
HSDACSSKAVVSLRCIACGVNLNSSRQSRIVGGESALPGAWPWQVSLHVQNVHVCGGSIITPEWIVTAAHCVEKPLNNPWHWTAFAGILR
QSFMFYGAGYQVEKVISHPNYDSKTKNNDIALMKLQKPLTFNDLVKPVCLPNPGMMLQPEQLCWISGWGATEEKAKKDQEGGEEKKSVQK
KKVKELKVLDSKTAQNLSIFLGSFRMPYQEIKNVILEVNEAVLTESMIQNLIKQMPEPEQLKMLSELKDEYDDLAESEQFGVVMGTVPRL
RPRLNAILFKLQFSEQVENIKPEIVSVTAACEELRKSESFSNLLEITLLVGNYMNAGSRNAGAFGFNISFLCKLRDTKSTDQKMTLLHFL
AELCENDYPDVLKFPDELAHVEKASRVSAENLQKNLDQMKKQISDVERDVQNFPAATDEKDKFVEKMTIFVKDAQEQYNKLRMMHSNMET
LYKELGEYFLFDPKKLSVEEFFMDLHNFRNMFLQAVKENQKRRETEEKMRRAKLAKEKAEKERLEKQQKREQLIDMNAEGDETGVMDSLL

--------------------------------------------------------------

>92374_92374_14_TMPRSS2-DIAPH1_TMPRSS2_chr21_42842575_ENST00000398585_DIAPH1_chr5_140914000_ENST00000398566_length(amino acids)=879AA_BP=434
MGAWDPPMPPAPPGGESGCEERGAAGHIEHSRYLSLLDAVDNSKMALNSGSPPAIGPYYENHGYQPENPYPAQPTVVPTVYEVHPAQYYP
SPVPQYAPRVLTQASNPVVCTQPKSPSGTVCTSKTKKALCITLTLGTFLVGAALAAGLLWKFMGSKCSNSGIECDSSGTCINPSNWCDGV
SHCPGGEDENRCVRLYGPNFILQVYSSQRKSWHPVCQDDWNENYGRAACRDMGYKNNFYSSQGIVDDSGSTSFMKLNTSAGNVDIYKKLY
HSDACSSKAVVSLRCIACGVNLNSSRQSRIVGGESALPGAWPWQVSLHVQNVHVCGGSIITPEWIVTAAHCVEKPLNNPWHWTAFAGILR
QSFMFYGAGYQVEKVISHPNYDSKTKNNDIALMKLQKPLTFNDLVKPVCLPNPGMMLQPEQLCWISGWGATEEKAKKDQEGGEEKKSVQK
KKVKELKVLDSKTAQNLSIFLGSFRMPYQEIKNVILEVNEAVLTESMIQNLIKQMPEPEQLKMLSELKDEYDDLAESEQFGVVMGTVPRL
RPRLNAILFKLQFSEQVENIKPEIVSVTAACEELRKSESFSNLLEITLLVGNYMNAGSRNAGAFGFNISFLCKLRDTKSTDQKMTLLHFL
AELCENDYPDVLKFPDELAHVEKASRVSAENLQKNLDQMKKQISDVERDVQNFPAATDEKDKFVEKMTIFVKDAQEQYNKLRMMHSNMET
LYKELGEYFLFDPKKLSVEEFFMDLHNFRNMFLQAVKENQKRRETEEKMRRAKLAKEKAEKERLEKQQKREQLIDMNAEGDETGVMDSLL

--------------------------------------------------------------

>92374_92374_15_TMPRSS2-DIAPH1_TMPRSS2_chr21_42842575_ENST00000398585_DIAPH1_chr5_140914000_ENST00000518047_length(amino acids)=879AA_BP=434
MGAWDPPMPPAPPGGESGCEERGAAGHIEHSRYLSLLDAVDNSKMALNSGSPPAIGPYYENHGYQPENPYPAQPTVVPTVYEVHPAQYYP
SPVPQYAPRVLTQASNPVVCTQPKSPSGTVCTSKTKKALCITLTLGTFLVGAALAAGLLWKFMGSKCSNSGIECDSSGTCINPSNWCDGV
SHCPGGEDENRCVRLYGPNFILQVYSSQRKSWHPVCQDDWNENYGRAACRDMGYKNNFYSSQGIVDDSGSTSFMKLNTSAGNVDIYKKLY
HSDACSSKAVVSLRCIACGVNLNSSRQSRIVGGESALPGAWPWQVSLHVQNVHVCGGSIITPEWIVTAAHCVEKPLNNPWHWTAFAGILR
QSFMFYGAGYQVEKVISHPNYDSKTKNNDIALMKLQKPLTFNDLVKPVCLPNPGMMLQPEQLCWISGWGATEEKAKKDQEGGEEKKSVQK
KKVKELKVLDSKTAQNLSIFLGSFRMPYQEIKNVILEVNEAVLTESMIQNLIKQMPEPEQLKMLSELKDEYDDLAESEQFGVVMGTVPRL
RPRLNAILFKLQFSEQVENIKPEIVSVTAACEELRKSESFSNLLEITLLVGNYMNAGSRNAGAFGFNISFLCKLRDTKSTDQKMTLLHFL
AELCENDYPDVLKFPDELAHVEKASRVSAENLQKNLDQMKKQISDVERDVQNFPAATDEKDKFVEKMTSFVKDAQEQYNKLRMMHSNMET
LYKELGEYFLFDPKKLSVEEFFMDLHNFRNMFLQAVKENQKRRETEEKMRRAKLAKEKAEKERLEKQQKREQLIDMNAEGDETGVMDSLL

--------------------------------------------------------------

>92374_92374_16_TMPRSS2-DIAPH1_TMPRSS2_chr21_42842575_ENST00000398585_DIAPH1_chr5_140914000_ENST00000520569_length(amino acids)=879AA_BP=434
MGAWDPPMPPAPPGGESGCEERGAAGHIEHSRYLSLLDAVDNSKMALNSGSPPAIGPYYENHGYQPENPYPAQPTVVPTVYEVHPAQYYP
SPVPQYAPRVLTQASNPVVCTQPKSPSGTVCTSKTKKALCITLTLGTFLVGAALAAGLLWKFMGSKCSNSGIECDSSGTCINPSNWCDGV
SHCPGGEDENRCVRLYGPNFILQVYSSQRKSWHPVCQDDWNENYGRAACRDMGYKNNFYSSQGIVDDSGSTSFMKLNTSAGNVDIYKKLY
HSDACSSKAVVSLRCIACGVNLNSSRQSRIVGGESALPGAWPWQVSLHVQNVHVCGGSIITPEWIVTAAHCVEKPLNNPWHWTAFAGILR
QSFMFYGAGYQVEKVISHPNYDSKTKNNDIALMKLQKPLTFNDLVKPVCLPNPGMMLQPEQLCWISGWGATEEKAKKDQEGGEEKKSVQK
KKVKELKVLDSKTAQNLSIFLGSFRMPYQEIKNVILEVNEAVLTESMIQNLIKQMPEPEQLKMLSELKDEYDDLAESEQFGVVMGTVPRL
RPRLNAILFKLQFSEQVENIKPEIVSVTAACEELRKSESFSNLLEITLLVGNYMNAGSRNAGAFGFNISFLCKLRDTKSTDQKMTLLHFL
AELCENDYPDVLKFPDELAHVEKASRVSAENLQKNLDQMKKQISDVERDVQNFPAATDEKDKFVEKMTSFVKDAQEQYNKLRMMHSNMET
LYKELGEYFLFDPKKLSVEEFFMDLHNFRNMFLQAVKENQKRRETEEKMRRAKLAKEKAEKERLEKQQKREQLIDMNAEGDETGVMDSLL

--------------------------------------------------------------

Top

Fusion Protein Functional Features

Four levels of functional features of fusion genes
Go to FGviewer search page for the most frequent breakpoint (https://ccsmweb.uth.edu/FGviewer/chr21:42842575/chr5:140914000)
- FGviewer provides the online visualization of the retention search of the protein functional features across DNA, RNA, protein, and pathological levels.
- How to search
1. Put your fusion gene symbol.
2. Press the tab key until there will be shown the breakpoint information filled.
4. Go down and press 'Search' tab twice.
4. Go down to have the hyperlink of the search result.
5. Click the hyperlink.
6. See the FGviewer result for your fusion gene.

Main function of each fusion partner protein. (from UniProt)

Hgene	Tgene
TMPRSS2 O15393	DIAPH1 O60610
FUNCTION: Plasma membrane-anchored serine protease that participates in proteolytic cascades of relevance for the normal physiologic function of the prostate (PubMed:25122198). Androgen-induced TMPRSS2 activates several substrates that include pro-hepatocyte growth factor/HGF, the protease activated receptor-2/F2RL1 or matriptase/ST14 leading to extracellular matrix disruption and metastasis of prostate cancer cells (PubMed:15537383, PubMed:26018085, PubMed:25122198). In addition, activates trigeminal neurons and contribute to both spontaneous pain and mechanical allodynia (By similarity). {ECO:0000250\|UniProtKB:Q9JIQ8, ECO:0000269\|PubMed:15537383, ECO:0000269\|PubMed:25122198, ECO:0000269\|PubMed:26018085}.; FUNCTION: (Microbial infection) Facilitates human coronaviruses SARS-CoV and SARS-CoV-2 infections via two independent mechanisms, proteolytic cleavage of ACE2 receptor which promotes viral uptake, and cleavage of coronavirus spike glycoproteins which activates the glycoprotein for host cell entry (PubMed:24227843, PubMed:32142651, PubMed:32404436, PubMed:34159616, PubMed:33051876). Upon SARS-CoV-2 infection, increases syncytia formation by accelerating the fusion process (PubMed:34159616, PubMed:33051876). Proteolytically cleaves and activates the spike glycoproteins of human coronavirus 229E (HCoV-229E) and human coronavirus EMC (HCoV-EMC) and the fusion glycoproteins F0 of Sendai virus (SeV), human metapneumovirus (HMPV), human parainfluenza 1, 2, 3, 4a and 4b viruses (HPIV). Essential for spread and pathogenesis of influenza A virus (strains H1N1, H3N2 and H7N9); involved in proteolytic cleavage and activation of hemagglutinin (HA) protein which is essential for viral infectivity. {ECO:0000269\|PubMed:21068237, ECO:0000269\|PubMed:21325420, ECO:0000269\|PubMed:23536651, ECO:0000269\|PubMed:23966399, ECO:0000269\|PubMed:24027332, ECO:0000269\|PubMed:24227843, ECO:0000269\|PubMed:32142651, ECO:0000269\|PubMed:32404436, ECO:0000269\|PubMed:33051876, ECO:0000269\|PubMed:34159616}.	FUNCTION: Actin nucleation and elongation factor required for the assembly of F-actin structures, such as actin cables and stress fibers (By similarity). Binds to the barbed end of the actin filament and slows down actin polymerization and depolymerization (By similarity). Required for cytokinesis, and transcriptional activation of the serum response factor (By similarity). DFR proteins couple Rho and Src tyrosine kinase during signaling and the regulation of actin dynamics (By similarity). Functions as a scaffold protein for MAPRE1 and APC to stabilize microtubules and promote cell migration (By similarity). Has neurite outgrowth promoting activity. Acts in a Rho-dependent manner to recruit PFY1 to the membrane (By similarity). In hear cells, it may play a role in the regulation of actin polymerization in hair cells (PubMed:20937854, PubMed:21834987, PubMed:26912466). The MEMO1-RHOA-DIAPH1 signaling pathway plays an important role in ERBB2-dependent stabilization of microtubules at the cell cortex (PubMed:20937854, PubMed:21834987). It controls the localization of APC and CLASP2 to the cell membrane, via the regulation of GSK3B activity (PubMed:20937854, PubMed:21834987). In turn, membrane-bound APC allows the localization of the MACF1 to the cell membrane, which is required for microtubule capture and stabilization (PubMed:20937854, PubMed:21834987). Plays a role in the regulation of cell morphology and cytoskeletal organization. Required in the control of cell shape (PubMed:20937854, PubMed:21834987). Plays a role in brain development (PubMed:24781755). Also acts as an actin nucleation and elongation factor in the nucleus by promoting nuclear actin polymerization inside the nucleus to drive serum-dependent SRF-MRTFA activity (By similarity). {ECO:0000250\|UniProtKB:O08808, ECO:0000269\|PubMed:20937854, ECO:0000269\|PubMed:21834987, ECO:0000269\|PubMed:24781755, ECO:0000269\|PubMed:26912466}.

Retention analysis result of each fusion partner protein across 39 protein features of UniProt such as six molecule processing features, 13 region features, four site features, six amino acid modification features, two natural variation features, five experimental info features, and 3 secondary structure features. Here, because of limited space for viewing, we only show the protein feature retention information belong to the 13 regional features. All retention annotation result can be downloaded at
download page
* Minus value of BPloci means that the break pointn is located before the CDS.

- Retained protein feature among the 13 regional features.

Partner

Gene

Hbp

Tbp

ENST

Strand

BPexon

TotalExon

Protein feature loci

*BPloci

TotalLen

Protein feature

Protein feature note

Hgene

TMPRSS2

chr21:42842575

chr5:140914000

ENST00000332149

112_149

390.3333333333333

493.0

Domain

LDL-receptor class A

Hgene

TMPRSS2

chr21:42842575

chr5:140914000

ENST00000332149

150_242

390.3333333333333

493.0

Domain

SRCR

Hgene

TMPRSS2

chr21:42842575

chr5:140914000

ENST00000398585

112_149

427.3333333333333

530.0

Domain

LDL-receptor class A

Hgene

TMPRSS2

chr21:42842575

chr5:140914000

ENST00000398585

150_242

427.3333333333333

530.0

Domain

SRCR

Hgene

TMPRSS2

chr21:42842575

chr5:140914000

ENST00000458356

112_149

390.3333333333333

493.0

Domain

LDL-receptor class A

Hgene

TMPRSS2

chr21:42842575

chr5:140914000

ENST00000458356

150_242

390.3333333333333

493.0

Domain

SRCR

Hgene

TMPRSS2

chr21:42842575

chr5:140914000

ENST00000332149

1_84

390.3333333333333

493.0

Topological domain

Cytoplasmic

Hgene

TMPRSS2

chr21:42842575

chr5:140914000

ENST00000398585

1_84

427.3333333333333

530.0

Topological domain

Cytoplasmic

Hgene

TMPRSS2

chr21:42842575

chr5:140914000

ENST00000458356

1_84

390.3333333333333

493.0

Topological domain

Cytoplasmic

Hgene

TMPRSS2

chr21:42842575

chr5:140914000

ENST00000332149

85_105

390.3333333333333

493.0

Transmembrane

Helical%3B Signal-anchor for type II membrane protein

Hgene

TMPRSS2

chr21:42842575

chr5:140914000

ENST00000398585

85_105

427.3333333333333

530.0

Transmembrane

Helical%3B Signal-anchor for type II membrane protein

Hgene

TMPRSS2

chr21:42842575

chr5:140914000

ENST00000458356

85_105

390.3333333333333

493.0

Transmembrane

Helical%3B Signal-anchor for type II membrane protein

Tgene

DIAPH1

chr21:42842575

chr5:140914000

ENST00000389057

1039_1196

818.3333333333334

1264.0

Coiled coil

Ontology_term=ECO:0000255

Tgene

DIAPH1

chr21:42842575

chr5:140914000

ENST00000398557

1039_1196

827.3333333333334

1273.0

Coiled coil

Ontology_term=ECO:0000255

Tgene

DIAPH1

chr21:42842575

chr5:140914000

ENST00000389057

1213_1216

818.3333333333334

1264.0

Compositional bias

Note=Arg/Lys-rich (basic)

Tgene

DIAPH1

chr21:42842575

chr5:140914000

ENST00000398557

1213_1216

827.3333333333334

1273.0

Compositional bias

Note=Arg/Lys-rich (basic)

Tgene

DIAPH1

chr21:42842575

chr5:140914000

ENST00000389057

1194_1222

818.3333333333334

1264.0

Domain

DAD

Tgene

DIAPH1

chr21:42842575

chr5:140914000

ENST00000398557

1194_1222

827.3333333333334

1273.0

Domain

DAD

- Not-retained protein feature among the 13 regional features.

Partner

Gene

Hbp

Tbp

ENST

Strand

BPexon

TotalExon

Protein feature loci

*BPloci

TotalLen

Protein feature

Protein feature note

Hgene

TMPRSS2

chr21:42842575

chr5:140914000

ENST00000332149

256_489

390.3333333333333

493.0

Domain

Peptidase S1

Hgene

TMPRSS2

chr21:42842575

chr5:140914000

ENST00000398585

256_489

427.3333333333333

530.0

Domain

Peptidase S1

Hgene

TMPRSS2

chr21:42842575

chr5:140914000

ENST00000458356

256_489

390.3333333333333

493.0

Domain

Peptidase S1

Hgene

TMPRSS2

chr21:42842575

chr5:140914000

ENST00000332149

106_492

390.3333333333333

493.0

Topological domain

Extracellular

Hgene

TMPRSS2

chr21:42842575

chr5:140914000

ENST00000398585

106_492

427.3333333333333

530.0

Topological domain

Extracellular

Hgene

TMPRSS2

chr21:42842575

chr5:140914000

ENST00000458356

106_492

390.3333333333333

493.0

Topological domain

Extracellular

Tgene

DIAPH1

chr21:42842575

chr5:140914000

ENST00000389057

468_572

818.3333333333334

1264.0

Coiled coil

Ontology_term=ECO:0000255

Tgene

DIAPH1

chr21:42842575

chr5:140914000

ENST00000398557

468_572

827.3333333333334

1273.0

Coiled coil

Ontology_term=ECO:0000255

Tgene

DIAPH1

chr21:42842575

chr5:140914000

ENST00000389057

583_764

818.3333333333334

1264.0

Domain

Note=FH1

Tgene

DIAPH1

chr21:42842575

chr5:140914000

ENST00000389057

769_1171

818.3333333333334

1264.0

Domain

FH2

Tgene

DIAPH1

chr21:42842575

chr5:140914000

ENST00000389057

84_449

818.3333333333334

1264.0

Domain

GBD/FH3

Tgene

DIAPH1

chr21:42842575

chr5:140914000

ENST00000398557

583_764

827.3333333333334

1273.0

Domain

Note=FH1

Tgene

DIAPH1

chr21:42842575

chr5:140914000

ENST00000398557

769_1171

827.3333333333334

1273.0

Domain

FH2

Tgene

DIAPH1

chr21:42842575

chr5:140914000

ENST00000398557

84_449

827.3333333333334

1273.0

Domain

GBD/FH3

Top

Fusion Protein Structures

PDB and CIF files of the predicted fusion proteins
* Here we show the 3D structure of the fusion proteins using Mol*. AlphaFold produces a per-residue confidence score (pLDDT) between 0 and 100. Model confidence is shown from the pLDDT values per residue. pLDDT corresponds to the model’s prediction of its score on the local Distance Difference Test. It is a measure of local accuracy (from AlphfaFold website). To color code individual residues, we transformed individual PDB files into CIF format.

Fusion protein PDB link (fusion AA seq ID in FusionPDB)	Hgene	Hchr	Hbp	Hstrand	Tgene	Tchr	Tbp	Tstrand	AA seq	Len(AA seq)
PDB file >>>1668_TMPRSS2_42842575_DIAPH1_140914000_ranked_0.pdb	TMPRSS2	42842575	42842575	ENST00000518047	DIAPH1	chr5	140914000	-	MGAWDPPMPPAPPGGESGCEERGAAGHIEHSRYLSLLDAVDNSKMALNSGSPPAIGPYYENHGYQPENPYPAQPTVVPTVYEVHPAQYYP SPVPQYAPRVLTQASNPVVCTQPKSPSGTVCTSKTKKALCITLTLGTFLVGAALAAGLLWKFMGSKCSNSGIECDSSGTCINPSNWCDGV SHCPGGEDENRCVRLYGPNFILQVYSSQRKSWHPVCQDDWNENYGRAACRDMGYKNNFYSSQGIVDDSGSTSFMKLNTSAGNVDIYKKLY HSDACSSKAVVSLRCIACGVNLNSSRQSRIVGGESALPGAWPWQVSLHVQNVHVCGGSIITPEWIVTAAHCVEKPLNNPWHWTAFAGILR QSFMFYGAGYQVEKVISHPNYDSKTKNNDIALMKLQKPLTFNDLVKPVCLPNPGMMLQPEQLCWISGWGATEEKAKKDQEGGEEKKSVQK KKVKELKVLDSKTAQNLSIFLGSFRMPYQEIKNVILEVNEAVLTESMIQNLIKQMPEPEQLKMLSELKDEYDDLAESEQFGVVMGTVPRL RPRLNAILFKLQFSEQVENIKPEIVSVTAACEELRKSESFSNLLEITLLVGNYMNAGSRNAGAFGFNISFLCKLRDTKSTDQKMTLLHFL AELCENDYPDVLKFPDELAHVEKASRVSAENLQKNLDQMKKQISDVERDVQNFPAATDEKDKFVEKMTSFVKDAQEQYNKLRMMHSNMET LYKELGEYFLFDPKKLSVEEFFMDLHNFRNMFLQAVKENQKRRETEEKMRRAKLAKEKAEKERLEKQQKREQLIDMNAEGDETGVMDSLL	879

Top

pLDDT score distribution

pLDDT score distribution of the predicted wild-type structures of two partner proteins from AlphaFold2
* AlphaFold produces a per-residue confidence score (pLDDT) between 0 and 100.

TMPRSS2_pLDDT.png

DIAPH1_pLDDT.png

pLDDT score distribution of the predicted fusion protein structures from AlphaFold2
* AlphaFold produces a per-residue confidence score (pLDDT) between 0 and 100.

Top

Ramachandran Plot of Fusion Protein Structure

Ramachandran plot of the torsional angles - phi (φ)and psi (ψ) - of the residues (amino acids) contained in this fusion protein peptide.

Fusion AA seq ID in FusionPDB and their Ramachandran plots

Top

Fusion Protein-Protein Interaction

Go to ChiPPI (Chimeric Protein-Protein interactions) to see the chimeric PPI interaction in
ChiPPI page.

Protein-protein interactors with each fusion partner protein in wild-type from validated records (BIOGRID-3.4.160)

Gene

PPI interactors

TMPRSS2

CLK1, HNRNPL, DCAF4, S, ACE2, STX7, SCD, PLP2, PLLP, MOSPD3, UPK2, SELK, C3orf52, IGFBP5, SEC22A, PLP1, CLN6, TMEM128, C14orf1, CFHR5, TMEM243, TMEM60, CXCL9, BNIP2, CNIH3, PGAP2, TMEM218, TMEM86A, CMTM7, ZFPL1, BMP10, TMEM79, SLC35A1, SFTPC, VAMP5, FAXDC2, STX8, NINJ2, CLEC7A, C2CD2L, CNIH2, BNIP3, DEFB103A, DEFB103B, TMEM11, C17orf62, TMEM86B, ADIPOQ, EDDM3B, BRICD5, PTTG1IP, PTCH1, ANKRD46, TMEM222, C1QL4, TMEM120B, FAM3C, TMEM229B, PLN, CTXN3, TNF, SMIM1, AQP1, TMPRSS2, DNASE2, MYO1C, PGRMC1, NDUFA4, ADAM10, CLGN, SEC16A, SPINT2, COCH, B4GAT1, XPOT, MYO1B, LANCL1, CALU, PLXNA2, GPC4, BANF1, CPD, CLPX, STC2, SLIT2, MYO1D, ERLIN2, BAG2, TFRC, HLA-A, TP53, RPN1, RPN2, GNAI2, APP, ITGB1, INSR, GLA, GPI, ITGAV, CTSD, APRT, IGF1R, MET, GNAI3, CLTA, CALM2, HLA-C, DLAT, HSPA5, LAMC1, LAMP1, IGF2R, PDIA4, P4HA1, HSP90B1, PVR, RPA2, ATP2A2, PFKL, CDH2, MSH3, RPA1, CALR, RPA3, LONP1, TGFBR1, DDOST, HADHA, ECE1, DNM2, FXR2, PLXNA3, ATP1B3, HADHB, SEC61A1, GNB1, NOMO3, PRKDC, TFAM, SLC7A5, PFKP, KIF23, FMR1, PTK7, ADAM15, CUL2, SCARB2, WRN, DSC3, ITIH4, GANAB, KARS, RCN1, SAFB, IMMT, HSD17B12, UBR4, QSOX2, RRM2B, MON2, YTHDF3, PABPN1, PLD3, PELP1, TTC13, CNNM3, IPO4, FAR1, GGH, ERLEC1, RBM33, DNAJA3, RBM14, PPP1R9B, SDF2, NEU1, GRWD1, AIF1L, NTPCR, FUCA2, EDEM3, RACGAP1, RAB18, TMEM106B, CHPF2, GNG12, DNAJB11, EGFL7, DDX20, ADAMTS1, LNPEP, ITM2B, MRPL11, HYOU1, AFG3L2, YTHDF2, SUPT16H, PDHX, IPO5, SAP18, HGS, SPTBN2, PLXNB2, ARPC3, ACTN4, TRIM13, PDCD6, MPDU1, SEC22B, ATP6AP2, STAM2, ARL6IP5, UFL1, SEC31A, STBD1, SMC2, SEC24A, SEC24B, ACSL3, CDK1, SRPR, SPTB, MTHFD1, ACTN1, ETFA, RAB6A, VDAC1, HMOX2, MYH10, DEK, ATP5C1, NAMPT, VDAC2, QARS, TUFM, SERPINH1, BCAP31, PSMD7, CLCN7, SLC25A1, YARS, EPPK1, RAB10, ABCE1, RHOA, CNBP, TPM4, SLC25A11, LMNB2, CKAP4, GOLGA3, TWF1, TRAP1, STX5, DDX39B, RAB3GAP1, PON2, PPA1, SEC23A, SEC23B, NDUFA9, ATP6V1F, INF2, ANO6, ACTBL2, MIA3, CDKAL1, KIAA0368, C19orf70, SLC25A24, HUWE1, MEGF8, KTN1, COMTD1, ANKLE2, VRK2, ZDHHC17, DNAH10, NUP93, MMGT1, TMEM199, ATPAF2, EMC1, PDZD8, NBEA, MOSPD2, PDCD6IP, SYNE2, UBXN4, CCDC47, LRRC59, C7orf55, DDRGK1, NGLY1, CDK5RAP3, CCDC115, CLCC1, OSBPL9, RBM15, CGRRF1, ESYT1, NDC1, EFHD1, OSBPL8, KIAA1715, LSG1, RAB1B, TMX1, GORASP2, SFXN1, XPO5, VEZT, JPH1, BIRC6, AAAS, TOMM22, DDX19A, SMPD4, TMOD3, EMC3, VAPA, CEP72, LARS, DPM3, DHCR7, UBA2, AASS, ATP6V1H, SLC25A13, STOML2, RAB21, MYO6, VDAC3, AUP1, SEC23IP,

Protein-protein interactors based on sequence similarity (STRING)

Gene	STRING network
TMPRSS2
DIAPH1

- Retained interactions in fusion protein (protein functional feature from UniProt).

Partner

Gene

Hbp

Tbp

ENST

Strand

BPexon

TotalExon

Protein feature loci

*BPloci

TotalLen

Still interaction with

- Lost interactions due to fusion (protein functional feature from UniProt).

Partner

Gene

Hbp

Tbp

ENST

Strand

BPexon

TotalExon

Protein feature loci

*BPloci

TotalLen

Interaction lost with

Top

Related Drugs to TMPRSS2-DIAPH1

Drugs used for this fusion-positive patient.
(Manual curation of PubMed, 04-30-2022 + MyCancerGenome)

Hgene

Tgene

Drug

Source

PMID

Top

Related Diseases to TMPRSS2-DIAPH1

Diseases that have this fusion gene.
(Manual curation of PubMed, 04-30-2022 + MyCancerGenome)

Hgene

Tgene

Disease

Source

PMID

Diseases associated with fusion partners.
(DisGeNet 4.0)

Partner	Gene	Disease ID	Disease name	# pubmeds	Source
Hgene	TMPRSS2	C0033578	Prostatic Neoplasms	4	CTD_human
Hgene	TMPRSS2	C0376358	Malignant neoplasm of prostate	4	CTD_human