Home

Download

Statistics

Examples

Help

Contact

	Fusion Gene Summary
	Fusion Gene ORF analysis
	Fusion Genomic Features
	Fusion Protein Features
	Fusion Gene Sequence
	Fusion Gene PPI analysis
	Related Drugs
	Related Diseases

Fusion gene:CCDC23-UBA1 (FusionGDB2 ID:13758)

Fusion Gene Summary for CCDC23-UBA1

Fusion gene summary

Fusion gene information	Fusion gene name: CCDC23-UBA1
	Fusion gene ID: 13758
		Hgene	Tgene
	Gene symbol	CCDC23	UBA1
	Gene ID	374969	7317
	Gene name	small vasohibin binding protein	ubiquitin like modifier activating enzyme 1
	Synonyms	CCDC23\|NEDAHM	A1S9\|A1S9T\|A1ST\|AMCX1\|CFAP124\|GXP1\|POC20\|SMAX2\|UBA1A\|UBE1\|UBE1X
	Cytomap	1p34.2	Xp11.3
	Type of gene	protein-coding	protein-coding
	Description	small vasohibin-binding proteincoiled-coil domain containing 23coiled-coil domain-containing protein 23	ubiquitin-like modifier-activating enzyme 1A1S9T and BN75 temperature sensitivity complementingPOC20 centriolar protein homologUBA1, ubiquitin-activating enzyme E1 homolog Atesticular secretory protein Li 63
	Modification date	20200313	20200313
	UniProtAcc	.	.
	Ensembl transtripts involved in fusion gene	ENST00000372521, ENST00000372522, ENST00000537227, ENST00000497437,	ENST00000377269, ENST00000490869, ENST00000335972, ENST00000377351,
Fusion gene scores	* DoF score	2 X 1 X 2=4	13 X 11 X 7=1001
	# samples	2	14
	** MAII score	log2(2/4*10)=2.32192809488736	log2(14/1001*10)=-2.83794324189103 possibly effective Gene in Pan-Cancer Fusion Genes (peGinPCFGs). DoF>8 and MAII<0
Context	PubMed: CCDC23 [Title/Abstract] AND UBA1 [Title/Abstract] AND fusion [Title/Abstract]
Most frequent breakpoint	CCDC23(43282102)-UBA1(47058202), # samples:1
Anticipated loss of major functional domain due to fusion event.	CCDC23-UBA1 seems lost the major protein functional domain in Tgene partner, which is a essential gene due to the frame-shifted ORF.

* DoF score (Degree of Frequency) = # partners X # break points X # cancer types
** MAII score (Major Active Isofusion Index) = log2(# samples/DoF score*10)

Gene ontology of each fusion partner gene with evidence of Inferred from Direct Assay (IDA) from Entrez

Partner	Gene	GO ID	GO term	PubMed ID
Hgene	CCDC23	GO:0006508	proteolysis	29146869
Hgene	CCDC23	GO:0009306	protein secretion	20736312
Hgene	CCDC23	GO:0031397	negative regulation of protein ubiquitination	20736312
Tgene	UBA1	GO:0006974	cellular response to DNA damage stimulus	22456334

Fusion gene breakpoints across CCDC23 (5'-gene)
* Click on the image to open the UCSC genome browser with custom track showing this image in a new window.

Fusion gene breakpoints across UBA1 (3'-gene)
* Click on the image to open the UCSC genome browser with custom track showing this image in a new window.

Fusion gene information from two resources (ChiTars 5.0 and ChimerDB 4.0)
* All genome coordinats were lifted-over on hg19.
* Click on the break point to see the gene structure around the break point region using the UCSC Genome Browser.

Source	Disease	Sample	Hgene	Hchr	Hbp	Hstrand	Tgene	Tchr	Tbp	Tstrand
ChimerDB4	STAD	TCGA-CD-8531-01A	CCDC23	chr1	43282102	-	UBA1	chrX	47058202	+

Top

Fusion Gene ORF analysis for CCDC23-UBA1

Open reading frame (ORF) analsis of fusion genes based on Ensembl gene isoform structure.
* Click on the break point to see the gene structure around the break point region using the UCSC Genome Browser.

ORF	Henst	Tenst	Hgene	Hchr	Hbp	Hstrand	Tgene	Tchr	Tbp	Tstrand
5CDS-intron	ENST00000372521	ENST00000377269	CCDC23	chr1	43282102	-	UBA1	chrX	47058202	+
5CDS-intron	ENST00000372521	ENST00000490869	CCDC23	chr1	43282102	-	UBA1	chrX	47058202	+
5CDS-intron	ENST00000372522	ENST00000377269	CCDC23	chr1	43282102	-	UBA1	chrX	47058202	+
5CDS-intron	ENST00000372522	ENST00000490869	CCDC23	chr1	43282102	-	UBA1	chrX	47058202	+
5CDS-intron	ENST00000537227	ENST00000377269	CCDC23	chr1	43282102	-	UBA1	chrX	47058202	+
5CDS-intron	ENST00000537227	ENST00000490869	CCDC23	chr1	43282102	-	UBA1	chrX	47058202	+
5UTR-3CDS	ENST00000497437	ENST00000335972	CCDC23	chr1	43282102	-	UBA1	chrX	47058202	+
5UTR-3CDS	ENST00000497437	ENST00000377351	CCDC23	chr1	43282102	-	UBA1	chrX	47058202	+
5UTR-intron	ENST00000497437	ENST00000377269	CCDC23	chr1	43282102	-	UBA1	chrX	47058202	+
5UTR-intron	ENST00000497437	ENST00000490869	CCDC23	chr1	43282102	-	UBA1	chrX	47058202	+
Frame-shift	ENST00000372522	ENST00000335972	CCDC23	chr1	43282102	-	UBA1	chrX	47058202	+
Frame-shift	ENST00000372522	ENST00000377351	CCDC23	chr1	43282102	-	UBA1	chrX	47058202	+
In-frame	ENST00000372521	ENST00000335972	CCDC23	chr1	43282102	-	UBA1	chrX	47058202	+
In-frame	ENST00000372521	ENST00000377351	CCDC23	chr1	43282102	-	UBA1	chrX	47058202	+
In-frame	ENST00000537227	ENST00000335972	CCDC23	chr1	43282102	-	UBA1	chrX	47058202	+
In-frame	ENST00000537227	ENST00000377351	CCDC23	chr1	43282102	-	UBA1	chrX	47058202	+

ORFfinder result based on the fusion transcript sequence of in-frame fusion genes.

Henst	Tenst	Hgene	Hchr	Hbp	Hstrand	Tgene	Tchr	Tbp	Tstrand	Seq length (transcript)	BP loci (transcript)	Predicted start (transcript)	Predicted stop (transcript)	Seq length (amino acids)
ENST00000372521	CCDC23	chr1	43282102	-	ENST00000377351	UBA1	chrX	47058202	+	3589	213	99	3389	1096
ENST00000372521	CCDC23	chr1	43282102	-	ENST00000335972	UBA1	chrX	47058202	+	3589	213	99	3389	1096
ENST00000537227	CCDC23	chr1	43282102	-	ENST00000377351	UBA1	chrX	47058202	+	3620	244	130	3420	1096
ENST00000537227	CCDC23	chr1	43282102	-	ENST00000335972	UBA1	chrX	47058202	+	3620	244	130	3420	1096

DeepORF prediction of the coding potential based on the fusion transcript sequence of in-frame fusion genes. DeepORF is a coding potential classifier based on convolutional neural network by comparing the real Ribo-seq data. If the no-coding score < 0.5 and coding score > 0.5, then the in-frame fusion transcript is predicted as being likely translated.

Henst	Tenst	Hgene	Hchr	Hbp	Hstrand	Tgene	Tchr	Tbp	Tstrand	No-coding score	Coding score
ENST00000372521	ENST00000377351	CCDC23	chr1	43282102	-	UBA1	chrX	47058202	+	0.002400485	0.99759954
ENST00000372521	ENST00000335972	CCDC23	chr1	43282102	-	UBA1	chrX	47058202	+	0.002400485	0.99759954
ENST00000537227	ENST00000377351	CCDC23	chr1	43282102	-	UBA1	chrX	47058202	+	0.002369221	0.9976307
ENST00000537227	ENST00000335972	CCDC23	chr1	43282102	-	UBA1	chrX	47058202	+	0.002369221	0.9976307

Top

Fusion Genomic Features for CCDC23-UBA1

FusionAI prediction of the potential fusion gene breakpoint based on the pre-mature RNA sequence context (+/- 5kb of individual partner genes, total 20kb length sequence). FusionAI is a fusion gene breakpoint classifier based on convolutional neural network by comparing the fusion positive and negative sequence context of ~ 20K fusion gene data. From here, we can have the relative potentency of the 20K genomic sequence how individual sequnce will be likely used as the gene fusion breakpoints.

Hgene	Hchr	Hbp	Hstrand	Tgene	Tchr	Tbp	Tstrand	1-p	p (fusion gene breakpoint)
CCDC23	chr1	43282101	-	UBA1	chrX	47058201	+	0.00015124	0.9998487
CCDC23	chr1	43282101	-	UBA1	chrX	47058201	+	0.00015124	0.9998487

Distribution of 44 human genomic features loci across 20kb length fusion breakpoint regions. We integrated a total of 44 different types of human genomic feature loci information across five big categories including virus integration sites, repeats, structural variants, chromatin states, and gene expression regulation. More details are in help page.

Distribution of 44 human genomic features loci across 20kb length fusion breakpoint regions that are ovelapped with the top 1% feature importance score regions. More details are in help page.

Top

Fusion Protein Features for CCDC23-UBA1

Four levels of functional features of fusion genes
Go to FGviewer search page for the most frequent breakpoint (https://ccsmweb.uth.edu/FGviewer/chr1:43282102/chrX:47058202)
- FGviewer provides the online visualization of the retention search of the protein functional features across DNA, RNA, protein, and pathological levels.
- How to search
1. Put your fusion gene symbol.
2. Press the tab key until there will be shown the breakpoint information filled.
4. Go down and press 'Search' tab twice.
4. Go down to have the hyperlink of the search result.
5. Click the hyperlink.
6. See the FGviewer result for your fusion gene.

Main function of each fusion partner protein. (from UniProt)

Hgene	Tgene
.	.
FUNCTION: Transcriptional activator which is required for calcium-dependent dendritic growth and branching in cortical neurons. Recruits CREB-binding protein (CREBBP) to nuclear bodies. Component of the CREST-BRG1 complex, a multiprotein complex that regulates promoter activation by orchestrating a calcium-dependent release of a repressor complex and a recruitment of an activator complex. In resting neurons, transcription of the c-FOS promoter is inhibited by BRG1-dependent recruitment of a phospho-RB1-HDAC1 repressor complex. Upon calcium influx, RB1 is dephosphorylated by calcineurin, which leads to release of the repressor complex. At the same time, there is increased recruitment of CREBBP to the promoter by a CREST-dependent mechanism, which leads to transcriptional activation. The CREST-BRG1 complex also binds to the NR2B promoter, and activity-dependent induction of NR2B expression involves a release of HDAC1 and recruitment of CREBBP (By similarity). {ECO:0000250}.	FUNCTION: Transcriptional activator which is required for calcium-dependent dendritic growth and branching in cortical neurons. Recruits CREB-binding protein (CREBBP) to nuclear bodies. Component of the CREST-BRG1 complex, a multiprotein complex that regulates promoter activation by orchestrating a calcium-dependent release of a repressor complex and a recruitment of an activator complex. In resting neurons, transcription of the c-FOS promoter is inhibited by BRG1-dependent recruitment of a phospho-RB1-HDAC1 repressor complex. Upon calcium influx, RB1 is dephosphorylated by calcineurin, which leads to release of the repressor complex. At the same time, there is increased recruitment of CREBBP to the promoter by a CREST-dependent mechanism, which leads to transcriptional activation. The CREST-BRG1 complex also binds to the NR2B promoter, and activity-dependent induction of NR2B expression involves a release of HDAC1 and recruitment of CREBBP (By similarity). {ECO:0000250}.

Retention analysis result of each fusion partner protein across 39 protein features of UniProt such as six molecule processing features, 13 region features, four site features, six amino acid modification features, two natural variation features, five experimental info features, and 3 secondary structure features. Here, because of limited space for viewing, we only show the protein feature retention information belong to the 13 regional features. All retention annotation result can be downloaded at
download page

* Minus value of BPloci means that the break pointn is located before the CDS.

- In-frame and retained protein feature among the 13 regional features.

Partner

Gene

Hbp

Tbp

ENST

Strand

BPexon

TotalExon

Protein feature loci

*BPloci

TotalLen

Protein feature

Protein feature note

Tgene

UBA1

chr1:43282102

chrX:47058202

ENST00000335972

5_11

1059.0

Motif

Note=Nuclear localization signal

Tgene

UBA1

chr1:43282102

chrX:47058202

ENST00000377351

5_11

1059.0

Motif

Note=Nuclear localization signal

Tgene

UBA1

chr1:43282102

chrX:47058202

ENST00000335972

576_577

1059.0

Nucleotide binding

ATP

Tgene

UBA1

chr1:43282102

chrX:47058202

ENST00000377351

576_577

1059.0

Nucleotide binding

ATP

Tgene

UBA1

chr1:43282102

chrX:47058202

ENST00000335972

63_611

1059.0

Region

Note=2 approximate repeats

Tgene

UBA1

chr1:43282102

chrX:47058202

ENST00000377351

63_611

1059.0

Region

Note=2 approximate repeats

Tgene

UBA1

chr1:43282102

chrX:47058202

ENST00000335972

459_611

1059.0

Repeat

Note=1-2

Tgene

UBA1

chr1:43282102

chrX:47058202

ENST00000335972

63_199

1059.0

Repeat

Note=1-1

Tgene

UBA1

chr1:43282102

chrX:47058202

ENST00000377351

459_611

1059.0

Repeat

Note=1-2

Tgene

UBA1

chr1:43282102

chrX:47058202

ENST00000377351

63_199

1059.0

Repeat

Note=1-1

- In-frame and not-retained protein feature among the 13 regional features.

Partner

Gene

Hbp

Tbp

ENST

Strand

BPexon

TotalExon

Protein feature loci

*BPloci

TotalLen

Protein feature

Protein feature note

Hgene

CCDC23

chr1:43282102

chrX:47058202

ENST00000372521

5_52

67.0

Coiled coil

Ontology_term=ECO:0000255

Hgene

CCDC23

chr1:43282102

chrX:47058202

ENST00000372522

5_52

67.0

Coiled coil

Ontology_term=ECO:0000255

Hgene

CCDC23

chr1:43282102

chrX:47058202

ENST00000537227

5_52

69.0

Coiled coil

Ontology_term=ECO:0000255

Top

Fusion Gene Sequence for CCDC23-UBA1

For in-frame fusion transcripts, we provide the fusion transcript sequences and fusion amino acid sequences. To have fusion amino acid sequence, we ran ORFfinder and chose the longest ORF among the all predicted ones.

>13758_13758_1_CCDC23-UBA1_CCDC23_chr1_43282102_ENST00000372521_UBA1_chrX_47058202_ENST00000335972_length(transcript)=3589nt_BP=213nt
CTCCCGGAGGCGTTGTCTGCGACTCGGCGGAGGCTCCAACTTCCAGTGGCCCGGTCGGGAAAGATCAGAGCCTCCTAAGAAATATCCAGA
AGTCAAGCCATGGATCCACCTGCACGTAAAGAAAAAACCAAAGTTAAAGAATCTGTCAGCAGAGTTGAGAAGGCCAAACAGAAATCAGCC
CAGCAGGAGCTGAAGCAGAGACAAAGAGCAGAGATGTCCAGCTCGCCGCTGTCCAAGAAACGTCGCGTGTCCGGGCCTGATCCAAAGCCG
GGTTCTAACTGCTCCCCTGCCCAGTCCGTGTTGTCCGAAGTGCCCTCGGTGCCAACCAACGGAATGGCCAAGAACGGCAGTGAAGCAGAC
ATAGACGAGGGCCTTTACTCCCGGCAGCTGTATGTGTTGGGCCATGAGGCAATGAAGCGGCTCCAGACATCCAGTGTCCTGGTATCAGGC
CTGCGGGGCCTGGGCGTGGAGATCGCTAAGAACATCATCCTTGGTGGGGTCAAGGCTGTTACCCTACATGACCAGGGCACTGCCCAGTGG
GCTGATCTTTCCTCCCAGTTCTACCTGCGGGAGGAGGACATCGGTAAAAACCGGGCCGAGGTATCACAGCCCCGCCTCGCTGAGCTCAAC
AGCTATGTGCCTGTCACTGCCTACACTGGACCCCTCGTTGAGGACTTCCTTAGTGGTTTCCAGGTGGTGGTGCTCACCAACACCCCCCTG
GAGGACCAGCTGCGAGTGGGTGAGTTCTGTCACAACCGTGGCATCAAGCTGGTGGTGGCAGACACGCGGGGCCTGTTTGGGCAGCTCTTC
TGTGACTTTGGAGAGGAAATGATCCTCACAGATTCCAATGGGGAGCAGCCACTCAGTGCTATGGTTTCTATGGTTACCAAGGACAACCCC
GGTGTGGTTACCTGCCTGGATGAGGCCCGACACGGGTTTGAGAGCGGGGACTTTGTCTCCTTTTCAGAAGTACAGGGCATGGTTGAACTC
AACGGAAATCAGCCCATGGAGATCAAAGTCCTGGGTCCTTATACCTTTAGCATCTGTGACACCTCCAACTTCTCCGACTACATCCGTGGA
GGCATCGTCAGTCAGGTCAAAGTACCTAAGAAGATTAGCTTTAAATCCTTGGTGGCCTCACTGGCAGAACCTGACTTTGTGGTGACGGAC
TTCGCCAAGTTTTCTCGCCCTGCCCAGCTGCACATTGGCTTCCAGGCCCTGCACCAGTTCTGTGCTCAGCATGGCCGGCCACCTCGGCCC
CGCAATGAGGAGGATGCAGCAGAACTGGTAGCCTTAGCACAGGCTGTGAATGCTCGAGCCCTGCCAGCAGTGCAGCAAAATAACCTGGAC
GAGGACCTCATCCGGAAGCTGGCATATGTGGCTGCTGGGGATCTGGCACCCATAAACGCCTTCATTGGGGGCCTGGCTGCCCAGGAAGTC
ATGAAGGCCTGCTCCGGGAAGTTCATGCCCATCATGCAGTGGCTATACTTTGATGCCCTTGAGTGTCTCCCTGAGGACAAAGAGGTCCTC
ACAGAGGACAAGTGCCTCCAGCGCCAGAACCGTTATGACGGGCAAGTGGCTGTGTTTGGCTCAGACCTGCAAGAGAAGCTGGGCAAGCAG
AAGTATTTCCTGGTGGGTGCGGGGGCCATTGGCTGTGAGCTGCTCAAGAACTTTGCCATGATTGGGCTGGGCTGCGGGGAGGGTGGAGAA
ATCATCGTTACAGACATGGACACCATTGAGAAGTCAAATCTGAATCGACAGTTTCTTTTCCGGCCCTGGGATGTCACGAAGTTAAAGTCT
GACACGGCTGCTGCAGCTGTGCGCCAAATGAATCCACATATCCGGGTGACAAGCCACCAGAACCGTGTGGGTCCTGACACGGAGCGCATC
TATGATGACGATTTTTTCCAAAACCTAGATGGCGTGGCCAATGCCCTGGACAACGTGGATGCCCGCATGTACATGGACCGCCGCTGTGTC
TACTACCGGAAGCCACTGCTGGAGTCAGGCACACTGGGCACCAAAGGCAATGTGCAGGTGGTGATCCCCTTCCTGACAGAGTCGTACAGT
TCCAGCCAGGACCCACCTGAGAAGTCCATCCCCATCTGTACCCTGAAGAACTTCCCTAATGCCATCGAGCACACCCTGCAGTGGGCTCGG
GATGAGTTTGAAGGCCTCTTCAAGCAGCCAGCAGAAAATGTCAACCAGTACCTCACAGACCCCAAGTTTGTGGAGCGAACACTGCGGCTG
GCAGGCACTCAGCCCTTGGAGGTGCTGGAGGCTGTGCAGCGCAGCCTGGTGCTGCAGCGACCACAGACCTGGGCTGACTGCGTGACCTGG
GCCTGCCACCACTGGCACACCCAGTACTCGAACAACATCCGGCAGCTGCTGCACAACTTCCCTCCTGACCAGCTCACAAGCTCAGGAGCG
CCGTTCTGGTCTGGGCCCAAACGCTGTCCACACCCGCTCACCTTTGATGTCAACAATCCCCTGCATCTGGACTATGTGATGGCTGCTGCC
AACCTGTTTGCCCAGACCTACGGGCTGACAGGCTCTCAGGACCGAGCTGCTGTGGCCACATTCCTGCAGTCTGTGCAGGTCCCCGAATTC
ACCCCCAAGTCTGGCGTCAAGATCCATGTTTCTGACCAGGAGCTGCAGAGCGCCAATGCCTCTGTTGATGACAGTCGTCTAGAGGAGCTC
AAAGCCACTCTGCCCAGCCCAGACAAGCTCCCTGGATTCAAGATGTACCCCATTGACTTTGAGAAGGATGATGACAGCAACTTTCATATG
GATTTCATCGTGGCTGCATCCAACCTCCGGGCAGAAAACTATGACATTCCTTCTGCAGACCGGCACAAGAGCAAGCTGATTGCAGGGAAG
ATCATCCCAGCCATTGCCACGACCACAGCAGCCGTGGTTGGCCTTGTGTGTCTGGAGCTGTACAAGGTTGTGCAGGGGCACCGACAGCTT
GACTCCTACAAGAATGGTTTCCTCAACTTGGCCCTGCCTTTCTTTGGTTTCTCTGAACCCCTTGCCGCACCACGTCACCAGTACTATAAC
CAAGAGTGGACATTGTGGGATCGCTTTGAGGTACAAGGGCTGCAGCCTAATGGTGAGGAGATGACCCTCAAACAGTTCCTCGACTATTTT
AAGACAGAGCACAAATTAGAGATCACCATGCTGTCCCAGGGCGTGTCCATGCTCTATTCCTTCTTCATGCCAGCTGCCAAGCTCAAGGAA
CGGTTGGATCAGCCGATGACAGAGATTGTGAGCCGTGTGTCGAAGCGAAAGCTGGGCCGCCACGTGCGGGCGCTGGTGCTTGAGCTGTGC
TGTAACGACGAGAGCGGCGAGGATGTCGAGGTTCCCTATGTCCGATACACCATCCGCTGACCCCGTCTGCTCCTCTAGGCTGGCCCCTTG
TCCACCCCTCTCCACACCCCTTCCAGCCCAGGGTTCCCATTTGGCTTCTGGCAGTGGCCCAACTAGCCAAGTCTGGTGTTCCCTCATCAT

>13758_13758_1_CCDC23-UBA1_CCDC23_chr1_43282102_ENST00000372521_UBA1_chrX_47058202_ENST00000335972_length(amino acids)=1096AA_BP=38
MDPPARKEKTKVKESVSRVEKAKQKSAQQELKQRQRAEMSSSPLSKKRRVSGPDPKPGSNCSPAQSVLSEVPSVPTNGMAKNGSEADIDE
GLYSRQLYVLGHEAMKRLQTSSVLVSGLRGLGVEIAKNIILGGVKAVTLHDQGTAQWADLSSQFYLREEDIGKNRAEVSQPRLAELNSYV
PVTAYTGPLVEDFLSGFQVVVLTNTPLEDQLRVGEFCHNRGIKLVVADTRGLFGQLFCDFGEEMILTDSNGEQPLSAMVSMVTKDNPGVV
TCLDEARHGFESGDFVSFSEVQGMVELNGNQPMEIKVLGPYTFSICDTSNFSDYIRGGIVSQVKVPKKISFKSLVASLAEPDFVVTDFAK
FSRPAQLHIGFQALHQFCAQHGRPPRPRNEEDAAELVALAQAVNARALPAVQQNNLDEDLIRKLAYVAAGDLAPINAFIGGLAAQEVMKA
CSGKFMPIMQWLYFDALECLPEDKEVLTEDKCLQRQNRYDGQVAVFGSDLQEKLGKQKYFLVGAGAIGCELLKNFAMIGLGCGEGGEIIV
TDMDTIEKSNLNRQFLFRPWDVTKLKSDTAAAAVRQMNPHIRVTSHQNRVGPDTERIYDDDFFQNLDGVANALDNVDARMYMDRRCVYYR
KPLLESGTLGTKGNVQVVIPFLTESYSSSQDPPEKSIPICTLKNFPNAIEHTLQWARDEFEGLFKQPAENVNQYLTDPKFVERTLRLAGT
QPLEVLEAVQRSLVLQRPQTWADCVTWACHHWHTQYSNNIRQLLHNFPPDQLTSSGAPFWSGPKRCPHPLTFDVNNPLHLDYVMAAANLF
AQTYGLTGSQDRAAVATFLQSVQVPEFTPKSGVKIHVSDQELQSANASVDDSRLEELKATLPSPDKLPGFKMYPIDFEKDDDSNFHMDFI
VAASNLRAENYDIPSADRHKSKLIAGKIIPAIATTTAAVVGLVCLELYKVVQGHRQLDSYKNGFLNLALPFFGFSEPLAAPRHQYYNQEW
TLWDRFEVQGLQPNGEEMTLKQFLDYFKTEHKLEITMLSQGVSMLYSFFMPAAKLKERLDQPMTEIVSRVSKRKLGRHVRALVLELCCND

--------------------------------------------------------------
>13758_13758_2_CCDC23-UBA1_CCDC23_chr1_43282102_ENST00000372521_UBA1_chrX_47058202_ENST00000377351_length(transcript)=3589nt_BP=213nt
CTCCCGGAGGCGTTGTCTGCGACTCGGCGGAGGCTCCAACTTCCAGTGGCCCGGTCGGGAAAGATCAGAGCCTCCTAAGAAATATCCAGA
AGTCAAGCCATGGATCCACCTGCACGTAAAGAAAAAACCAAAGTTAAAGAATCTGTCAGCAGAGTTGAGAAGGCCAAACAGAAATCAGCC
CAGCAGGAGCTGAAGCAGAGACAAAGAGCAGAGATGTCCAGCTCGCCGCTGTCCAAGAAACGTCGCGTGTCCGGGCCTGATCCAAAGCCG
GGTTCTAACTGCTCCCCTGCCCAGTCCGTGTTGTCCGAAGTGCCCTCGGTGCCAACCAACGGAATGGCCAAGAACGGCAGTGAAGCAGAC
ATAGACGAGGGCCTTTACTCCCGGCAGCTGTATGTGTTGGGCCATGAGGCAATGAAGCGGCTCCAGACATCCAGTGTCCTGGTATCAGGC
CTGCGGGGCCTGGGCGTGGAGATCGCTAAGAACATCATCCTTGGTGGGGTCAAGGCTGTTACCCTACATGACCAGGGCACTGCCCAGTGG
GCTGATCTTTCCTCCCAGTTCTACCTGCGGGAGGAGGACATCGGTAAAAACCGGGCCGAGGTATCACAGCCCCGCCTCGCTGAGCTCAAC
AGCTATGTGCCTGTCACTGCCTACACTGGACCCCTCGTTGAGGACTTCCTTAGTGGTTTCCAGGTGGTGGTGCTCACCAACACCCCCCTG
GAGGACCAGCTGCGAGTGGGTGAGTTCTGTCACAACCGTGGCATCAAGCTGGTGGTGGCAGACACGCGGGGCCTGTTTGGGCAGCTCTTC
TGTGACTTTGGAGAGGAAATGATCCTCACAGATTCCAATGGGGAGCAGCCACTCAGTGCTATGGTTTCTATGGTTACCAAGGACAACCCC
GGTGTGGTTACCTGCCTGGATGAGGCCCGACACGGGTTTGAGAGCGGGGACTTTGTCTCCTTTTCAGAAGTACAGGGCATGGTTGAACTC
AACGGAAATCAGCCCATGGAGATCAAAGTCCTGGGTCCTTATACCTTTAGCATCTGTGACACCTCCAACTTCTCCGACTACATCCGTGGA
GGCATCGTCAGTCAGGTCAAAGTACCTAAGAAGATTAGCTTTAAATCCTTGGTGGCCTCACTGGCAGAACCTGACTTTGTGGTGACGGAC
TTCGCCAAGTTTTCTCGCCCTGCCCAGCTGCACATTGGCTTCCAGGCCCTGCACCAGTTCTGTGCTCAGCATGGCCGGCCACCTCGGCCC
CGCAATGAGGAGGATGCAGCAGAACTGGTAGCCTTAGCACAGGCTGTGAATGCTCGAGCCCTGCCAGCAGTGCAGCAAAATAACCTGGAC
GAGGACCTCATCCGGAAGCTGGCATATGTGGCTGCTGGGGATCTGGCACCCATAAACGCCTTCATTGGGGGCCTGGCTGCCCAGGAAGTC
ATGAAGGCCTGCTCCGGGAAGTTCATGCCCATCATGCAGTGGCTATACTTTGATGCCCTTGAGTGTCTCCCTGAGGACAAAGAGGTCCTC
ACAGAGGACAAGTGCCTCCAGCGCCAGAACCGTTATGACGGGCAAGTGGCTGTGTTTGGCTCAGACCTGCAAGAGAAGCTGGGCAAGCAG
AAGTATTTCCTGGTGGGTGCGGGGGCCATTGGCTGTGAGCTGCTCAAGAACTTTGCCATGATTGGGCTGGGCTGCGGGGAGGGTGGAGAA
ATCATCGTTACAGACATGGACACCATTGAGAAGTCAAATCTGAATCGACAGTTTCTTTTCCGGCCCTGGGATGTCACGAAGTTAAAGTCT
GACACGGCTGCTGCAGCTGTGCGCCAAATGAATCCACATATCCGGGTGACAAGCCACCAGAACCGTGTGGGTCCTGACACGGAGCGCATC
TATGATGACGATTTTTTCCAAAACCTAGATGGCGTGGCCAATGCCCTGGACAACGTGGATGCCCGCATGTACATGGACCGCCGCTGTGTC
TACTACCGGAAGCCACTGCTGGAGTCAGGCACACTGGGCACCAAAGGCAATGTGCAGGTGGTGATCCCCTTCCTGACAGAGTCGTACAGT
TCCAGCCAGGACCCACCTGAGAAGTCCATCCCCATCTGTACCCTGAAGAACTTCCCTAATGCCATCGAGCACACCCTGCAGTGGGCTCGG
GATGAGTTTGAAGGCCTCTTCAAGCAGCCAGCAGAAAATGTCAACCAGTACCTCACAGACCCCAAGTTTGTGGAGCGAACACTGCGGCTG
GCAGGCACTCAGCCCTTGGAGGTGCTGGAGGCTGTGCAGCGCAGCCTGGTGCTGCAGCGACCACAGACCTGGGCTGACTGCGTGACCTGG
GCCTGCCACCACTGGCACACCCAGTACTCGAACAACATCCGGCAGCTGCTGCACAACTTCCCTCCTGACCAGCTCACAAGCTCAGGAGCG
CCGTTCTGGTCTGGGCCCAAACGCTGTCCACACCCGCTCACCTTTGATGTCAACAATCCCCTGCATCTGGACTATGTGATGGCTGCTGCC
AACCTGTTTGCCCAGACCTACGGGCTGACAGGCTCTCAGGACCGAGCTGCTGTGGCCACATTCCTGCAGTCTGTGCAGGTCCCCGAATTC
ACCCCCAAGTCTGGCGTCAAGATCCATGTTTCTGACCAGGAGCTGCAGAGCGCCAATGCCTCTGTTGATGACAGTCGTCTAGAGGAGCTC
AAAGCCACTCTGCCCAGCCCAGACAAGCTCCCTGGATTCAAGATGTACCCCATTGACTTTGAGAAGGATGATGACAGCAACTTTCATATG
GATTTCATCGTGGCTGCATCCAACCTCCGGGCAGAAAACTATGACATTCCTTCTGCAGACCGGCACAAGAGCAAGCTGATTGCAGGGAAG
ATCATCCCAGCCATTGCCACGACCACAGCAGCCGTGGTTGGCCTTGTGTGTCTGGAGCTGTACAAGGTTGTGCAGGGGCACCGACAGCTT
GACTCCTACAAGAATGGTTTCCTCAACTTGGCCCTGCCTTTCTTTGGTTTCTCTGAACCCCTTGCCGCACCACGTCACCAGTACTATAAC
CAAGAGTGGACATTGTGGGATCGCTTTGAGGTACAAGGGCTGCAGCCTAATGGTGAGGAGATGACCCTCAAACAGTTCCTCGACTATTTT
AAGACAGAGCACAAATTAGAGATCACCATGCTGTCCCAGGGCGTGTCCATGCTCTATTCCTTCTTCATGCCAGCTGCCAAGCTCAAGGAA
CGGTTGGATCAGCCGATGACAGAGATTGTGAGCCGTGTGTCGAAGCGAAAGCTGGGCCGCCACGTGCGGGCGCTGGTGCTTGAGCTGTGC
TGTAACGACGAGAGCGGCGAGGATGTCGAGGTTCCCTATGTCCGATACACCATCCGCTGACCCCGTCTGCTCCTCTAGGCTGGCCCCTTG
TCCACCCCTCTCCACACCCCTTCCAGCCCAGGGTTCCCATTTGGCTTCTGGCAGTGGCCCAACTAGCCAAGTCTGGTGTTCCCTCATCAT

>13758_13758_2_CCDC23-UBA1_CCDC23_chr1_43282102_ENST00000372521_UBA1_chrX_47058202_ENST00000377351_length(amino acids)=1096AA_BP=38
MDPPARKEKTKVKESVSRVEKAKQKSAQQELKQRQRAEMSSSPLSKKRRVSGPDPKPGSNCSPAQSVLSEVPSVPTNGMAKNGSEADIDE
GLYSRQLYVLGHEAMKRLQTSSVLVSGLRGLGVEIAKNIILGGVKAVTLHDQGTAQWADLSSQFYLREEDIGKNRAEVSQPRLAELNSYV
PVTAYTGPLVEDFLSGFQVVVLTNTPLEDQLRVGEFCHNRGIKLVVADTRGLFGQLFCDFGEEMILTDSNGEQPLSAMVSMVTKDNPGVV
TCLDEARHGFESGDFVSFSEVQGMVELNGNQPMEIKVLGPYTFSICDTSNFSDYIRGGIVSQVKVPKKISFKSLVASLAEPDFVVTDFAK
FSRPAQLHIGFQALHQFCAQHGRPPRPRNEEDAAELVALAQAVNARALPAVQQNNLDEDLIRKLAYVAAGDLAPINAFIGGLAAQEVMKA
CSGKFMPIMQWLYFDALECLPEDKEVLTEDKCLQRQNRYDGQVAVFGSDLQEKLGKQKYFLVGAGAIGCELLKNFAMIGLGCGEGGEIIV
TDMDTIEKSNLNRQFLFRPWDVTKLKSDTAAAAVRQMNPHIRVTSHQNRVGPDTERIYDDDFFQNLDGVANALDNVDARMYMDRRCVYYR
KPLLESGTLGTKGNVQVVIPFLTESYSSSQDPPEKSIPICTLKNFPNAIEHTLQWARDEFEGLFKQPAENVNQYLTDPKFVERTLRLAGT
QPLEVLEAVQRSLVLQRPQTWADCVTWACHHWHTQYSNNIRQLLHNFPPDQLTSSGAPFWSGPKRCPHPLTFDVNNPLHLDYVMAAANLF
AQTYGLTGSQDRAAVATFLQSVQVPEFTPKSGVKIHVSDQELQSANASVDDSRLEELKATLPSPDKLPGFKMYPIDFEKDDDSNFHMDFI
VAASNLRAENYDIPSADRHKSKLIAGKIIPAIATTTAAVVGLVCLELYKVVQGHRQLDSYKNGFLNLALPFFGFSEPLAAPRHQYYNQEW
TLWDRFEVQGLQPNGEEMTLKQFLDYFKTEHKLEITMLSQGVSMLYSFFMPAAKLKERLDQPMTEIVSRVSKRKLGRHVRALVLELCCND

--------------------------------------------------------------
>13758_13758_3_CCDC23-UBA1_CCDC23_chr1_43282102_ENST00000537227_UBA1_chrX_47058202_ENST00000335972_length(transcript)=3620nt_BP=244nt
GTCCAGTGGTCGGGGGAAGGCGAGGATTACCCTCCCGGAGGCGTTGTCTGCGACTCGGCGGAGGCTCCAACTTCCAGTGGCCCGGTCGGG
AAAGATCAGAGCCTCCTAAGAAATATCCAGAAGTCAAGCCATGGATCCACCTGCACGTAAAGAAAAAACCAAAGTTAAAGAATCTGTCAG
CAGAGTTGAGAAGGCCAAACAGAAATCAGCCCAGCAGGAGCTGAAGCAGAGACAAAGAGCAGAGATGTCCAGCTCGCCGCTGTCCAAGAA
ACGTCGCGTGTCCGGGCCTGATCCAAAGCCGGGTTCTAACTGCTCCCCTGCCCAGTCCGTGTTGTCCGAAGTGCCCTCGGTGCCAACCAA
CGGAATGGCCAAGAACGGCAGTGAAGCAGACATAGACGAGGGCCTTTACTCCCGGCAGCTGTATGTGTTGGGCCATGAGGCAATGAAGCG
GCTCCAGACATCCAGTGTCCTGGTATCAGGCCTGCGGGGCCTGGGCGTGGAGATCGCTAAGAACATCATCCTTGGTGGGGTCAAGGCTGT
TACCCTACATGACCAGGGCACTGCCCAGTGGGCTGATCTTTCCTCCCAGTTCTACCTGCGGGAGGAGGACATCGGTAAAAACCGGGCCGA
GGTATCACAGCCCCGCCTCGCTGAGCTCAACAGCTATGTGCCTGTCACTGCCTACACTGGACCCCTCGTTGAGGACTTCCTTAGTGGTTT
CCAGGTGGTGGTGCTCACCAACACCCCCCTGGAGGACCAGCTGCGAGTGGGTGAGTTCTGTCACAACCGTGGCATCAAGCTGGTGGTGGC
AGACACGCGGGGCCTGTTTGGGCAGCTCTTCTGTGACTTTGGAGAGGAAATGATCCTCACAGATTCCAATGGGGAGCAGCCACTCAGTGC
TATGGTTTCTATGGTTACCAAGGACAACCCCGGTGTGGTTACCTGCCTGGATGAGGCCCGACACGGGTTTGAGAGCGGGGACTTTGTCTC
CTTTTCAGAAGTACAGGGCATGGTTGAACTCAACGGAAATCAGCCCATGGAGATCAAAGTCCTGGGTCCTTATACCTTTAGCATCTGTGA
CACCTCCAACTTCTCCGACTACATCCGTGGAGGCATCGTCAGTCAGGTCAAAGTACCTAAGAAGATTAGCTTTAAATCCTTGGTGGCCTC
ACTGGCAGAACCTGACTTTGTGGTGACGGACTTCGCCAAGTTTTCTCGCCCTGCCCAGCTGCACATTGGCTTCCAGGCCCTGCACCAGTT
CTGTGCTCAGCATGGCCGGCCACCTCGGCCCCGCAATGAGGAGGATGCAGCAGAACTGGTAGCCTTAGCACAGGCTGTGAATGCTCGAGC
CCTGCCAGCAGTGCAGCAAAATAACCTGGACGAGGACCTCATCCGGAAGCTGGCATATGTGGCTGCTGGGGATCTGGCACCCATAAACGC
CTTCATTGGGGGCCTGGCTGCCCAGGAAGTCATGAAGGCCTGCTCCGGGAAGTTCATGCCCATCATGCAGTGGCTATACTTTGATGCCCT
TGAGTGTCTCCCTGAGGACAAAGAGGTCCTCACAGAGGACAAGTGCCTCCAGCGCCAGAACCGTTATGACGGGCAAGTGGCTGTGTTTGG
CTCAGACCTGCAAGAGAAGCTGGGCAAGCAGAAGTATTTCCTGGTGGGTGCGGGGGCCATTGGCTGTGAGCTGCTCAAGAACTTTGCCAT
GATTGGGCTGGGCTGCGGGGAGGGTGGAGAAATCATCGTTACAGACATGGACACCATTGAGAAGTCAAATCTGAATCGACAGTTTCTTTT
CCGGCCCTGGGATGTCACGAAGTTAAAGTCTGACACGGCTGCTGCAGCTGTGCGCCAAATGAATCCACATATCCGGGTGACAAGCCACCA
GAACCGTGTGGGTCCTGACACGGAGCGCATCTATGATGACGATTTTTTCCAAAACCTAGATGGCGTGGCCAATGCCCTGGACAACGTGGA
TGCCCGCATGTACATGGACCGCCGCTGTGTCTACTACCGGAAGCCACTGCTGGAGTCAGGCACACTGGGCACCAAAGGCAATGTGCAGGT
GGTGATCCCCTTCCTGACAGAGTCGTACAGTTCCAGCCAGGACCCACCTGAGAAGTCCATCCCCATCTGTACCCTGAAGAACTTCCCTAA
TGCCATCGAGCACACCCTGCAGTGGGCTCGGGATGAGTTTGAAGGCCTCTTCAAGCAGCCAGCAGAAAATGTCAACCAGTACCTCACAGA
CCCCAAGTTTGTGGAGCGAACACTGCGGCTGGCAGGCACTCAGCCCTTGGAGGTGCTGGAGGCTGTGCAGCGCAGCCTGGTGCTGCAGCG
ACCACAGACCTGGGCTGACTGCGTGACCTGGGCCTGCCACCACTGGCACACCCAGTACTCGAACAACATCCGGCAGCTGCTGCACAACTT
CCCTCCTGACCAGCTCACAAGCTCAGGAGCGCCGTTCTGGTCTGGGCCCAAACGCTGTCCACACCCGCTCACCTTTGATGTCAACAATCC
CCTGCATCTGGACTATGTGATGGCTGCTGCCAACCTGTTTGCCCAGACCTACGGGCTGACAGGCTCTCAGGACCGAGCTGCTGTGGCCAC
ATTCCTGCAGTCTGTGCAGGTCCCCGAATTCACCCCCAAGTCTGGCGTCAAGATCCATGTTTCTGACCAGGAGCTGCAGAGCGCCAATGC
CTCTGTTGATGACAGTCGTCTAGAGGAGCTCAAAGCCACTCTGCCCAGCCCAGACAAGCTCCCTGGATTCAAGATGTACCCCATTGACTT
TGAGAAGGATGATGACAGCAACTTTCATATGGATTTCATCGTGGCTGCATCCAACCTCCGGGCAGAAAACTATGACATTCCTTCTGCAGA
CCGGCACAAGAGCAAGCTGATTGCAGGGAAGATCATCCCAGCCATTGCCACGACCACAGCAGCCGTGGTTGGCCTTGTGTGTCTGGAGCT
GTACAAGGTTGTGCAGGGGCACCGACAGCTTGACTCCTACAAGAATGGTTTCCTCAACTTGGCCCTGCCTTTCTTTGGTTTCTCTGAACC
CCTTGCCGCACCACGTCACCAGTACTATAACCAAGAGTGGACATTGTGGGATCGCTTTGAGGTACAAGGGCTGCAGCCTAATGGTGAGGA
GATGACCCTCAAACAGTTCCTCGACTATTTTAAGACAGAGCACAAATTAGAGATCACCATGCTGTCCCAGGGCGTGTCCATGCTCTATTC
CTTCTTCATGCCAGCTGCCAAGCTCAAGGAACGGTTGGATCAGCCGATGACAGAGATTGTGAGCCGTGTGTCGAAGCGAAAGCTGGGCCG
CCACGTGCGGGCGCTGGTGCTTGAGCTGTGCTGTAACGACGAGAGCGGCGAGGATGTCGAGGTTCCCTATGTCCGATACACCATCCGCTG
ACCCCGTCTGCTCCTCTAGGCTGGCCCCTTGTCCACCCCTCTCCACACCCCTTCCAGCCCAGGGTTCCCATTTGGCTTCTGGCAGTGGCC
CAACTAGCCAAGTCTGGTGTTCCCTCATCATCCCCCTACCTGAACCCCTCTTGCCACTGCCTTCTACCTTGTTTGAAACCTGAATCCTAA

>13758_13758_3_CCDC23-UBA1_CCDC23_chr1_43282102_ENST00000537227_UBA1_chrX_47058202_ENST00000335972_length(amino acids)=1096AA_BP=38
MDPPARKEKTKVKESVSRVEKAKQKSAQQELKQRQRAEMSSSPLSKKRRVSGPDPKPGSNCSPAQSVLSEVPSVPTNGMAKNGSEADIDE
GLYSRQLYVLGHEAMKRLQTSSVLVSGLRGLGVEIAKNIILGGVKAVTLHDQGTAQWADLSSQFYLREEDIGKNRAEVSQPRLAELNSYV
PVTAYTGPLVEDFLSGFQVVVLTNTPLEDQLRVGEFCHNRGIKLVVADTRGLFGQLFCDFGEEMILTDSNGEQPLSAMVSMVTKDNPGVV
TCLDEARHGFESGDFVSFSEVQGMVELNGNQPMEIKVLGPYTFSICDTSNFSDYIRGGIVSQVKVPKKISFKSLVASLAEPDFVVTDFAK
FSRPAQLHIGFQALHQFCAQHGRPPRPRNEEDAAELVALAQAVNARALPAVQQNNLDEDLIRKLAYVAAGDLAPINAFIGGLAAQEVMKA
CSGKFMPIMQWLYFDALECLPEDKEVLTEDKCLQRQNRYDGQVAVFGSDLQEKLGKQKYFLVGAGAIGCELLKNFAMIGLGCGEGGEIIV
TDMDTIEKSNLNRQFLFRPWDVTKLKSDTAAAAVRQMNPHIRVTSHQNRVGPDTERIYDDDFFQNLDGVANALDNVDARMYMDRRCVYYR
KPLLESGTLGTKGNVQVVIPFLTESYSSSQDPPEKSIPICTLKNFPNAIEHTLQWARDEFEGLFKQPAENVNQYLTDPKFVERTLRLAGT
QPLEVLEAVQRSLVLQRPQTWADCVTWACHHWHTQYSNNIRQLLHNFPPDQLTSSGAPFWSGPKRCPHPLTFDVNNPLHLDYVMAAANLF
AQTYGLTGSQDRAAVATFLQSVQVPEFTPKSGVKIHVSDQELQSANASVDDSRLEELKATLPSPDKLPGFKMYPIDFEKDDDSNFHMDFI
VAASNLRAENYDIPSADRHKSKLIAGKIIPAIATTTAAVVGLVCLELYKVVQGHRQLDSYKNGFLNLALPFFGFSEPLAAPRHQYYNQEW
TLWDRFEVQGLQPNGEEMTLKQFLDYFKTEHKLEITMLSQGVSMLYSFFMPAAKLKERLDQPMTEIVSRVSKRKLGRHVRALVLELCCND

--------------------------------------------------------------
>13758_13758_4_CCDC23-UBA1_CCDC23_chr1_43282102_ENST00000537227_UBA1_chrX_47058202_ENST00000377351_length(transcript)=3620nt_BP=244nt
GTCCAGTGGTCGGGGGAAGGCGAGGATTACCCTCCCGGAGGCGTTGTCTGCGACTCGGCGGAGGCTCCAACTTCCAGTGGCCCGGTCGGG
AAAGATCAGAGCCTCCTAAGAAATATCCAGAAGTCAAGCCATGGATCCACCTGCACGTAAAGAAAAAACCAAAGTTAAAGAATCTGTCAG
CAGAGTTGAGAAGGCCAAACAGAAATCAGCCCAGCAGGAGCTGAAGCAGAGACAAAGAGCAGAGATGTCCAGCTCGCCGCTGTCCAAGAA
ACGTCGCGTGTCCGGGCCTGATCCAAAGCCGGGTTCTAACTGCTCCCCTGCCCAGTCCGTGTTGTCCGAAGTGCCCTCGGTGCCAACCAA
CGGAATGGCCAAGAACGGCAGTGAAGCAGACATAGACGAGGGCCTTTACTCCCGGCAGCTGTATGTGTTGGGCCATGAGGCAATGAAGCG
GCTCCAGACATCCAGTGTCCTGGTATCAGGCCTGCGGGGCCTGGGCGTGGAGATCGCTAAGAACATCATCCTTGGTGGGGTCAAGGCTGT
TACCCTACATGACCAGGGCACTGCCCAGTGGGCTGATCTTTCCTCCCAGTTCTACCTGCGGGAGGAGGACATCGGTAAAAACCGGGCCGA
GGTATCACAGCCCCGCCTCGCTGAGCTCAACAGCTATGTGCCTGTCACTGCCTACACTGGACCCCTCGTTGAGGACTTCCTTAGTGGTTT
CCAGGTGGTGGTGCTCACCAACACCCCCCTGGAGGACCAGCTGCGAGTGGGTGAGTTCTGTCACAACCGTGGCATCAAGCTGGTGGTGGC
AGACACGCGGGGCCTGTTTGGGCAGCTCTTCTGTGACTTTGGAGAGGAAATGATCCTCACAGATTCCAATGGGGAGCAGCCACTCAGTGC
TATGGTTTCTATGGTTACCAAGGACAACCCCGGTGTGGTTACCTGCCTGGATGAGGCCCGACACGGGTTTGAGAGCGGGGACTTTGTCTC
CTTTTCAGAAGTACAGGGCATGGTTGAACTCAACGGAAATCAGCCCATGGAGATCAAAGTCCTGGGTCCTTATACCTTTAGCATCTGTGA
CACCTCCAACTTCTCCGACTACATCCGTGGAGGCATCGTCAGTCAGGTCAAAGTACCTAAGAAGATTAGCTTTAAATCCTTGGTGGCCTC
ACTGGCAGAACCTGACTTTGTGGTGACGGACTTCGCCAAGTTTTCTCGCCCTGCCCAGCTGCACATTGGCTTCCAGGCCCTGCACCAGTT
CTGTGCTCAGCATGGCCGGCCACCTCGGCCCCGCAATGAGGAGGATGCAGCAGAACTGGTAGCCTTAGCACAGGCTGTGAATGCTCGAGC
CCTGCCAGCAGTGCAGCAAAATAACCTGGACGAGGACCTCATCCGGAAGCTGGCATATGTGGCTGCTGGGGATCTGGCACCCATAAACGC
CTTCATTGGGGGCCTGGCTGCCCAGGAAGTCATGAAGGCCTGCTCCGGGAAGTTCATGCCCATCATGCAGTGGCTATACTTTGATGCCCT
TGAGTGTCTCCCTGAGGACAAAGAGGTCCTCACAGAGGACAAGTGCCTCCAGCGCCAGAACCGTTATGACGGGCAAGTGGCTGTGTTTGG
CTCAGACCTGCAAGAGAAGCTGGGCAAGCAGAAGTATTTCCTGGTGGGTGCGGGGGCCATTGGCTGTGAGCTGCTCAAGAACTTTGCCAT
GATTGGGCTGGGCTGCGGGGAGGGTGGAGAAATCATCGTTACAGACATGGACACCATTGAGAAGTCAAATCTGAATCGACAGTTTCTTTT
CCGGCCCTGGGATGTCACGAAGTTAAAGTCTGACACGGCTGCTGCAGCTGTGCGCCAAATGAATCCACATATCCGGGTGACAAGCCACCA
GAACCGTGTGGGTCCTGACACGGAGCGCATCTATGATGACGATTTTTTCCAAAACCTAGATGGCGTGGCCAATGCCCTGGACAACGTGGA
TGCCCGCATGTACATGGACCGCCGCTGTGTCTACTACCGGAAGCCACTGCTGGAGTCAGGCACACTGGGCACCAAAGGCAATGTGCAGGT
GGTGATCCCCTTCCTGACAGAGTCGTACAGTTCCAGCCAGGACCCACCTGAGAAGTCCATCCCCATCTGTACCCTGAAGAACTTCCCTAA
TGCCATCGAGCACACCCTGCAGTGGGCTCGGGATGAGTTTGAAGGCCTCTTCAAGCAGCCAGCAGAAAATGTCAACCAGTACCTCACAGA
CCCCAAGTTTGTGGAGCGAACACTGCGGCTGGCAGGCACTCAGCCCTTGGAGGTGCTGGAGGCTGTGCAGCGCAGCCTGGTGCTGCAGCG
ACCACAGACCTGGGCTGACTGCGTGACCTGGGCCTGCCACCACTGGCACACCCAGTACTCGAACAACATCCGGCAGCTGCTGCACAACTT
CCCTCCTGACCAGCTCACAAGCTCAGGAGCGCCGTTCTGGTCTGGGCCCAAACGCTGTCCACACCCGCTCACCTTTGATGTCAACAATCC
CCTGCATCTGGACTATGTGATGGCTGCTGCCAACCTGTTTGCCCAGACCTACGGGCTGACAGGCTCTCAGGACCGAGCTGCTGTGGCCAC
ATTCCTGCAGTCTGTGCAGGTCCCCGAATTCACCCCCAAGTCTGGCGTCAAGATCCATGTTTCTGACCAGGAGCTGCAGAGCGCCAATGC
CTCTGTTGATGACAGTCGTCTAGAGGAGCTCAAAGCCACTCTGCCCAGCCCAGACAAGCTCCCTGGATTCAAGATGTACCCCATTGACTT
TGAGAAGGATGATGACAGCAACTTTCATATGGATTTCATCGTGGCTGCATCCAACCTCCGGGCAGAAAACTATGACATTCCTTCTGCAGA
CCGGCACAAGAGCAAGCTGATTGCAGGGAAGATCATCCCAGCCATTGCCACGACCACAGCAGCCGTGGTTGGCCTTGTGTGTCTGGAGCT
GTACAAGGTTGTGCAGGGGCACCGACAGCTTGACTCCTACAAGAATGGTTTCCTCAACTTGGCCCTGCCTTTCTTTGGTTTCTCTGAACC
CCTTGCCGCACCACGTCACCAGTACTATAACCAAGAGTGGACATTGTGGGATCGCTTTGAGGTACAAGGGCTGCAGCCTAATGGTGAGGA
GATGACCCTCAAACAGTTCCTCGACTATTTTAAGACAGAGCACAAATTAGAGATCACCATGCTGTCCCAGGGCGTGTCCATGCTCTATTC
CTTCTTCATGCCAGCTGCCAAGCTCAAGGAACGGTTGGATCAGCCGATGACAGAGATTGTGAGCCGTGTGTCGAAGCGAAAGCTGGGCCG
CCACGTGCGGGCGCTGGTGCTTGAGCTGTGCTGTAACGACGAGAGCGGCGAGGATGTCGAGGTTCCCTATGTCCGATACACCATCCGCTG
ACCCCGTCTGCTCCTCTAGGCTGGCCCCTTGTCCACCCCTCTCCACACCCCTTCCAGCCCAGGGTTCCCATTTGGCTTCTGGCAGTGGCC
CAACTAGCCAAGTCTGGTGTTCCCTCATCATCCCCCTACCTGAACCCCTCTTGCCACTGCCTTCTACCTTGTTTGAAACCTGAATCCTAA

>13758_13758_4_CCDC23-UBA1_CCDC23_chr1_43282102_ENST00000537227_UBA1_chrX_47058202_ENST00000377351_length(amino acids)=1096AA_BP=38
MDPPARKEKTKVKESVSRVEKAKQKSAQQELKQRQRAEMSSSPLSKKRRVSGPDPKPGSNCSPAQSVLSEVPSVPTNGMAKNGSEADIDE
GLYSRQLYVLGHEAMKRLQTSSVLVSGLRGLGVEIAKNIILGGVKAVTLHDQGTAQWADLSSQFYLREEDIGKNRAEVSQPRLAELNSYV
PVTAYTGPLVEDFLSGFQVVVLTNTPLEDQLRVGEFCHNRGIKLVVADTRGLFGQLFCDFGEEMILTDSNGEQPLSAMVSMVTKDNPGVV
TCLDEARHGFESGDFVSFSEVQGMVELNGNQPMEIKVLGPYTFSICDTSNFSDYIRGGIVSQVKVPKKISFKSLVASLAEPDFVVTDFAK
FSRPAQLHIGFQALHQFCAQHGRPPRPRNEEDAAELVALAQAVNARALPAVQQNNLDEDLIRKLAYVAAGDLAPINAFIGGLAAQEVMKA
CSGKFMPIMQWLYFDALECLPEDKEVLTEDKCLQRQNRYDGQVAVFGSDLQEKLGKQKYFLVGAGAIGCELLKNFAMIGLGCGEGGEIIV
TDMDTIEKSNLNRQFLFRPWDVTKLKSDTAAAAVRQMNPHIRVTSHQNRVGPDTERIYDDDFFQNLDGVANALDNVDARMYMDRRCVYYR
KPLLESGTLGTKGNVQVVIPFLTESYSSSQDPPEKSIPICTLKNFPNAIEHTLQWARDEFEGLFKQPAENVNQYLTDPKFVERTLRLAGT
QPLEVLEAVQRSLVLQRPQTWADCVTWACHHWHTQYSNNIRQLLHNFPPDQLTSSGAPFWSGPKRCPHPLTFDVNNPLHLDYVMAAANLF
AQTYGLTGSQDRAAVATFLQSVQVPEFTPKSGVKIHVSDQELQSANASVDDSRLEELKATLPSPDKLPGFKMYPIDFEKDDDSNFHMDFI
VAASNLRAENYDIPSADRHKSKLIAGKIIPAIATTTAAVVGLVCLELYKVVQGHRQLDSYKNGFLNLALPFFGFSEPLAAPRHQYYNQEW
TLWDRFEVQGLQPNGEEMTLKQFLDYFKTEHKLEITMLSQGVSMLYSFFMPAAKLKERLDQPMTEIVSRVSKRKLGRHVRALVLELCCND

--------------------------------------------------------------

Top

Fusion Gene PPI Analysis for CCDC23-UBA1

Go to ChiPPI (Chimeric Protein-Protein interactions) to see the chimeric PPI interaction in
ChiPPI page.

Protein-protein interactors with each fusion partner protein in wild-type (BIOGRID-3.4.160)

Hgene

Hgene's interactors

Tgene

Tgene's interactors

- Retained PPIs in in-frame fusion.

Partner

Gene

Hbp

Tbp

ENST

Strand

BPexon

TotalExon

Protein feature loci

*BPloci

TotalLen

Still interaction with

- Lost PPIs in in-frame fusion.

Partner

Gene

Hbp

Tbp

ENST

Strand

BPexon

TotalExon

Protein feature loci

*BPloci

TotalLen

Interaction lost with

- Retained PPIs, but lost function due to frame-shift fusion.

Partner

Gene

Hbp

Tbp

ENST

Strand

BPexon

TotalExon

Protein feature loci

*BPloci

TotalLen

Interaction lost with

Top

Related Drugs for CCDC23-UBA1

Drugs targeting genes involved in this fusion gene.
(DrugBank Version 5.1.8 2021-05-08)

Partner

Gene

UniProtAcc

DrugBank ID

Drug name

Drug activity

Drug type

Drug status

Top

Related Diseases for CCDC23-UBA1

Diseases associated with fusion partners.
(DisGeNet 4.0)

Partner

Gene

Disease ID

Disease name

# pubmeds

Source