Home

Download

Statistics

Examples

Help

Contact

	Fusion Gene Summary
	Fusion Gene ORF analysis
	Fusion Genomic Features
	Fusion Protein Features
	Fusion Gene Sequence
	Fusion Gene PPI analysis
	Related Drugs
	Related Diseases

Fusion gene:CELSR1-CD52 (FusionGDB2 ID:15677)

Fusion Gene Summary for CELSR1-CD52

Fusion gene summary

Fusion gene information	Fusion gene name: CELSR1-CD52
	Fusion gene ID: 15677
		Hgene	Tgene
	Gene symbol	CELSR1	CD52
	Gene ID	9620	1043
	Gene name	cadherin EGF LAG seven-pass G-type receptor 1	CD52 molecule
	Synonyms	ADGRC1\|CDHF9\|FMI2\|HFMI2\|ME2	CDW52\|EDDM5\|HE5
	Cytomap	22q13.31	1p36.11
	Type of gene	protein-coding	protein-coding
	Description	cadherin EGF LAG seven-pass G-type receptor 1adhesion G protein-coupled receptor C1cadherin family member 9cadherin, EGF LAG seven-pass G-type receptor 1 (flamingo homolog, Drosophila)flamingo homolog 2protocadherin flamingo 2	CAMPATH-1 antigenCD52 antigen (CAMPATH-1 antigen)CDW52 antigen (CAMPATH-1 antigen)HEL-S-171mPcambridge pathology 1 antigenepididymal secretory protein E5epididymis secretory sperm binding protein Li 171mPhuman epididymis-specific protein 5
	Modification date	20200322	20200313
	UniProtAcc	Q9NYQ6	.
	Ensembl transtripts involved in fusion gene	ENST00000262738, ENST00000395964, ENST00000497509,	ENST00000374213, ENST00000492808,
Fusion gene scores	* DoF score	23 X 19 X 11=4807	5 X 3 X 5=75
	# samples	28	6
	** MAII score	log2(28/4807*10)=-4.10163807119293 possibly effective Gene in Pan-Cancer Fusion Genes (peGinPCFGs). DoF>8 and MAII<0	log2(6/75*10)=-0.321928094887362 possibly effective Gene in Pan-Cancer Fusion Genes (peGinPCFGs). DoF>8 and MAII<0
Context	PubMed: CELSR1 [Title/Abstract] AND CD52 [Title/Abstract] AND fusion [Title/Abstract]
Most frequent breakpoint	CELSR1(46859604)-CD52(26646662), # samples:3
Anticipated loss of major functional domain due to fusion event.

* DoF score (Degree of Frequency) = # partners X # break points X # cancer types
** MAII score (Major Active Isofusion Index) = log2(# samples/DoF score*10)

Gene ontology of each fusion partner gene with evidence of Inferred from Direct Assay (IDA) from Entrez

Partner	Gene	GO ID	GO term	PubMed ID
Tgene	CD52	GO:0007204	positive regulation of cytosolic calcium ion concentration	8223854

Fusion gene breakpoints across CELSR1 (5'-gene)
* Click on the image to open the UCSC genome browser with custom track showing this image in a new window.

Fusion gene breakpoints across CD52 (3'-gene)
* Click on the image to open the UCSC genome browser with custom track showing this image in a new window.

Fusion gene information from two resources (ChiTars 5.0 and ChimerDB 4.0)
* All genome coordinats were lifted-over on hg19.
* Click on the break point to see the gene structure around the break point region using the UCSC Genome Browser.

Source	Disease	Sample	Hgene	Hchr	Hbp	Hstrand	Tgene	Tchr	Tbp	Tstrand
ChimerDB4	LUAD	TCGA-62-8394-01A	CELSR1	chr22	46859604	-	CD52	chr1	26646662	+
ChimerDB4	LUAD	TCGA-62-8394	CELSR1	chr22	46859603	-	CD52	chr1	26646661	+
ChimerDB4	LUAD	TCGA-62-8394-01A	CELSR1	chr22	46859604	-	CD52	chr1	26646662	+
ChimerDB4	LUAD	TCGA-62-8394-01A	CELSR1	chr22	46859604	-	CD52	chr1	26646662	+
ChimerDB4	LUAD	TCGA-62-8394-01A	CELSR1	chr22	46859603	-	CD52	chr1	26646661	+

Top

Fusion Gene ORF analysis for CELSR1-CD52

Open reading frame (ORF) analsis of fusion genes based on Ensembl gene isoform structure.
* Click on the break point to see the gene structure around the break point region using the UCSC Genome Browser.

ORF	Henst	Tenst	Hgene	Hchr	Hbp	Hstrand	Tgene	Tchr	Tbp	Tstrand
In-frame	ENST00000262738	ENST00000374213	CELSR1	chr22	46859604	-	CD52	chr1	26646662	+
5CDS-intron	ENST00000262738	ENST00000492808	CELSR1	chr22	46859604	-	CD52	chr1	26646662	+
In-frame	ENST00000395964	ENST00000374213	CELSR1	chr22	46859604	-	CD52	chr1	26646662	+
5CDS-intron	ENST00000395964	ENST00000492808	CELSR1	chr22	46859604	-	CD52	chr1	26646662	+
intron-3CDS	ENST00000497509	ENST00000374213	CELSR1	chr22	46859604	-	CD52	chr1	26646662	+
intron-intron	ENST00000497509	ENST00000492808	CELSR1	chr22	46859604	-	CD52	chr1	26646662	+
In-frame	ENST00000262738	ENST00000374213	CELSR1	chr22	46859603	-	CD52	chr1	26646661	+
5CDS-intron	ENST00000262738	ENST00000492808	CELSR1	chr22	46859603	-	CD52	chr1	26646661	+
In-frame	ENST00000395964	ENST00000374213	CELSR1	chr22	46859603	-	CD52	chr1	26646661	+
5CDS-intron	ENST00000395964	ENST00000492808	CELSR1	chr22	46859603	-	CD52	chr1	26646661	+
intron-3CDS	ENST00000497509	ENST00000374213	CELSR1	chr22	46859603	-	CD52	chr1	26646661	+
intron-intron	ENST00000497509	ENST00000492808	CELSR1	chr22	46859603	-	CD52	chr1	26646661	+

ORFfinder result based on the fusion transcript sequence of in-frame fusion genes.

Henst	Tenst	Hgene	Hchr	Hbp	Hstrand	Tgene	Tchr	Tbp	Tstrand	Seq length (transcript)	BP loci (transcript)	Predicted start (transcript)	Predicted stop (transcript)	Seq length (amino acids)
ENST00000262738	CELSR1	chr22	46859604	-	ENST00000374213	CD52	chr1	26646662	+	4536	4183	0	4319	1439
ENST00000395964	CELSR1	chr22	46859604	-	ENST00000374213	CD52	chr1	26646662	+	4536	4183	0	4319	1439
ENST00000262738	CELSR1	chr22	46859603	-	ENST00000374213	CD52	chr1	26646661	+	4536	4183	0	4319	1439
ENST00000395964	CELSR1	chr22	46859603	-	ENST00000374213	CD52	chr1	26646661	+	4536	4183	0	4319	1439

DeepORF prediction of the coding potential based on the fusion transcript sequence of in-frame fusion genes. DeepORF is a coding potential classifier based on convolutional neural network by comparing the real Ribo-seq data. If the no-coding score < 0.5 and coding score > 0.5, then the in-frame fusion transcript is predicted as being likely translated.

Henst	Tenst	Hgene	Hchr	Hbp	Hstrand	Tgene	Tchr	Tbp	Tstrand	No-coding score	Coding score
ENST00000262738	ENST00000374213	CELSR1	chr22	46859604	-	CD52	chr1	26646662	+	0.002149907	0.99785006
ENST00000395964	ENST00000374213	CELSR1	chr22	46859604	-	CD52	chr1	26646662	+	0.002149907	0.99785006
ENST00000262738	ENST00000374213	CELSR1	chr22	46859603	-	CD52	chr1	26646661	+	0.002149907	0.99785006
ENST00000395964	ENST00000374213	CELSR1	chr22	46859603	-	CD52	chr1	26646661	+	0.002149907	0.99785006

Top

Fusion Genomic Features for CELSR1-CD52

FusionAI prediction of the potential fusion gene breakpoint based on the pre-mature RNA sequence context (+/- 5kb of individual partner genes, total 20kb length sequence). FusionAI is a fusion gene breakpoint classifier based on convolutional neural network by comparing the fusion positive and negative sequence context of ~ 20K fusion gene data. From here, we can have the relative potentency of the 20K genomic sequence how individual sequnce will be likely used as the gene fusion breakpoints.

Hgene	Hchr	Hbp	Hstrand	Tgene	Tchr	Tbp	Tstrand	1-p	p (fusion gene breakpoint)
CELSR1	chr22	46859603	-	CD52	chr1	26646661	+	1.05E-05	0.9999895
CELSR1	chr22	46859603	-	CD52	chr1	26646661	+	1.05E-05	0.9999895
CELSR1	chr22	46859603	-	CD52	chr1	26646661	+	1.05E-05	0.9999895
CELSR1	chr22	46859603	-	CD52	chr1	26646661	+	1.05E-05	0.9999895

Distribution of 44 human genomic features loci across 20kb length fusion breakpoint regions. We integrated a total of 44 different types of human genomic feature loci information across five big categories including virus integration sites, repeats, structural variants, chromatin states, and gene expression regulation. More details are in help page.

Distribution of 44 human genomic features loci across 20kb length fusion breakpoint regions that are ovelapped with the top 1% feature importance score regions. More details are in help page.

Top

Fusion Protein Features for CELSR1-CD52

Go to
FGviewer for the breakpoints of chr22:46859604-chr1:26646662
.
- FGviewer provides the online visualization of the retention search of the protein functional features across DNA, RNA, protein, and pathological levels.

Main function of each fusion partner protein. (from UniProt)

Hgene	Tgene
CELSR1 Q9NYQ6	.
FUNCTION: Receptor that may have an important role in cell/cell signaling during nervous system formation.	FUNCTION: Might normally function as a transcriptional repressor. EWS-fusion-proteins (EFPS) may play a role in the tumorigenic process. They may disturb gene expression by mimicking, or interfering with the normal function of CTD-POLII within the transcription initiation complex. They may also contribute to an aberrant activation of the fusion protein target genes.

Retention analysis result of each fusion partner protein across 39 protein features of UniProt such as six molecule processing features, 13 region features, four site features, six amino acid modification features, two natural variation features, five experimental info features, and 3 secondary structure features. Here, because of limited space for viewing, we only show the protein feature retention information belong to the 13 regional features. All retention annotation result can be downloaded at
download page

* Minus value of BPloci means that the break pointn is located before the CDS.

- In-frame and retained protein feature among the 13 regional features.

Partner

Gene

Hbp

Tbp

ENST

Strand

BPexon

TotalExon

Protein feature loci

*BPloci

TotalLen

Protein feature

Protein feature note

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

1000_1101

1394.3333333333333

3015.0

Domain

Cadherin 8

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

1106_1224

1394.3333333333333

3015.0

Domain

Cadherin 9

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

1303_1361

1394.3333333333333

3015.0

Domain

EGF-like 1%3B calcium-binding

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

246_353

1394.3333333333333

3015.0

Domain

Cadherin 1

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

354_459

1394.3333333333333

3015.0

Domain

Cadherin 2

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

460_565

1394.3333333333333

3015.0

Domain

Cadherin 3

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

566_687

1394.3333333333333

3015.0

Domain

Cadherin 4

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

688_789

1394.3333333333333

3015.0

Domain

Cadherin 5

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

790_892

1394.3333333333333

3015.0

Domain

Cadherin 6

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

893_999

1394.3333333333333

3015.0

Domain

Cadherin 7

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

1000_1101

1394.3333333333333

3015.0

Domain

Cadherin 8

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

1106_1224

1394.3333333333333

3015.0

Domain

Cadherin 9

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

1303_1361

1394.3333333333333

3015.0

Domain

EGF-like 1%3B calcium-binding

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

246_353

1394.3333333333333

3015.0

Domain

Cadherin 1

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

354_459

1394.3333333333333

3015.0

Domain

Cadherin 2

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

460_565

1394.3333333333333

3015.0

Domain

Cadherin 3

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

566_687

1394.3333333333333

3015.0

Domain

Cadherin 4

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

688_789

1394.3333333333333

3015.0

Domain

Cadherin 5

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

790_892

1394.3333333333333

3015.0

Domain

Cadherin 6

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

893_999

1394.3333333333333

3015.0

Domain

Cadherin 7

- In-frame and not-retained protein feature among the 13 regional features.

Partner

Gene

Hbp

Tbp

ENST

Strand

BPexon

TotalExon

Protein feature loci

*BPloci

TotalLen

Protein feature

Protein feature note

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

2659_2663

1394.3333333333333

3015.0

Compositional bias

Note=Poly-Leu

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

2659_2663

1394.3333333333333

3015.0

Compositional bias

Note=Poly-Leu

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

1363_1399

1394.3333333333333

3015.0

Domain

EGF-like 2%3B calcium-binding

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

1403_1441

1394.3333333333333

3015.0

Domain

EGF-like 3%3B calcium-binding

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

1442_1646

1394.3333333333333

3015.0

Domain

Laminin G-like 1

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

1649_1685

1394.3333333333333

3015.0

Domain

EGF-like 4%3B calcium-binding

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

1689_1870

1394.3333333333333

3015.0

Domain

Laminin G-like 2

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

1872_1907

1394.3333333333333

3015.0

Domain

EGF-like 5%3B calcium-binding

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

1908_1946

1394.3333333333333

3015.0

Domain

EGF-like 6%3B calcium-binding

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

1947_1979

1394.3333333333333

3015.0

Domain

EGF-like 7%3B calcium-binding

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

1981_2016

1394.3333333333333

3015.0

Domain

EGF-like 8%3B calcium-binding

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

2003_2050

1394.3333333333333

3015.0

Domain

Laminin EGF-like

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

2408_2460

1394.3333333333333

3015.0

Domain

GPS

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

1363_1399

1394.3333333333333

3015.0

Domain

EGF-like 2%3B calcium-binding

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

1403_1441

1394.3333333333333

3015.0

Domain

EGF-like 3%3B calcium-binding

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

1442_1646

1394.3333333333333

3015.0

Domain

Laminin G-like 1

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

1649_1685

1394.3333333333333

3015.0

Domain

EGF-like 4%3B calcium-binding

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

1689_1870

1394.3333333333333

3015.0

Domain

Laminin G-like 2

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

1872_1907

1394.3333333333333

3015.0

Domain

EGF-like 5%3B calcium-binding

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

1908_1946

1394.3333333333333

3015.0

Domain

EGF-like 6%3B calcium-binding

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

1947_1979

1394.3333333333333

3015.0

Domain

EGF-like 7%3B calcium-binding

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

1981_2016

1394.3333333333333

3015.0

Domain

EGF-like 8%3B calcium-binding

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

2003_2050

1394.3333333333333

3015.0

Domain

Laminin EGF-like

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

2408_2460

1394.3333333333333

3015.0

Domain

GPS

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

22_2469

1394.3333333333333

3015.0

Topological domain

Extracellular

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

2491_2501

1394.3333333333333

3015.0

Topological domain

Cytoplasmic

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

2523_2527

1394.3333333333333

3015.0

Topological domain

Extracellular

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

2549_2572

1394.3333333333333

3015.0

Topological domain

Cytoplasmic

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

2594_2611

1394.3333333333333

3015.0

Topological domain

Extracellular

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

2633_2655

1394.3333333333333

3015.0

Topological domain

Cytoplasmic

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

2677_2683

1394.3333333333333

3015.0

Topological domain

Extracellular

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

2705_3014

1394.3333333333333

3015.0

Topological domain

Cytoplasmic

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

22_2469

1394.3333333333333

3015.0

Topological domain

Extracellular

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

2491_2501

1394.3333333333333

3015.0

Topological domain

Cytoplasmic

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

2523_2527

1394.3333333333333

3015.0

Topological domain

Extracellular

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

2549_2572

1394.3333333333333

3015.0

Topological domain

Cytoplasmic

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

2594_2611

1394.3333333333333

3015.0

Topological domain

Extracellular

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

2633_2655

1394.3333333333333

3015.0

Topological domain

Cytoplasmic

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

2677_2683

1394.3333333333333

3015.0

Topological domain

Extracellular

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

2705_3014

1394.3333333333333

3015.0

Topological domain

Cytoplasmic

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

2470_2490

1394.3333333333333

3015.0

Transmembrane

Helical%3B Name%3D1

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

2502_2522

1394.3333333333333

3015.0

Transmembrane

Helical%3B Name%3D2

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

2528_2548

1394.3333333333333

3015.0

Transmembrane

Helical%3B Name%3D3

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

2573_2593

1394.3333333333333

3015.0

Transmembrane

Helical%3B Name%3D4

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

2612_2632

1394.3333333333333

3015.0

Transmembrane

Helical%3B Name%3D5

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

2656_2676

1394.3333333333333

3015.0

Transmembrane

Helical%3B Name%3D6

Hgene

CELSR1

chr22:46859603

chr1:26646661

ENST00000262738

2684_2704

1394.3333333333333

3015.0

Transmembrane

Helical%3B Name%3D7

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

2470_2490

1394.3333333333333

3015.0

Transmembrane

Helical%3B Name%3D1

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

2502_2522

1394.3333333333333

3015.0

Transmembrane

Helical%3B Name%3D2

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

2528_2548

1394.3333333333333

3015.0

Transmembrane

Helical%3B Name%3D3

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

2573_2593

1394.3333333333333

3015.0

Transmembrane

Helical%3B Name%3D4

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

2612_2632

1394.3333333333333

3015.0

Transmembrane

Helical%3B Name%3D5

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

2656_2676

1394.3333333333333

3015.0

Transmembrane

Helical%3B Name%3D6

Hgene

CELSR1

chr22:46859604

chr1:26646662

ENST00000262738

2684_2704

1394.3333333333333

3015.0

Transmembrane

Helical%3B Name%3D7

Top

Fusion Gene Sequence for CELSR1-CD52

For in-frame fusion transcripts, we provide the fusion transcript sequences and fusion amino acid sequences. To have fusion amino acid sequence, we ran ORFfinder and chose the longest ORF among the all predicted ones.

>In-frame_ENST00000262738_ENST00000374213_TCGA-62-8394-01A_CELSR1_chr22_46859604_-_CD52_chr1_26646662_length(transcript)=4536nt_BP=4183nt
ATGGCGCCGCCGCCGCCGCCCGTGCTGCCCGTGCTGCTGCTCCTGGCCGCCGCCGCCGCCCTGCCGGCGATGGGGCTGCGAGCGGCCGCC
TGGGAGCCGCGCGTACCCGGCGGGACCCGCGCCTTCGCCCTCCGGCCCGGCTGTACCTACGCGGTGGGCGCCGCTTGCACGCCCCGGGCG
CCGCGGGAGCTGCTGGACGTGGGCCGCGATGGGCGGCTGGCAGGACGTCGGCGCGTCTCGGGCGCGGGGCGCCCGCTGCCGCTGCAAGTC
CGCTTGGTGGCCCGCAGTGCCCCGACGGCGCTGAGCCGCCGCCTGCGGGCGCGCACGCACCTTCCCGGCTGCGGAGCCCGTGCCCGGCTC
TGCGGAACCGGTGCCCGGCTCTGCGGGGCGCTCTGCTTCCCCGTCCCCGGCGGCTGCGCGGCCGCGCAGCATTCGGCGCTCGCAGCTCCG
ACCACCTTACCCGCCTGCCGCTGCCCGCCGCGCCCCAGGCCCCGCTGTCCCGGCCGTCCCATCTGCCTGCCGCCGGGCGGCTCGGTCCGC
CTGCGTCTGCTGTGCGCCCTGCGGCGCGCGGCTGGCGCCGTCCGGGTGGGACTGGCGCTGGAGGCCGCCACCGCGGGGACGCCCTCCGCG
TCGCCATCCCCATCGCCGCCCCTGCCGCCGAACTTGCCCGAAGCCCGGGCGGGGCCGGCGCGACGGGCCCGGCGGGGCACGAGCGGCAGA
GGGAGCCTGAAGTTTCCGATGCCCAACTACCAGGTGGCGTTGTTTGAGAACGAACCGGCGGGCACCCTCATCCTCCAGCTGCACGCGCAC
TACACCATCGAGGGCGAGGAGGAGCGCGTGAGCTATTACATGGAGGGGCTGTTCGACGAGCGCTCCCGGGGCTACTTCCGAATCGACTCT
GCCACGGGCGCCGTGAGCACGGACAGCGTACTGGACCGCGAGACCAAGGAGACGCACGTCCTCAGGGTGAAAGCCGTGGACTACAGTACG
CCGCCGCGCTCGGCCACCACCTACATCACTGTCTTGGTCAAAGACACCAACGACCACAGCCCGGTCTTCGAGCAGTCGGAGTACCGCGAG
CGCGTGCGGGAGAACCTGGAGGTGGGCTACGAGGTGCTGACCATCCGCGCCAGCGACCGCGACTCGCCCATCAACGCCAACTTGCGTTAC
CGCGTGTTGGGGGGCGCGTGGGACGTCTTCCAGCTCAACGAGAGCTCTGGCGTGGTGAGCACACGGGCGGTGCTGGACCGGGAGGAGGCG
GCCGAGTACCAGCTCCTGGTGGAGGCCAACGACCAGGGGCGCAATCCGGGCCCGCTCAGTGCCACGGCCACCGTGTACATCGAGGTGGAG
GACGAGAACGACAACTACCCCCAGTTCAGCGAGCAGAACTACGTGGTCCAGGTGCCCGAGGACGTGGGGCTCAACACGGCTGTGCTGCGA
GTGCAGGCCACGGACCGGGACCAGGGCCAGAACGCGGCCATTCACTACAGCATCCTCAGCGGGAACGTGGCCGGCCAGTTCTACCTGCAC
TCGCTGAGCGGGATCCTGGATGTGATCAACCCCTTGGATTTCGAGGATGTCCAGAAATACTCGCTGAGCATTAAGGCCCAGGATGGGGGC
CGGCCCCCGCTCATCAATTCTTCAGGGGTGGTGTCTGTGCAGGTGCTGGATGTCAACGACAACGAGCCTATCTTTGTGAGCAGCCCCTTC
CAGGCCACGGTGCTGGAGAATGTGCCCCTGGGCTACCCCGTGGTGCACATTCAGGCGGTGGACGCGGACTCTGGAGAGAACGCCCGGCTG
CACTATCGCCTGGTGGACACGGCCTCCACCTTTCTGGGGGGCGGCAGCGCTGGGCCTAAGAATCCTGCCCCCACCCCTGACTTCCCCTTC
CAGATCCACAACAGCTCCGGTTGGATCACAGTGTGTGCCGAGCTGGACCGCGAGGAGGTGGAGCACTACAGCTTCGGGGTGGAGGCGGTG
GACCACGGCTCGCCCCCCATGAGCTCCTCCACCAGCGTGTCCATCACGGTGCTGGACGTGAATGACAACGACCCGGTGTTCACGCAGCCC
ACCTACGAGCTTCGTCTGAATGAGGATGCGGCCGTGGGGAGCAGCGTGCTGACCCTGCAGGCCCGCGACCGTGACGCCAACAGTGTGATT
ACCTACCAGCTCACAGGCGGCAACACCCGGAACCGCTTTGCACTCAGCAGCCAGAGAGGGGGCGGCCTCATCACCCTGGCGCTACCTCTG
GACTACAAGCAGGAGCAGCAGTACGTGCTGGCGGTGACAGCATCCGACGGCACACGGTCGCACACTGCGCATGTCCTAATCAACGTCACT
GATGCCAACACCCACAGGCCTGTCTTTCAGAGCTCCCATTACACAGTGAGTGTCAGTGAGGACAGGCCTGTGGGCACCTCCATTGCTACC
CTCAGTGCCAACGATGAGGACACAGGAGAGAATGCCCGCATCACCTACGTGATTCAGGACCCCGTGCCGCAGTTCCGCATTGACCCCGAC
AGTGGCACCATGTACACCATGATGGAGCTGGACTATGAGAACCAGGTCGCCTACACGCTGACCATCATGGCCCAGGACAACGGCATCCCG
CAGAAATCAGACACCACCACCCTAGAGATCCTCATCCTCGATGCCAATGACAATGCACCCCAGTTCCTGTGGGATTTCTACCAGGGTTCC
ATCTTTGAGGATGCTCCACCCTCGACCAGCATCCTCCAGGTCTCTGCCACGGACCGGGACTCAGGTCCCAATGGGCGTCTGCTGTACACC
TTCCAGGGTGGGGACGACGGCGATGGGGACTTCTACATCGAGCCCACGTCCGGTGTGATTCGCACCCAGCGCCGGCTGGACCGGGAGAAT
GTGGCCGTGTACAACCTTTGGGCTCTGGCTGTGGATCGGGGCAGTCCCACTCCCCTTAGCGCCTCGGTAGAAATCCAGGTGACCATCTTG
GACATTAATGACAATGCCCCCATGTTTGAGAAGGACGAACTGGAGCTGTTTGTTGAGGAGAACAACCCAGTGGGGTCGGTGGTGGCAAAG
ATTCGTGCTAACGACCCTGATGAAGGCCCTAATGCCCAGATCATGTATCAGATTGTGGAAGGGGACATGCGGCATTTCTTCCAGCTGGAC
CTGCTCAACGGGGACCTGCGTGCCATGGTGGAGCTGGACTTTGAGGTCCGGCGGGAGTATGTGCTGGTGGTGCAGGCCACGTCGGCTCCG
CTGGTGAGCCGAGCCACGGTGCACATCCTTCTCGTGGACCAGAATGACAACCCGCCTGTGCTGCCCGACTTCCAGATCCTCTTCAACAAC
TATGTCACCAACAAGTCCAACAGTTTCCCCACCGGCGTGATCGGCTGCATCCCGGCCCATGACCCCGACGTGTCAGACAGCCTCAACTAC
ACCTTCGTGCAGGGCAACGAGCTGCGCCTGTTGCTGCTGGACCCCGCCACGGGCGAACTGCAGCTCAGCCGCGACCTGGACAACAACCGG
CCGCTGGAGGCGCTCATGGAGGTGTCTGTGTCTGATGGCATCCACAGCGTCACGGCCTTCTGCACCCTGCGTGTCACCATCATCACGGAC
GACATGCTGACCAACAGCATCACTGTCCGCCTGGAGAACATGTCCCAGGAGAAGTTCCTGTCCCCGCTGCTGGCCCTCTTCGTGGAGGGG
GTGGCCGCCGTGCTGTCCACCACCAAGGACGACGTCTTCGTCTTCAACGTCCAGAACGACACCGACGTCAGCTCCAACATCCTGAACGTG
ACCTTCTCGGCGCTGCTGCCTGGCGGCGTCCGCGGCCAGTTCTTCCCGTCGGAGGACCTGCAGGAGCAGATCTACCTGAATCGGACGCTG
CTGACCACCATCTCCACGCAGCGCGTGCTGCCCTTCGACGACAACATCTGCCTGCGCGAGCCCTGCGAGAACTACATGAAGTGCGTGTCC
GTTCTGCGATTCGACAGCTCCGCGCCCTTCCTCAGCTCCACCACCGTGCTCTTCCGGCCCATCCACCCCATCAACGGCCTGCGCTGCCGC
TGCCCGCCCGGCTTCACCGGCGACTACTGCGAGACGGAGATCGACCTCTGCTACTCCGACCCGTGCGGCGCCAACGGCCGCTGCCGCAGC
CGCGAGGGCGGCTACACCTGCGAGTGCTTCGAGGACTTCACTGATACAAACTGGACTCTCAGGACAAAACGACACCAGCCAAACCAGCAG
CCCCTCAGCATCCAGCAACATAAGCGGAGGCATTTTCCTTTTCTTCGTGGCCAATGCCATAATCCACCTCTTCTGCTTCAGTTGAGGTGA
CACGTCTCAGCCTTAGCCCTGTGCCCCCTGAAACAGCTGCCACCATCACTCGCAAGAGAATCCCCTCCATCTTTGGGAGGGGTTGATGCC
AGACATCACCAGGTTGTAGAAGTTGACAGGCAGTGCCATGGGGGCAACAGCCAAAATAGGGGGGTAATGATGTAGGGGCCAAGCAGTGCC

>In-frame_ENST00000262738_ENST00000374213_TCGA-62-8394-01A_CELSR1_chr22_46859604_-_CD52_chr1_26646662_length(amino acids)=1439AA_start in transcript=0_stop in transcript=4319
MAPPPPPVLPVLLLLAAAAALPAMGLRAAAWEPRVPGGTRAFALRPGCTYAVGAACTPRAPRELLDVGRDGRLAGRRRVSGAGRPLPLQV
RLVARSAPTALSRRLRARTHLPGCGARARLCGTGARLCGALCFPVPGGCAAAQHSALAAPTTLPACRCPPRPRPRCPGRPICLPPGGSVR
LRLLCALRRAAGAVRVGLALEAATAGTPSASPSPSPPLPPNLPEARAGPARRARRGTSGRGSLKFPMPNYQVALFENEPAGTLILQLHAH
YTIEGEEERVSYYMEGLFDERSRGYFRIDSATGAVSTDSVLDRETKETHVLRVKAVDYSTPPRSATTYITVLVKDTNDHSPVFEQSEYRE
RVRENLEVGYEVLTIRASDRDSPINANLRYRVLGGAWDVFQLNESSGVVSTRAVLDREEAAEYQLLVEANDQGRNPGPLSATATVYIEVE
DENDNYPQFSEQNYVVQVPEDVGLNTAVLRVQATDRDQGQNAAIHYSILSGNVAGQFYLHSLSGILDVINPLDFEDVQKYSLSIKAQDGG
RPPLINSSGVVSVQVLDVNDNEPIFVSSPFQATVLENVPLGYPVVHIQAVDADSGENARLHYRLVDTASTFLGGGSAGPKNPAPTPDFPF
QIHNSSGWITVCAELDREEVEHYSFGVEAVDHGSPPMSSSTSVSITVLDVNDNDPVFTQPTYELRLNEDAAVGSSVLTLQARDRDANSVI
TYQLTGGNTRNRFALSSQRGGGLITLALPLDYKQEQQYVLAVTASDGTRSHTAHVLINVTDANTHRPVFQSSHYTVSVSEDRPVGTSIAT
LSANDEDTGENARITYVIQDPVPQFRIDPDSGTMYTMMELDYENQVAYTLTIMAQDNGIPQKSDTTTLEILILDANDNAPQFLWDFYQGS
IFEDAPPSTSILQVSATDRDSGPNGRLLYTFQGGDDGDGDFYIEPTSGVIRTQRRLDRENVAVYNLWALAVDRGSPTPLSASVEIQVTIL
DINDNAPMFEKDELELFVEENNPVGSVVAKIRANDPDEGPNAQIMYQIVEGDMRHFFQLDLLNGDLRAMVELDFEVRREYVLVVQATSAP
LVSRATVHILLVDQNDNPPVLPDFQILFNNYVTNKSNSFPTGVIGCIPAHDPDVSDSLNYTFVQGNELRLLLLDPATGELQLSRDLDNNR
PLEALMEVSVSDGIHSVTAFCTLRVTIITDDMLTNSITVRLENMSQEKFLSPLLALFVEGVAAVLSTTKDDVFVFNVQNDTDVSSNILNV
TFSALLPGGVRGQFFPSEDLQEQIYLNRTLLTTISTQRVLPFDDNICLREPCENYMKCVSVLRFDSSAPFLSSTTVLFRPIHPINGLRCR

--------------------------------------------------------------
>In-frame_ENST00000395964_ENST00000374213_TCGA-62-8394-01A_CELSR1_chr22_46859604_-_CD52_chr1_26646662_length(transcript)=4536nt_BP=4183nt
ATGGCGCCGCCGCCGCCGCCCGTGCTGCCCGTGCTGCTGCTCCTGGCCGCCGCCGCCGCCCTGCCGGCGATGGGGCTGCGAGCGGCCGCC
TGGGAGCCGCGCGTACCCGGCGGGACCCGCGCCTTCGCCCTCCGGCCCGGCTGTACCTACGCGGTGGGCGCCGCTTGCACGCCCCGGGCG
CCGCGGGAGCTGCTGGACGTGGGCCGCGATGGGCGGCTGGCAGGACGTCGGCGCGTCTCGGGCGCGGGGCGCCCGCTGCCGCTGCAAGTC
CGCTTGGTGGCCCGCAGTGCCCCGACGGCGCTGAGCCGCCGCCTGCGGGCGCGCACGCACCTTCCCGGCTGCGGAGCCCGTGCCCGGCTC
TGCGGAACCGGTGCCCGGCTCTGCGGGGCGCTCTGCTTCCCCGTCCCCGGCGGCTGCGCGGCCGCGCAGCATTCGGCGCTCGCAGCTCCG
ACCACCTTACCCGCCTGCCGCTGCCCGCCGCGCCCCAGGCCCCGCTGTCCCGGCCGTCCCATCTGCCTGCCGCCGGGCGGCTCGGTCCGC
CTGCGTCTGCTGTGCGCCCTGCGGCGCGCGGCTGGCGCCGTCCGGGTGGGACTGGCGCTGGAGGCCGCCACCGCGGGGACGCCCTCCGCG
TCGCCATCCCCATCGCCGCCCCTGCCGCCGAACTTGCCCGAAGCCCGGGCGGGGCCGGCGCGACGGGCCCGGCGGGGCACGAGCGGCAGA
GGGAGCCTGAAGTTTCCGATGCCCAACTACCAGGTGGCGTTGTTTGAGAACGAACCGGCGGGCACCCTCATCCTCCAGCTGCACGCGCAC
TACACCATCGAGGGCGAGGAGGAGCGCGTGAGCTATTACATGGAGGGGCTGTTCGACGAGCGCTCCCGGGGCTACTTCCGAATCGACTCT
GCCACGGGCGCCGTGAGCACGGACAGCGTACTGGACCGCGAGACCAAGGAGACGCACGTCCTCAGGGTGAAAGCCGTGGACTACAGTACG
CCGCCGCGCTCGGCCACCACCTACATCACTGTCTTGGTCAAAGACACCAACGACCACAGCCCGGTCTTCGAGCAGTCGGAGTACCGCGAG
CGCGTGCGGGAGAACCTGGAGGTGGGCTACGAGGTGCTGACCATCCGCGCCAGCGACCGCGACTCGCCCATCAACGCCAACTTGCGTTAC
CGCGTGTTGGGGGGCGCGTGGGACGTCTTCCAGCTCAACGAGAGCTCTGGCGTGGTGAGCACACGGGCGGTGCTGGACCGGGAGGAGGCG
GCCGAGTACCAGCTCCTGGTGGAGGCCAACGACCAGGGGCGCAATCCGGGCCCGCTCAGTGCCACGGCCACCGTGTACATCGAGGTGGAG
GACGAGAACGACAACTACCCCCAGTTCAGCGAGCAGAACTACGTGGTCCAGGTGCCCGAGGACGTGGGGCTCAACACGGCTGTGCTGCGA
GTGCAGGCCACGGACCGGGACCAGGGCCAGAACGCGGCCATTCACTACAGCATCCTCAGCGGGAACGTGGCCGGCCAGTTCTACCTGCAC
TCGCTGAGCGGGATCCTGGATGTGATCAACCCCTTGGATTTCGAGGATGTCCAGAAATACTCGCTGAGCATTAAGGCCCAGGATGGGGGC
CGGCCCCCGCTCATCAATTCTTCAGGGGTGGTGTCTGTGCAGGTGCTGGATGTCAACGACAACGAGCCTATCTTTGTGAGCAGCCCCTTC
CAGGCCACGGTGCTGGAGAATGTGCCCCTGGGCTACCCCGTGGTGCACATTCAGGCGGTGGACGCGGACTCTGGAGAGAACGCCCGGCTG
CACTATCGCCTGGTGGACACGGCCTCCACCTTTCTGGGGGGCGGCAGCGCTGGGCCTAAGAATCCTGCCCCCACCCCTGACTTCCCCTTC
CAGATCCACAACAGCTCCGGTTGGATCACAGTGTGTGCCGAGCTGGACCGCGAGGAGGTGGAGCACTACAGCTTCGGGGTGGAGGCGGTG
GACCACGGCTCGCCCCCCATGAGCTCCTCCACCAGCGTGTCCATCACGGTGCTGGACGTGAATGACAACGACCCGGTGTTCACGCAGCCC
ACCTACGAGCTTCGTCTGAATGAGGATGCGGCCGTGGGGAGCAGCGTGCTGACCCTGCAGGCCCGCGACCGTGACGCCAACAGTGTGATT
ACCTACCAGCTCACAGGCGGCAACACCCGGAACCGCTTTGCACTCAGCAGCCAGAGAGGGGGCGGCCTCATCACCCTGGCGCTACCTCTG
GACTACAAGCAGGAGCAGCAGTACGTGCTGGCGGTGACAGCATCCGACGGCACACGGTCGCACACTGCGCATGTCCTAATCAACGTCACT
GATGCCAACACCCACAGGCCTGTCTTTCAGAGCTCCCATTACACAGTGAGTGTCAGTGAGGACAGGCCTGTGGGCACCTCCATTGCTACC
CTCAGTGCCAACGATGAGGACACAGGAGAGAATGCCCGCATCACCTACGTGATTCAGGACCCCGTGCCGCAGTTCCGCATTGACCCCGAC
AGTGGCACCATGTACACCATGATGGAGCTGGACTATGAGAACCAGGTCGCCTACACGCTGACCATCATGGCCCAGGACAACGGCATCCCG
CAGAAATCAGACACCACCACCCTAGAGATCCTCATCCTCGATGCCAATGACAATGCACCCCAGTTCCTGTGGGATTTCTACCAGGGTTCC
ATCTTTGAGGATGCTCCACCCTCGACCAGCATCCTCCAGGTCTCTGCCACGGACCGGGACTCAGGTCCCAATGGGCGTCTGCTGTACACC
TTCCAGGGTGGGGACGACGGCGATGGGGACTTCTACATCGAGCCCACGTCCGGTGTGATTCGCACCCAGCGCCGGCTGGACCGGGAGAAT
GTGGCCGTGTACAACCTTTGGGCTCTGGCTGTGGATCGGGGCAGTCCCACTCCCCTTAGCGCCTCGGTAGAAATCCAGGTGACCATCTTG
GACATTAATGACAATGCCCCCATGTTTGAGAAGGACGAACTGGAGCTGTTTGTTGAGGAGAACAACCCAGTGGGGTCGGTGGTGGCAAAG
ATTCGTGCTAACGACCCTGATGAAGGCCCTAATGCCCAGATCATGTATCAGATTGTGGAAGGGGACATGCGGCATTTCTTCCAGCTGGAC
CTGCTCAACGGGGACCTGCGTGCCATGGTGGAGCTGGACTTTGAGGTCCGGCGGGAGTATGTGCTGGTGGTGCAGGCCACGTCGGCTCCG
CTGGTGAGCCGAGCCACGGTGCACATCCTTCTCGTGGACCAGAATGACAACCCGCCTGTGCTGCCCGACTTCCAGATCCTCTTCAACAAC
TATGTCACCAACAAGTCCAACAGTTTCCCCACCGGCGTGATCGGCTGCATCCCGGCCCATGACCCCGACGTGTCAGACAGCCTCAACTAC
ACCTTCGTGCAGGGCAACGAGCTGCGCCTGTTGCTGCTGGACCCCGCCACGGGCGAACTGCAGCTCAGCCGCGACCTGGACAACAACCGG
CCGCTGGAGGCGCTCATGGAGGTGTCTGTGTCTGATGGCATCCACAGCGTCACGGCCTTCTGCACCCTGCGTGTCACCATCATCACGGAC
GACATGCTGACCAACAGCATCACTGTCCGCCTGGAGAACATGTCCCAGGAGAAGTTCCTGTCCCCGCTGCTGGCCCTCTTCGTGGAGGGG
GTGGCCGCCGTGCTGTCCACCACCAAGGACGACGTCTTCGTCTTCAACGTCCAGAACGACACCGACGTCAGCTCCAACATCCTGAACGTG
ACCTTCTCGGCGCTGCTGCCTGGCGGCGTCCGCGGCCAGTTCTTCCCGTCGGAGGACCTGCAGGAGCAGATCTACCTGAATCGGACGCTG
CTGACCACCATCTCCACGCAGCGCGTGCTGCCCTTCGACGACAACATCTGCCTGCGCGAGCCCTGCGAGAACTACATGAAGTGCGTGTCC
GTTCTGCGATTCGACAGCTCCGCGCCCTTCCTCAGCTCCACCACCGTGCTCTTCCGGCCCATCCACCCCATCAACGGCCTGCGCTGCCGC
TGCCCGCCCGGCTTCACCGGCGACTACTGCGAGACGGAGATCGACCTCTGCTACTCCGACCCGTGCGGCGCCAACGGCCGCTGCCGCAGC
CGCGAGGGCGGCTACACCTGCGAGTGCTTCGAGGACTTCACTGATACAAACTGGACTCTCAGGACAAAACGACACCAGCCAAACCAGCAG
CCCCTCAGCATCCAGCAACATAAGCGGAGGCATTTTCCTTTTCTTCGTGGCCAATGCCATAATCCACCTCTTCTGCTTCAGTTGAGGTGA
CACGTCTCAGCCTTAGCCCTGTGCCCCCTGAAACAGCTGCCACCATCACTCGCAAGAGAATCCCCTCCATCTTTGGGAGGGGTTGATGCC
AGACATCACCAGGTTGTAGAAGTTGACAGGCAGTGCCATGGGGGCAACAGCCAAAATAGGGGGGTAATGATGTAGGGGCCAAGCAGTGCC

>In-frame_ENST00000395964_ENST00000374213_TCGA-62-8394-01A_CELSR1_chr22_46859604_-_CD52_chr1_26646662_length(amino acids)=1439AA_start in transcript=0_stop in transcript=4319
MAPPPPPVLPVLLLLAAAAALPAMGLRAAAWEPRVPGGTRAFALRPGCTYAVGAACTPRAPRELLDVGRDGRLAGRRRVSGAGRPLPLQV
RLVARSAPTALSRRLRARTHLPGCGARARLCGTGARLCGALCFPVPGGCAAAQHSALAAPTTLPACRCPPRPRPRCPGRPICLPPGGSVR
LRLLCALRRAAGAVRVGLALEAATAGTPSASPSPSPPLPPNLPEARAGPARRARRGTSGRGSLKFPMPNYQVALFENEPAGTLILQLHAH
YTIEGEEERVSYYMEGLFDERSRGYFRIDSATGAVSTDSVLDRETKETHVLRVKAVDYSTPPRSATTYITVLVKDTNDHSPVFEQSEYRE
RVRENLEVGYEVLTIRASDRDSPINANLRYRVLGGAWDVFQLNESSGVVSTRAVLDREEAAEYQLLVEANDQGRNPGPLSATATVYIEVE
DENDNYPQFSEQNYVVQVPEDVGLNTAVLRVQATDRDQGQNAAIHYSILSGNVAGQFYLHSLSGILDVINPLDFEDVQKYSLSIKAQDGG
RPPLINSSGVVSVQVLDVNDNEPIFVSSPFQATVLENVPLGYPVVHIQAVDADSGENARLHYRLVDTASTFLGGGSAGPKNPAPTPDFPF
QIHNSSGWITVCAELDREEVEHYSFGVEAVDHGSPPMSSSTSVSITVLDVNDNDPVFTQPTYELRLNEDAAVGSSVLTLQARDRDANSVI
TYQLTGGNTRNRFALSSQRGGGLITLALPLDYKQEQQYVLAVTASDGTRSHTAHVLINVTDANTHRPVFQSSHYTVSVSEDRPVGTSIAT
LSANDEDTGENARITYVIQDPVPQFRIDPDSGTMYTMMELDYENQVAYTLTIMAQDNGIPQKSDTTTLEILILDANDNAPQFLWDFYQGS
IFEDAPPSTSILQVSATDRDSGPNGRLLYTFQGGDDGDGDFYIEPTSGVIRTQRRLDRENVAVYNLWALAVDRGSPTPLSASVEIQVTIL
DINDNAPMFEKDELELFVEENNPVGSVVAKIRANDPDEGPNAQIMYQIVEGDMRHFFQLDLLNGDLRAMVELDFEVRREYVLVVQATSAP
LVSRATVHILLVDQNDNPPVLPDFQILFNNYVTNKSNSFPTGVIGCIPAHDPDVSDSLNYTFVQGNELRLLLLDPATGELQLSRDLDNNR
PLEALMEVSVSDGIHSVTAFCTLRVTIITDDMLTNSITVRLENMSQEKFLSPLLALFVEGVAAVLSTTKDDVFVFNVQNDTDVSSNILNV
TFSALLPGGVRGQFFPSEDLQEQIYLNRTLLTTISTQRVLPFDDNICLREPCENYMKCVSVLRFDSSAPFLSSTTVLFRPIHPINGLRCR

--------------------------------------------------------------
>In-frame_ENST00000262738_ENST00000374213_TCGA-62-8394_CELSR1_chr22_46859603_-_CD52_chr1_26646661_length(transcript)=4536nt_BP=4183nt
ATGGCGCCGCCGCCGCCGCCCGTGCTGCCCGTGCTGCTGCTCCTGGCCGCCGCCGCCGCCCTGCCGGCGATGGGGCTGCGAGCGGCCGCC
TGGGAGCCGCGCGTACCCGGCGGGACCCGCGCCTTCGCCCTCCGGCCCGGCTGTACCTACGCGGTGGGCGCCGCTTGCACGCCCCGGGCG
CCGCGGGAGCTGCTGGACGTGGGCCGCGATGGGCGGCTGGCAGGACGTCGGCGCGTCTCGGGCGCGGGGCGCCCGCTGCCGCTGCAAGTC
CGCTTGGTGGCCCGCAGTGCCCCGACGGCGCTGAGCCGCCGCCTGCGGGCGCGCACGCACCTTCCCGGCTGCGGAGCCCGTGCCCGGCTC
TGCGGAACCGGTGCCCGGCTCTGCGGGGCGCTCTGCTTCCCCGTCCCCGGCGGCTGCGCGGCCGCGCAGCATTCGGCGCTCGCAGCTCCG
ACCACCTTACCCGCCTGCCGCTGCCCGCCGCGCCCCAGGCCCCGCTGTCCCGGCCGTCCCATCTGCCTGCCGCCGGGCGGCTCGGTCCGC
CTGCGTCTGCTGTGCGCCCTGCGGCGCGCGGCTGGCGCCGTCCGGGTGGGACTGGCGCTGGAGGCCGCCACCGCGGGGACGCCCTCCGCG
TCGCCATCCCCATCGCCGCCCCTGCCGCCGAACTTGCCCGAAGCCCGGGCGGGGCCGGCGCGACGGGCCCGGCGGGGCACGAGCGGCAGA
GGGAGCCTGAAGTTTCCGATGCCCAACTACCAGGTGGCGTTGTTTGAGAACGAACCGGCGGGCACCCTCATCCTCCAGCTGCACGCGCAC
TACACCATCGAGGGCGAGGAGGAGCGCGTGAGCTATTACATGGAGGGGCTGTTCGACGAGCGCTCCCGGGGCTACTTCCGAATCGACTCT
GCCACGGGCGCCGTGAGCACGGACAGCGTACTGGACCGCGAGACCAAGGAGACGCACGTCCTCAGGGTGAAAGCCGTGGACTACAGTACG
CCGCCGCGCTCGGCCACCACCTACATCACTGTCTTGGTCAAAGACACCAACGACCACAGCCCGGTCTTCGAGCAGTCGGAGTACCGCGAG
CGCGTGCGGGAGAACCTGGAGGTGGGCTACGAGGTGCTGACCATCCGCGCCAGCGACCGCGACTCGCCCATCAACGCCAACTTGCGTTAC
CGCGTGTTGGGGGGCGCGTGGGACGTCTTCCAGCTCAACGAGAGCTCTGGCGTGGTGAGCACACGGGCGGTGCTGGACCGGGAGGAGGCG
GCCGAGTACCAGCTCCTGGTGGAGGCCAACGACCAGGGGCGCAATCCGGGCCCGCTCAGTGCCACGGCCACCGTGTACATCGAGGTGGAG
GACGAGAACGACAACTACCCCCAGTTCAGCGAGCAGAACTACGTGGTCCAGGTGCCCGAGGACGTGGGGCTCAACACGGCTGTGCTGCGA
GTGCAGGCCACGGACCGGGACCAGGGCCAGAACGCGGCCATTCACTACAGCATCCTCAGCGGGAACGTGGCCGGCCAGTTCTACCTGCAC
TCGCTGAGCGGGATCCTGGATGTGATCAACCCCTTGGATTTCGAGGATGTCCAGAAATACTCGCTGAGCATTAAGGCCCAGGATGGGGGC
CGGCCCCCGCTCATCAATTCTTCAGGGGTGGTGTCTGTGCAGGTGCTGGATGTCAACGACAACGAGCCTATCTTTGTGAGCAGCCCCTTC
CAGGCCACGGTGCTGGAGAATGTGCCCCTGGGCTACCCCGTGGTGCACATTCAGGCGGTGGACGCGGACTCTGGAGAGAACGCCCGGCTG
CACTATCGCCTGGTGGACACGGCCTCCACCTTTCTGGGGGGCGGCAGCGCTGGGCCTAAGAATCCTGCCCCCACCCCTGACTTCCCCTTC
CAGATCCACAACAGCTCCGGTTGGATCACAGTGTGTGCCGAGCTGGACCGCGAGGAGGTGGAGCACTACAGCTTCGGGGTGGAGGCGGTG
GACCACGGCTCGCCCCCCATGAGCTCCTCCACCAGCGTGTCCATCACGGTGCTGGACGTGAATGACAACGACCCGGTGTTCACGCAGCCC
ACCTACGAGCTTCGTCTGAATGAGGATGCGGCCGTGGGGAGCAGCGTGCTGACCCTGCAGGCCCGCGACCGTGACGCCAACAGTGTGATT
ACCTACCAGCTCACAGGCGGCAACACCCGGAACCGCTTTGCACTCAGCAGCCAGAGAGGGGGCGGCCTCATCACCCTGGCGCTACCTCTG
GACTACAAGCAGGAGCAGCAGTACGTGCTGGCGGTGACAGCATCCGACGGCACACGGTCGCACACTGCGCATGTCCTAATCAACGTCACT
GATGCCAACACCCACAGGCCTGTCTTTCAGAGCTCCCATTACACAGTGAGTGTCAGTGAGGACAGGCCTGTGGGCACCTCCATTGCTACC
CTCAGTGCCAACGATGAGGACACAGGAGAGAATGCCCGCATCACCTACGTGATTCAGGACCCCGTGCCGCAGTTCCGCATTGACCCCGAC
AGTGGCACCATGTACACCATGATGGAGCTGGACTATGAGAACCAGGTCGCCTACACGCTGACCATCATGGCCCAGGACAACGGCATCCCG
CAGAAATCAGACACCACCACCCTAGAGATCCTCATCCTCGATGCCAATGACAATGCACCCCAGTTCCTGTGGGATTTCTACCAGGGTTCC
ATCTTTGAGGATGCTCCACCCTCGACCAGCATCCTCCAGGTCTCTGCCACGGACCGGGACTCAGGTCCCAATGGGCGTCTGCTGTACACC
TTCCAGGGTGGGGACGACGGCGATGGGGACTTCTACATCGAGCCCACGTCCGGTGTGATTCGCACCCAGCGCCGGCTGGACCGGGAGAAT
GTGGCCGTGTACAACCTTTGGGCTCTGGCTGTGGATCGGGGCAGTCCCACTCCCCTTAGCGCCTCGGTAGAAATCCAGGTGACCATCTTG
GACATTAATGACAATGCCCCCATGTTTGAGAAGGACGAACTGGAGCTGTTTGTTGAGGAGAACAACCCAGTGGGGTCGGTGGTGGCAAAG
ATTCGTGCTAACGACCCTGATGAAGGCCCTAATGCCCAGATCATGTATCAGATTGTGGAAGGGGACATGCGGCATTTCTTCCAGCTGGAC
CTGCTCAACGGGGACCTGCGTGCCATGGTGGAGCTGGACTTTGAGGTCCGGCGGGAGTATGTGCTGGTGGTGCAGGCCACGTCGGCTCCG
CTGGTGAGCCGAGCCACGGTGCACATCCTTCTCGTGGACCAGAATGACAACCCGCCTGTGCTGCCCGACTTCCAGATCCTCTTCAACAAC
TATGTCACCAACAAGTCCAACAGTTTCCCCACCGGCGTGATCGGCTGCATCCCGGCCCATGACCCCGACGTGTCAGACAGCCTCAACTAC
ACCTTCGTGCAGGGCAACGAGCTGCGCCTGTTGCTGCTGGACCCCGCCACGGGCGAACTGCAGCTCAGCCGCGACCTGGACAACAACCGG
CCGCTGGAGGCGCTCATGGAGGTGTCTGTGTCTGATGGCATCCACAGCGTCACGGCCTTCTGCACCCTGCGTGTCACCATCATCACGGAC
GACATGCTGACCAACAGCATCACTGTCCGCCTGGAGAACATGTCCCAGGAGAAGTTCCTGTCCCCGCTGCTGGCCCTCTTCGTGGAGGGG
GTGGCCGCCGTGCTGTCCACCACCAAGGACGACGTCTTCGTCTTCAACGTCCAGAACGACACCGACGTCAGCTCCAACATCCTGAACGTG
ACCTTCTCGGCGCTGCTGCCTGGCGGCGTCCGCGGCCAGTTCTTCCCGTCGGAGGACCTGCAGGAGCAGATCTACCTGAATCGGACGCTG
CTGACCACCATCTCCACGCAGCGCGTGCTGCCCTTCGACGACAACATCTGCCTGCGCGAGCCCTGCGAGAACTACATGAAGTGCGTGTCC
GTTCTGCGATTCGACAGCTCCGCGCCCTTCCTCAGCTCCACCACCGTGCTCTTCCGGCCCATCCACCCCATCAACGGCCTGCGCTGCCGC
TGCCCGCCCGGCTTCACCGGCGACTACTGCGAGACGGAGATCGACCTCTGCTACTCCGACCCGTGCGGCGCCAACGGCCGCTGCCGCAGC
CGCGAGGGCGGCTACACCTGCGAGTGCTTCGAGGACTTCACTGATACAAACTGGACTCTCAGGACAAAACGACACCAGCCAAACCAGCAG
CCCCTCAGCATCCAGCAACATAAGCGGAGGCATTTTCCTTTTCTTCGTGGCCAATGCCATAATCCACCTCTTCTGCTTCAGTTGAGGTGA
CACGTCTCAGCCTTAGCCCTGTGCCCCCTGAAACAGCTGCCACCATCACTCGCAAGAGAATCCCCTCCATCTTTGGGAGGGGTTGATGCC
AGACATCACCAGGTTGTAGAAGTTGACAGGCAGTGCCATGGGGGCAACAGCCAAAATAGGGGGGTAATGATGTAGGGGCCAAGCAGTGCC

>In-frame_ENST00000262738_ENST00000374213_TCGA-62-8394_CELSR1_chr22_46859603_-_CD52_chr1_26646661_length(amino acids)=1439AA_start in transcript=0_stop in transcript=4319
MAPPPPPVLPVLLLLAAAAALPAMGLRAAAWEPRVPGGTRAFALRPGCTYAVGAACTPRAPRELLDVGRDGRLAGRRRVSGAGRPLPLQV
RLVARSAPTALSRRLRARTHLPGCGARARLCGTGARLCGALCFPVPGGCAAAQHSALAAPTTLPACRCPPRPRPRCPGRPICLPPGGSVR
LRLLCALRRAAGAVRVGLALEAATAGTPSASPSPSPPLPPNLPEARAGPARRARRGTSGRGSLKFPMPNYQVALFENEPAGTLILQLHAH
YTIEGEEERVSYYMEGLFDERSRGYFRIDSATGAVSTDSVLDRETKETHVLRVKAVDYSTPPRSATTYITVLVKDTNDHSPVFEQSEYRE
RVRENLEVGYEVLTIRASDRDSPINANLRYRVLGGAWDVFQLNESSGVVSTRAVLDREEAAEYQLLVEANDQGRNPGPLSATATVYIEVE
DENDNYPQFSEQNYVVQVPEDVGLNTAVLRVQATDRDQGQNAAIHYSILSGNVAGQFYLHSLSGILDVINPLDFEDVQKYSLSIKAQDGG
RPPLINSSGVVSVQVLDVNDNEPIFVSSPFQATVLENVPLGYPVVHIQAVDADSGENARLHYRLVDTASTFLGGGSAGPKNPAPTPDFPF
QIHNSSGWITVCAELDREEVEHYSFGVEAVDHGSPPMSSSTSVSITVLDVNDNDPVFTQPTYELRLNEDAAVGSSVLTLQARDRDANSVI
TYQLTGGNTRNRFALSSQRGGGLITLALPLDYKQEQQYVLAVTASDGTRSHTAHVLINVTDANTHRPVFQSSHYTVSVSEDRPVGTSIAT
LSANDEDTGENARITYVIQDPVPQFRIDPDSGTMYTMMELDYENQVAYTLTIMAQDNGIPQKSDTTTLEILILDANDNAPQFLWDFYQGS
IFEDAPPSTSILQVSATDRDSGPNGRLLYTFQGGDDGDGDFYIEPTSGVIRTQRRLDRENVAVYNLWALAVDRGSPTPLSASVEIQVTIL
DINDNAPMFEKDELELFVEENNPVGSVVAKIRANDPDEGPNAQIMYQIVEGDMRHFFQLDLLNGDLRAMVELDFEVRREYVLVVQATSAP
LVSRATVHILLVDQNDNPPVLPDFQILFNNYVTNKSNSFPTGVIGCIPAHDPDVSDSLNYTFVQGNELRLLLLDPATGELQLSRDLDNNR
PLEALMEVSVSDGIHSVTAFCTLRVTIITDDMLTNSITVRLENMSQEKFLSPLLALFVEGVAAVLSTTKDDVFVFNVQNDTDVSSNILNV
TFSALLPGGVRGQFFPSEDLQEQIYLNRTLLTTISTQRVLPFDDNICLREPCENYMKCVSVLRFDSSAPFLSSTTVLFRPIHPINGLRCR

--------------------------------------------------------------
>In-frame_ENST00000395964_ENST00000374213_TCGA-62-8394_CELSR1_chr22_46859603_-_CD52_chr1_26646661_length(transcript)=4536nt_BP=4183nt
ATGGCGCCGCCGCCGCCGCCCGTGCTGCCCGTGCTGCTGCTCCTGGCCGCCGCCGCCGCCCTGCCGGCGATGGGGCTGCGAGCGGCCGCC
TGGGAGCCGCGCGTACCCGGCGGGACCCGCGCCTTCGCCCTCCGGCCCGGCTGTACCTACGCGGTGGGCGCCGCTTGCACGCCCCGGGCG
CCGCGGGAGCTGCTGGACGTGGGCCGCGATGGGCGGCTGGCAGGACGTCGGCGCGTCTCGGGCGCGGGGCGCCCGCTGCCGCTGCAAGTC
CGCTTGGTGGCCCGCAGTGCCCCGACGGCGCTGAGCCGCCGCCTGCGGGCGCGCACGCACCTTCCCGGCTGCGGAGCCCGTGCCCGGCTC
TGCGGAACCGGTGCCCGGCTCTGCGGGGCGCTCTGCTTCCCCGTCCCCGGCGGCTGCGCGGCCGCGCAGCATTCGGCGCTCGCAGCTCCG
ACCACCTTACCCGCCTGCCGCTGCCCGCCGCGCCCCAGGCCCCGCTGTCCCGGCCGTCCCATCTGCCTGCCGCCGGGCGGCTCGGTCCGC
CTGCGTCTGCTGTGCGCCCTGCGGCGCGCGGCTGGCGCCGTCCGGGTGGGACTGGCGCTGGAGGCCGCCACCGCGGGGACGCCCTCCGCG
TCGCCATCCCCATCGCCGCCCCTGCCGCCGAACTTGCCCGAAGCCCGGGCGGGGCCGGCGCGACGGGCCCGGCGGGGCACGAGCGGCAGA
GGGAGCCTGAAGTTTCCGATGCCCAACTACCAGGTGGCGTTGTTTGAGAACGAACCGGCGGGCACCCTCATCCTCCAGCTGCACGCGCAC
TACACCATCGAGGGCGAGGAGGAGCGCGTGAGCTATTACATGGAGGGGCTGTTCGACGAGCGCTCCCGGGGCTACTTCCGAATCGACTCT
GCCACGGGCGCCGTGAGCACGGACAGCGTACTGGACCGCGAGACCAAGGAGACGCACGTCCTCAGGGTGAAAGCCGTGGACTACAGTACG
CCGCCGCGCTCGGCCACCACCTACATCACTGTCTTGGTCAAAGACACCAACGACCACAGCCCGGTCTTCGAGCAGTCGGAGTACCGCGAG
CGCGTGCGGGAGAACCTGGAGGTGGGCTACGAGGTGCTGACCATCCGCGCCAGCGACCGCGACTCGCCCATCAACGCCAACTTGCGTTAC
CGCGTGTTGGGGGGCGCGTGGGACGTCTTCCAGCTCAACGAGAGCTCTGGCGTGGTGAGCACACGGGCGGTGCTGGACCGGGAGGAGGCG
GCCGAGTACCAGCTCCTGGTGGAGGCCAACGACCAGGGGCGCAATCCGGGCCCGCTCAGTGCCACGGCCACCGTGTACATCGAGGTGGAG
GACGAGAACGACAACTACCCCCAGTTCAGCGAGCAGAACTACGTGGTCCAGGTGCCCGAGGACGTGGGGCTCAACACGGCTGTGCTGCGA
GTGCAGGCCACGGACCGGGACCAGGGCCAGAACGCGGCCATTCACTACAGCATCCTCAGCGGGAACGTGGCCGGCCAGTTCTACCTGCAC
TCGCTGAGCGGGATCCTGGATGTGATCAACCCCTTGGATTTCGAGGATGTCCAGAAATACTCGCTGAGCATTAAGGCCCAGGATGGGGGC
CGGCCCCCGCTCATCAATTCTTCAGGGGTGGTGTCTGTGCAGGTGCTGGATGTCAACGACAACGAGCCTATCTTTGTGAGCAGCCCCTTC
CAGGCCACGGTGCTGGAGAATGTGCCCCTGGGCTACCCCGTGGTGCACATTCAGGCGGTGGACGCGGACTCTGGAGAGAACGCCCGGCTG
CACTATCGCCTGGTGGACACGGCCTCCACCTTTCTGGGGGGCGGCAGCGCTGGGCCTAAGAATCCTGCCCCCACCCCTGACTTCCCCTTC
CAGATCCACAACAGCTCCGGTTGGATCACAGTGTGTGCCGAGCTGGACCGCGAGGAGGTGGAGCACTACAGCTTCGGGGTGGAGGCGGTG
GACCACGGCTCGCCCCCCATGAGCTCCTCCACCAGCGTGTCCATCACGGTGCTGGACGTGAATGACAACGACCCGGTGTTCACGCAGCCC
ACCTACGAGCTTCGTCTGAATGAGGATGCGGCCGTGGGGAGCAGCGTGCTGACCCTGCAGGCCCGCGACCGTGACGCCAACAGTGTGATT
ACCTACCAGCTCACAGGCGGCAACACCCGGAACCGCTTTGCACTCAGCAGCCAGAGAGGGGGCGGCCTCATCACCCTGGCGCTACCTCTG
GACTACAAGCAGGAGCAGCAGTACGTGCTGGCGGTGACAGCATCCGACGGCACACGGTCGCACACTGCGCATGTCCTAATCAACGTCACT
GATGCCAACACCCACAGGCCTGTCTTTCAGAGCTCCCATTACACAGTGAGTGTCAGTGAGGACAGGCCTGTGGGCACCTCCATTGCTACC
CTCAGTGCCAACGATGAGGACACAGGAGAGAATGCCCGCATCACCTACGTGATTCAGGACCCCGTGCCGCAGTTCCGCATTGACCCCGAC
AGTGGCACCATGTACACCATGATGGAGCTGGACTATGAGAACCAGGTCGCCTACACGCTGACCATCATGGCCCAGGACAACGGCATCCCG
CAGAAATCAGACACCACCACCCTAGAGATCCTCATCCTCGATGCCAATGACAATGCACCCCAGTTCCTGTGGGATTTCTACCAGGGTTCC
ATCTTTGAGGATGCTCCACCCTCGACCAGCATCCTCCAGGTCTCTGCCACGGACCGGGACTCAGGTCCCAATGGGCGTCTGCTGTACACC
TTCCAGGGTGGGGACGACGGCGATGGGGACTTCTACATCGAGCCCACGTCCGGTGTGATTCGCACCCAGCGCCGGCTGGACCGGGAGAAT
GTGGCCGTGTACAACCTTTGGGCTCTGGCTGTGGATCGGGGCAGTCCCACTCCCCTTAGCGCCTCGGTAGAAATCCAGGTGACCATCTTG
GACATTAATGACAATGCCCCCATGTTTGAGAAGGACGAACTGGAGCTGTTTGTTGAGGAGAACAACCCAGTGGGGTCGGTGGTGGCAAAG
ATTCGTGCTAACGACCCTGATGAAGGCCCTAATGCCCAGATCATGTATCAGATTGTGGAAGGGGACATGCGGCATTTCTTCCAGCTGGAC
CTGCTCAACGGGGACCTGCGTGCCATGGTGGAGCTGGACTTTGAGGTCCGGCGGGAGTATGTGCTGGTGGTGCAGGCCACGTCGGCTCCG
CTGGTGAGCCGAGCCACGGTGCACATCCTTCTCGTGGACCAGAATGACAACCCGCCTGTGCTGCCCGACTTCCAGATCCTCTTCAACAAC
TATGTCACCAACAAGTCCAACAGTTTCCCCACCGGCGTGATCGGCTGCATCCCGGCCCATGACCCCGACGTGTCAGACAGCCTCAACTAC
ACCTTCGTGCAGGGCAACGAGCTGCGCCTGTTGCTGCTGGACCCCGCCACGGGCGAACTGCAGCTCAGCCGCGACCTGGACAACAACCGG
CCGCTGGAGGCGCTCATGGAGGTGTCTGTGTCTGATGGCATCCACAGCGTCACGGCCTTCTGCACCCTGCGTGTCACCATCATCACGGAC
GACATGCTGACCAACAGCATCACTGTCCGCCTGGAGAACATGTCCCAGGAGAAGTTCCTGTCCCCGCTGCTGGCCCTCTTCGTGGAGGGG
GTGGCCGCCGTGCTGTCCACCACCAAGGACGACGTCTTCGTCTTCAACGTCCAGAACGACACCGACGTCAGCTCCAACATCCTGAACGTG
ACCTTCTCGGCGCTGCTGCCTGGCGGCGTCCGCGGCCAGTTCTTCCCGTCGGAGGACCTGCAGGAGCAGATCTACCTGAATCGGACGCTG
CTGACCACCATCTCCACGCAGCGCGTGCTGCCCTTCGACGACAACATCTGCCTGCGCGAGCCCTGCGAGAACTACATGAAGTGCGTGTCC
GTTCTGCGATTCGACAGCTCCGCGCCCTTCCTCAGCTCCACCACCGTGCTCTTCCGGCCCATCCACCCCATCAACGGCCTGCGCTGCCGC
TGCCCGCCCGGCTTCACCGGCGACTACTGCGAGACGGAGATCGACCTCTGCTACTCCGACCCGTGCGGCGCCAACGGCCGCTGCCGCAGC
CGCGAGGGCGGCTACACCTGCGAGTGCTTCGAGGACTTCACTGATACAAACTGGACTCTCAGGACAAAACGACACCAGCCAAACCAGCAG
CCCCTCAGCATCCAGCAACATAAGCGGAGGCATTTTCCTTTTCTTCGTGGCCAATGCCATAATCCACCTCTTCTGCTTCAGTTGAGGTGA
CACGTCTCAGCCTTAGCCCTGTGCCCCCTGAAACAGCTGCCACCATCACTCGCAAGAGAATCCCCTCCATCTTTGGGAGGGGTTGATGCC
AGACATCACCAGGTTGTAGAAGTTGACAGGCAGTGCCATGGGGGCAACAGCCAAAATAGGGGGGTAATGATGTAGGGGCCAAGCAGTGCC

>In-frame_ENST00000395964_ENST00000374213_TCGA-62-8394_CELSR1_chr22_46859603_-_CD52_chr1_26646661_length(amino acids)=1439AA_start in transcript=0_stop in transcript=4319
MAPPPPPVLPVLLLLAAAAALPAMGLRAAAWEPRVPGGTRAFALRPGCTYAVGAACTPRAPRELLDVGRDGRLAGRRRVSGAGRPLPLQV
RLVARSAPTALSRRLRARTHLPGCGARARLCGTGARLCGALCFPVPGGCAAAQHSALAAPTTLPACRCPPRPRPRCPGRPICLPPGGSVR
LRLLCALRRAAGAVRVGLALEAATAGTPSASPSPSPPLPPNLPEARAGPARRARRGTSGRGSLKFPMPNYQVALFENEPAGTLILQLHAH
YTIEGEEERVSYYMEGLFDERSRGYFRIDSATGAVSTDSVLDRETKETHVLRVKAVDYSTPPRSATTYITVLVKDTNDHSPVFEQSEYRE
RVRENLEVGYEVLTIRASDRDSPINANLRYRVLGGAWDVFQLNESSGVVSTRAVLDREEAAEYQLLVEANDQGRNPGPLSATATVYIEVE
DENDNYPQFSEQNYVVQVPEDVGLNTAVLRVQATDRDQGQNAAIHYSILSGNVAGQFYLHSLSGILDVINPLDFEDVQKYSLSIKAQDGG
RPPLINSSGVVSVQVLDVNDNEPIFVSSPFQATVLENVPLGYPVVHIQAVDADSGENARLHYRLVDTASTFLGGGSAGPKNPAPTPDFPF
QIHNSSGWITVCAELDREEVEHYSFGVEAVDHGSPPMSSSTSVSITVLDVNDNDPVFTQPTYELRLNEDAAVGSSVLTLQARDRDANSVI
TYQLTGGNTRNRFALSSQRGGGLITLALPLDYKQEQQYVLAVTASDGTRSHTAHVLINVTDANTHRPVFQSSHYTVSVSEDRPVGTSIAT
LSANDEDTGENARITYVIQDPVPQFRIDPDSGTMYTMMELDYENQVAYTLTIMAQDNGIPQKSDTTTLEILILDANDNAPQFLWDFYQGS
IFEDAPPSTSILQVSATDRDSGPNGRLLYTFQGGDDGDGDFYIEPTSGVIRTQRRLDRENVAVYNLWALAVDRGSPTPLSASVEIQVTIL
DINDNAPMFEKDELELFVEENNPVGSVVAKIRANDPDEGPNAQIMYQIVEGDMRHFFQLDLLNGDLRAMVELDFEVRREYVLVVQATSAP
LVSRATVHILLVDQNDNPPVLPDFQILFNNYVTNKSNSFPTGVIGCIPAHDPDVSDSLNYTFVQGNELRLLLLDPATGELQLSRDLDNNR
PLEALMEVSVSDGIHSVTAFCTLRVTIITDDMLTNSITVRLENMSQEKFLSPLLALFVEGVAAVLSTTKDDVFVFNVQNDTDVSSNILNV
TFSALLPGGVRGQFFPSEDLQEQIYLNRTLLTTISTQRVLPFDDNICLREPCENYMKCVSVLRFDSSAPFLSSTTVLFRPIHPINGLRCR

--------------------------------------------------------------

Top

Fusion Gene PPI Analysis for CELSR1-CD52

Go to ChiPPI (Chimeric Protein-Protein interactions) to see the chimeric PPI interaction in
ChiPPI page.

Protein-protein interactors with each fusion partner protein in wild-type (BIOGRID-3.4.160)

Hgene

Hgene's interactors

Tgene

Tgene's interactors

- Retained PPIs in in-frame fusion.

Partner

Gene

Hbp

Tbp

ENST

Strand

BPexon

TotalExon

Protein feature loci

*BPloci

TotalLen

Still interaction with

- Lost PPIs in in-frame fusion.

Partner

Gene

Hbp

Tbp

ENST

Strand

BPexon

TotalExon

Protein feature loci

*BPloci

TotalLen

Interaction lost with

- Retained PPIs, but lost function due to frame-shift fusion.

Partner

Gene

Hbp

Tbp

ENST

Strand

BPexon

TotalExon

Protein feature loci

*BPloci

TotalLen

Interaction lost with

Top

Related Drugs for CELSR1-CD52

Drugs targeting genes involved in this fusion gene.
(DrugBank Version 5.1.8 2021-05-08)

Partner

Gene

UniProtAcc

DrugBank ID

Drug name

Drug activity

Drug type

Drug status

Top

Related Diseases for CELSR1-CD52

Diseases associated with fusion partners.
(DisGeNet 4.0)

Partner	Gene	Disease ID	Disease name	# pubmeds	Source
Hgene	CELSR1	C1704423	Milroy Disease	1	GENOMICS_ENGLAND
Hgene	CELSR1	C3891448	NEURAL TUBE DEFECTS, SUSCEPTIBILITY TO	1	UNIPROT