Table 1.

Unique exon 1 sequences in cohort 1

Deduced leader peptideNucleotide sequence for nonamer peptideTotal (% of total cohort)
P1P2P3P4P5P6P7P8P9
VMAPRTVLL* GTC ATG GCG CCC CGA ACC GTC CTC CTG 683 153 (31.1) 
VTAPRTVLL — -C- — — — — — — — 670 904 (30.5) 
VTAPRTLLL — -C- — — — — C- — — 542 311 (24.7) 
VTAPRTVLL — -C- -A — — — — — — 242 366 (11.0) 
VTAPRTLLL — -C- -A — — — C- — — 57 747 (2.6) 
VTEPRTLLL — -C- -A- — — — C- — — 107 
VMAPRTVLL* —  — — A- — — — — 25 
VMAPRTVLL* —  -A — — — — — — 21 
VTAPRTVLL — -CC — — — — — — — 16 
VTAPRTLLL — -C- -T — — — C- — — 10 
VTAPRTLFL — -C- -A — — — C- T- — 
VTASRTLLL — -C- — T- — — C- — — 
VMAPRTLLL —  — — — — C- — — 
VTASRTVLL — -C- — T- — — — — — 
VRAPRTLLL — -G- -A — — — C- — — 
VTAPRTILL — -C- — — — — A- — — 
VTAPRNLLL — -C- — — — -A- C-– — — 
VMAPRTVLL* —  — — — — — — T- 
VTAPRTVLL — -C- -A — — — — — -A 
VTAPQTVLL — -C- — — -A- — — — — 
VTATRTLLL — -C- — A- — — C- — — 
VTALRTVLL — -C- — -T- — — — — — 
VTAPRTLVL — -C- — — — — C- G- — 
ITAPRTVLL A- -C- — — — — — — — 
VMEPRTVLL —  -A- — — — — — — 
VTAP*TLLL — -C- — — T- — C- — — 
VTAPRTLLL — -C- — — — — C- — -A 
VTAPRTFLL — -C- — — — — T– — — 
VMATRTVLL —  — A- — — — — — 
VMAPGTVLL —  — — G- — — — — 
VTAPRTVLQ — -C- — — — — — — -A- 
VMAPRSVLL — — — — — -G- — — — 
VVAPRTVLL — G- — — — — — — — 
VMVPRTVLL — — -T- — — — — — — 
VMAPRTVLV — — — — — — — — G- 
Total          2 196 716 
Deduced leader peptideNucleotide sequence for nonamer peptideTotal (% of total cohort)
P1P2P3P4P5P6P7P8P9
VMAPRTVLL* GTC ATG GCG CCC CGA ACC GTC CTC CTG 683 153 (31.1) 
VTAPRTVLL — -C- — — — — — — — 670 904 (30.5) 
VTAPRTLLL — -C- — — — — C- — — 542 311 (24.7) 
VTAPRTVLL — -C- -A — — — — — — 242 366 (11.0) 
VTAPRTLLL — -C- -A — — — C- — — 57 747 (2.6) 
VTEPRTLLL — -C- -A- — — — C- — — 107 
VMAPRTVLL* —  — — A- — — — — 25 
VMAPRTVLL* —  -A — — — — — — 21 
VTAPRTVLL — -CC — — — — — — — 16 
VTAPRTLLL — -C- -T — — — C- — — 10 
VTAPRTLFL — -C- -A — — — C- T- — 
VTASRTLLL — -C- — T- — — C- — — 
VMAPRTLLL —  — — — — C- — — 
VTASRTVLL — -C- — T- — — — — — 
VRAPRTLLL — -G- -A — — — C- — — 
VTAPRTILL — -C- — — — — A- — — 
VTAPRNLLL — -C- — — — -A- C-– — — 
VMAPRTVLL* —  — — — — — — T- 
VTAPRTVLL — -C- -A — — — — — -A 
VTAPQTVLL — -C- — — -A- — — — — 
VTATRTLLL — -C- — A- — — C- — — 
VTALRTVLL — -C- — -T- — — — — — 
VTAPRTLVL — -C- — — — — C- G- — 
ITAPRTVLL A- -C- — — — — — — — 
VMEPRTVLL —  -A- — — — — — — 
VTAP*TLLL — -C- — — T- — C- — — 
VTAPRTLLL — -C- — — — — C- — -A 
VTAPRTFLL — -C- — — — — T– — — 
VMATRTVLL —  — A- — — — — — 
VMAPGTVLL —  — — G- — — — — 
VTAPRTVLQ — -C- — — — — — — -A- 
VMAPRSVLL — — — — — -G- — — — 
VVAPRTVLL — G- — — — — — — — 
VMVPRTVLL — — -T- — — — — — — 
VMAPRTVLV — — — — — — — — G- 
Total          2 196 716 

The 1 098 358 donors in cohort 1 contain 2 196 716 observed exon 1 nucleotide sequences (each of which encodes a deduced peptide sequence). Each row details a unique nucleotide sequence. Nucleotide sequence rows are sorted by decreasing observations. Nucleotide sequences are aligned with the most frequent sequence; hyphens indicate consensus nucleotides. The asterisk within VTAP*TLLL indicates a deduced stop codon. The P2 sequence is indicated in bold, which is deduced to encode thymine (T) (1 513 499 observations); methionine (M) (683 213 observations); arginine (R) (three observations), or valine (V) (one observation). Percentages are provided for the top 5 peptides, which represent 99.99% of all observations. Race information for each peptide is provided in Table 4. Deduced leader peptides with multiple unique nucleotide sequences are annotated with footnotes.

*,†,‡

These deduced leader peptides have 4 unique exon 1 sequences each in cohort 1.

or Create an Account

Close Modal
Close Modal