Edit

Science Education

Formerly known as European Learning Laboratory for the Life Sciences

Our inspiring educational experiences share the scientific discoveries of EMBL with young learners aged 10-19 years and teachers in Europe and beyond. We belong to EMBL’s Science Education and Public Engagement office.

October 5, 2015

Step 2: Comparison of nucleotide sequences

Overview
Your task
MUSCLE
Sequences 1-4
Questions
Activity navigation

Overview

A simultaneous comparison of all your nucleotide sequences can be achieved by using the server-based software EMBL-EBI MUSCLE (Multiple Sequence Comparison by Log-Expectation). MUSCLE produces so-called sequence alignments. These alignments can be used to visualise and interpret the relationships between sequences – and sometimes even between species.

After completing this exercise you should have produced a multiple sequence alignment (on nucleotide level) and will be able to assess roughly which nucleotide sequences are most similar to each other. The nucleotide sequences (input) are provided in the tab “Sequences”.

Your task

Proceed as described below:

Copy all of the nucleotide sequences which are provided under the tab “Sequences” at once (i.e. select and copy the whole block of sequences) (shortcut Ctrl. + C).
Paste the nucleotide sequences into the MUSCLE search box (shortcut Ctrl. + V).
Follow the instructions in the tab “MUSCLE” to align your sequences.
Have a look at the alignment and try to answer the questions in the “Questions” tab.

MUSCLE

Copy all of the nucleotide sequences which are provided under the tab “Sequences” at once (i.e. select and copy the whole block of sequences) (shortcut Ctrl. + C).
Paste the nucleotide sequences into the MUSCLE search box (shortcut Ctrl. + V).
In the “STEP 2” section ensure that “Output Format” is set at “ClustalW”.
Just click on the large “Submit” button and your alignment will be processed.
You will see the results after a few seconds. Have a look at the alignment and try to answer the questions in the “Questions” tab.

Sequences 1-4

Sequence 1

>Sequence1_AVGFP
ATGAGTAAAGGAGAAGAACTTTTCACTGGAGTGGTCCCAGTTCTTGTTGAATTAGATGGCGATGTTAATGGGCAAAAATTCTCTGTCAGTGGAGAGGGTGAAGGTGATGCAACATACGGAAAACTTACCCTTAATTTTATTTGCACTACTGGGAAGCTACCTGTTCCATGGCCAACACTTGTCACTACTTTCTCTTATGGTGTTCAATGCTTCTCAAGATACCCAGATCATATGAAACAGCATGACTTTTTCAAGAGTGCCATGCCCGAAGGTTATGTACAGGAAAGAACTATATTTTACAAAGATGACGGGAACTACAAGACACGTGCTGAAGTCAAGTTTGAAGGTGATACCCTTGTTAATAGAATCGAGTTAAAAGGTATTGATTTTAAAGAAGATGGAAACATTCTTGGACACAAAATGGAATACAACTATAACTCACATAATGTATACATCATGGGAGACAAACCAAAGAATGGCATCAAAGTTAACTTCAAAATTAGACACAACATTAAAGATGGAAGCGTTCAATTAGCAGACCATTATCAACAAAATACTCCAATTGGCGATGGCCCTGTCCTTTTACCAGACAACCATTACCTGTCCACACAATCTGCCCTTTCCAAAGATCCCAACGAAAAGAGAGATCACATGATCCTTCTTGAGTTTGTAACAGCTGCTAGGATTACACATGGCATGGATGAACTATACAAA

Sequence 2

 >Sequence2_GFPm
ATGTCTAAAGGTGAAGAATTATTCACTGGTGTTGTCCCAATTTTGGTTGAATTAGATGGTGATGTTAATGGTCACAAATTTTCTGTCTCCGGTGAAGGTGAAGGTGATGCTACTTACGGTAAATTGACCTTAAAATTTATTTGTACTACTGGTAAATTGCCAGTTCCATGGCCAACCTTAGTCACTACTTTCGGTTATGGTGTTCAATGTTTTGCTAGATACCCAGATCATATGAAACAACATGACTTTTTCAAGTCTGCCATGCCAGAAGGTTATGTTCAAGAAAGAACTATTTTTTTCAAAGATGACGGTAACTACAAGACCAGAGCTGAAGTCAAGTTTGAAGGTGATACCTTAGTTAATAGAATCGAATTAAAAGGTATTGATTTTAAAGAAGATGGTAACATTTTAGGTCACAAATTGGAATACAACTATAACTCTCACAATGTTTACATCATGGCTGACAAACAAAAGAATGGTATCAAAGTTAACTTCAAAATTAGACACAACATTGAAGATGGTTCTGTTCAATTAGCTGACCATTATCAACAAAATACTCCAATTGGTGATGGTCCAGTCTTGTTACCAGACAACCATTACTTATCCACTCAATCTGCCTTATCCAAAGATCCAAACGAAAAGAGAGACCACATGGTCTTGTTAGAATTTGTTACTGCTGCTGGTATTACCCATGGTATGGATGAATTGTACAAATAACTGCAG

Sequence 3

>Sequence3_YFP
AATATTTTTATTAATTCATTAGAAAAATGAGAGGAAGGATTATTATGTTTAAAGGTATAGTAGAAGGTATAGGAATCATTGAAAAAATTGATATATATACTGACCTAGATAAGTATGCAATTCGATTTCCTGAAAATATGTTGAATGGAATTAAAAAGGAGTCGTCAATAATGTTTAACGGATGCTTCTTAACGGTAACTAGCGTGAATTCAAACATTGTCTGGTTTGATATATTTGAAAAAGAAGCACGTAAGCTTGATACTTTTCGGGAATATAAGGTAGGTGACCGAGTAAATTTAGGAACATTCCCAAAATTTGGCGCTGCATCTGGTGGGCATATATTATCAGCAAGGATTTCATGTGTAGCAAGTATTATTGAAATAATAGAAAATGAGGATTATCAACAAATGTGGATTCAAATTCCTGAAAATTTTACAGAGTTTCTTATTGATAAAGACTATATTGCTGTGGATGGTATTAGCTTAACTATTGACACTATAAAAAACAACCAATTTTTCATTAGTTTACCCTTAAAAATAGCACAAAATACAAATATGAAATGGCGAAAAAAAGGTGATAAGGTAAATGTTGAGTTATCAAACAAAATTAATGCTAACCAGTGTTGGTAATTTACTGAGGATAGTAAAAATGAACTGTTTAAAATAATATTTAAATTTTTATTTATAATACAGAGTCAGTTGTTGTAAATAGTCTGAGTGGTAAATAAGTTCTACCATTAATTAAATATTATCCATATTAAATAAAGGATCT

Sequence 4

>Sequence4_RFP
AGTTTCAGCCAGTGACAGGGTGAGCTGCCAGGTATTCTAACAAGATGAGTTGTTCCAAGAATGTGATCAAGGAGTTCATGAGGTTCAAGGTTCGTATGGAAGGAACGGTCAATGGGCACGAGTTTGAAATAAAAGGCGAAGGTGAAGGGAGGCCTTACGAAGGTCACTGTTCCGTAAAGCTTATGGTAACCAAGGGTGGACCTTTGCCATTTGCTTTTGATATTTTGTCACCACAATTTCAGTATGGAAGCAAGGTATATGTCAAACACCCTGCCGACATACCAGACTATAAAAAGCTGTCATTTCCTGAGGGATTTAAATGGGAAAGGGTCATGAACTTTGAAGACGGTGGCGTGGTTACTGTATCCCAAGATTCCAGTTTGAAAGACGGCTGTTTCATCTACGAGGTCAAGTTCATTGGGGTGAACTTTCCTTCTGATGGACCTGTTATGCAGAGGAGGACACGGGGCTGGGAAGCCAGCTCTGAGCGTTTGTATCCTCGTGATGGGGTGCTGAAAGGAGACATCCATATGGCTCTGAGGCTGGAAGGAGGCGGCCATTACCTCGTTGAATTCAAAAGTATTTACATGGTAAAGAAGCCTTCAGTGCAGTTGCCAGGCTACTATTATGTTGACTCCAAACTGGATATGACGAGCCACAACGAAGATTACACAGTCGTTGAGCAGTATGAAAAAACCCAGGGACGCCACCATCCGTTCATTAAGCCTCTGCAGTGAACTCGGCTCAGTCATGGATTAGCGGTAATGGCCACAAAAGGCACGATGATCGTTTTTTAGGAATGCAGCCAAAAATTGAAGGTTATGACAGTAGAAATACAAGCAACAGGCTTTGCTTATTAAACATGTAATTGAAAAC

Questions

Have a look at the alignment and try to answer the following questions:

How do you know whether the nucleotides in the individual sequences are the same or not compared to the other aligned sequences?
Do you think there many corresponding nucleotides? Would you have expected something else?
Which of the two sequences would you judge as being most similar?