X-Git-Url: http://woldlab.caltech.edu/gitweb/?p=mussa.git;a=blobdiff_plain;f=alg%2Ftest%2Ftest_alphabet.cpp;h=854c1b3b24c01f189a5ea0326bec63b12c6f9728;hp=5f7d9f3ae03f8bab8b6a82e235b515881f92001a;hb=75496e2c562d728af983c347527270eba360c6ee;hpb=b9755e1974201ff513c66b0fd684bde330c6fff6 diff --git a/alg/test/test_alphabet.cpp b/alg/test/test_alphabet.cpp index 5f7d9f3..854c1b3 100644 --- a/alg/test/test_alphabet.cpp +++ b/alg/test/test_alphabet.cpp @@ -26,4 +26,150 @@ BOOST_AUTO_TEST_CASE( alphabet_equality) { Alphabet a(Alphabet::reduced_dna_alphabet()); BOOST_CHECK_EQUAL( a, Alphabet::reduced_dna_alphabet() ); +} + +/* +BOOST_AUTO_TEST_CASE( alphabet_rc_invalid ) +{ + Alphabet a1 = Alphabet::get_alphabet(empty_alphabet); + BOOST_CHECK_THROW(a1.get_complement_map(), mussa_error); + + Alphabet a2 = Alphabet::get_alphabet(protein_alphabet); + BOOST_CHECK_THROW(a2.create_complement_map(), mussa_error); +} +*/ + +BOOST_AUTO_TEST_CASE( alphabet_rc_reduced_dna) +{ + Alphabet a = Alphabet::get_alphabet(reduced_dna_alphabet); + + std::string rc_map = a.get_complement_map(); + BOOST_CHECK_EQUAL(rc_map['A'], 'T'); + BOOST_CHECK_EQUAL(rc_map['a'], 't'); + BOOST_CHECK_EQUAL(rc_map['T'], 'A'); + BOOST_CHECK_EQUAL(rc_map['t'], 'a'); + BOOST_CHECK_EQUAL(rc_map['G'], 'C'); + BOOST_CHECK_EQUAL(rc_map['g'], 'c'); + BOOST_CHECK_EQUAL(rc_map['C'], 'G'); + BOOST_CHECK_EQUAL(rc_map['c'], 'g'); + BOOST_CHECK_EQUAL(rc_map['U'], '~'); + BOOST_CHECK_EQUAL(rc_map['u'], '~'); + BOOST_CHECK_EQUAL(rc_map['Q'], '~'); + BOOST_CHECK_EQUAL(rc_map['*'], '~'); +} + +BOOST_AUTO_TEST_CASE( alphabet_rc_reduced_rna) +{ + Alphabet a = Alphabet::get_alphabet(reduced_rna_alphabet); + + std::string rc_map = a.get_complement_map(); + BOOST_CHECK_EQUAL(rc_map['A'], 'U'); + BOOST_CHECK_EQUAL(rc_map['a'], 'u'); + BOOST_CHECK_EQUAL(rc_map['G'], 'C'); + BOOST_CHECK_EQUAL(rc_map['g'], 'c'); + BOOST_CHECK_EQUAL(rc_map['C'], 'G'); + BOOST_CHECK_EQUAL(rc_map['c'], 'g'); + BOOST_CHECK_EQUAL(rc_map['T'], '~'); + BOOST_CHECK_EQUAL(rc_map['t'], '~'); + BOOST_CHECK_EQUAL(rc_map['U'], 'A'); + BOOST_CHECK_EQUAL(rc_map['u'], 'a'); + BOOST_CHECK_EQUAL(rc_map['Q'], '~'); + BOOST_CHECK_EQUAL(rc_map['*'], '~'); +} + +BOOST_AUTO_TEST_CASE( alphabet_rc_dna) +{ + Alphabet a = Alphabet::get_alphabet(dna_alphabet); + + std::string rc_map = a.get_complement_map(); + BOOST_CHECK_EQUAL(rc_map['A'], 'T'); + BOOST_CHECK_EQUAL(rc_map['a'], 't'); + BOOST_CHECK_EQUAL(rc_map['C'], 'G'); + BOOST_CHECK_EQUAL(rc_map['c'], 'g'); + BOOST_CHECK_EQUAL(rc_map['G'], 'C'); + BOOST_CHECK_EQUAL(rc_map['g'], 'c'); + BOOST_CHECK_EQUAL(rc_map['T'], 'A'); + BOOST_CHECK_EQUAL(rc_map['t'], 'a'); + BOOST_CHECK_EQUAL(rc_map['R'], 'Y'); + BOOST_CHECK_EQUAL(rc_map['r'], 'y'); + BOOST_CHECK_EQUAL(rc_map['Y'], 'R'); + BOOST_CHECK_EQUAL(rc_map['y'], 'r'); + BOOST_CHECK_EQUAL(rc_map['S'], 'S'); + BOOST_CHECK_EQUAL(rc_map['s'], 's'); + BOOST_CHECK_EQUAL(rc_map['W'], 'W'); + BOOST_CHECK_EQUAL(rc_map['w'], 'w'); + BOOST_CHECK_EQUAL(rc_map['K'], 'M'); + BOOST_CHECK_EQUAL(rc_map['k'], 'm'); + BOOST_CHECK_EQUAL(rc_map['M'], 'K'); + BOOST_CHECK_EQUAL(rc_map['m'], 'k'); + BOOST_CHECK_EQUAL(rc_map['B'], 'V'); + BOOST_CHECK_EQUAL(rc_map['b'], 'v'); + BOOST_CHECK_EQUAL(rc_map['V'], 'B'); + BOOST_CHECK_EQUAL(rc_map['v'], 'b'); + BOOST_CHECK_EQUAL(rc_map['D'], 'H'); + BOOST_CHECK_EQUAL(rc_map['d'], 'h'); + BOOST_CHECK_EQUAL(rc_map['H'], 'D'); + BOOST_CHECK_EQUAL(rc_map['h'], 'd'); + BOOST_CHECK_EQUAL(rc_map['N'], 'N'); + BOOST_CHECK_EQUAL(rc_map['n'], 'n'); + + BOOST_CHECK_EQUAL(rc_map['U'], '~'); + BOOST_CHECK_EQUAL(rc_map['u'], '~'); + BOOST_CHECK_EQUAL(rc_map['Q'], '~'); + BOOST_CHECK_EQUAL(rc_map['*'], '~'); +} + +BOOST_AUTO_TEST_CASE( alphabet_rc_rna) +{ + Alphabet a = Alphabet::get_alphabet(rna_alphabet); + + std::string rc_map = a.get_complement_map(); + BOOST_CHECK_EQUAL(rc_map['A'], 'U'); + BOOST_CHECK_EQUAL(rc_map['a'], 'u'); + BOOST_CHECK_EQUAL(rc_map['C'], 'G'); + BOOST_CHECK_EQUAL(rc_map['c'], 'g'); + BOOST_CHECK_EQUAL(rc_map['G'], 'C'); + BOOST_CHECK_EQUAL(rc_map['g'], 'c'); + BOOST_CHECK_EQUAL(rc_map['U'], 'A'); + BOOST_CHECK_EQUAL(rc_map['u'], 'a'); + BOOST_CHECK_EQUAL(rc_map['R'], 'Y'); + BOOST_CHECK_EQUAL(rc_map['r'], 'y'); + BOOST_CHECK_EQUAL(rc_map['Y'], 'R'); + BOOST_CHECK_EQUAL(rc_map['y'], 'r'); + BOOST_CHECK_EQUAL(rc_map['S'], 'S'); + BOOST_CHECK_EQUAL(rc_map['s'], 's'); + BOOST_CHECK_EQUAL(rc_map['W'], 'W'); + BOOST_CHECK_EQUAL(rc_map['w'], 'w'); + BOOST_CHECK_EQUAL(rc_map['K'], 'M'); + BOOST_CHECK_EQUAL(rc_map['k'], 'm'); + BOOST_CHECK_EQUAL(rc_map['M'], 'K'); + BOOST_CHECK_EQUAL(rc_map['m'], 'k'); + BOOST_CHECK_EQUAL(rc_map['B'], 'V'); + BOOST_CHECK_EQUAL(rc_map['b'], 'v'); + BOOST_CHECK_EQUAL(rc_map['V'], 'B'); + BOOST_CHECK_EQUAL(rc_map['v'], 'b'); + BOOST_CHECK_EQUAL(rc_map['D'], 'H'); + BOOST_CHECK_EQUAL(rc_map['d'], 'h'); + BOOST_CHECK_EQUAL(rc_map['H'], 'D'); + BOOST_CHECK_EQUAL(rc_map['h'], 'd'); + BOOST_CHECK_EQUAL(rc_map['N'], 'N'); + BOOST_CHECK_EQUAL(rc_map['n'], 'n'); + + BOOST_CHECK_EQUAL(rc_map['T'], '~'); + BOOST_CHECK_EQUAL(rc_map['t'], '~'); + BOOST_CHECK_EQUAL(rc_map['Q'], '~'); + BOOST_CHECK_EQUAL(rc_map['*'], '~'); +} + + +//enum AlphabetRef { reduced_nucleic_alphabet, nucleic_alphabet, }; +BOOST_AUTO_TEST_CASE( alphabet_reverse_complement ) +{ + Alphabet a = Alphabet::get_alphabet(reduced_dna_alphabet); + std::string seq("AAAAGCT"); + std::string known_rc_seq("AGCTTTT"); + boost::shared_ptr new_seq(a.reverse_complement(seq)); + + BOOST_CHECK_EQUAL(*new_seq, known_rc_seq); + } \ No newline at end of file