854c1b3b24c01f189a5ea0326bec63b12c6f9728
[mussa.git] / alg / test / test_alphabet.cpp
1 #define BOOST_AUTO_TEST_MAIN
2 #include <boost/test/auto_unit_test.hpp>
3
4 #include <boost/archive/text_oarchive.hpp>
5 #include <boost/archive/text_iarchive.hpp>
6 #include <boost/archive/xml_oarchive.hpp>
7 #include <boost/archive/xml_iarchive.hpp>
8
9 #include "alg/alphabet.hpp"
10 #include "mussa_exceptions.hpp"
11
12 BOOST_AUTO_TEST_CASE( alphabet_simple )
13 {
14   Alphabet a(Alphabet::reduced_dna_alphabet());
15   // exists is case insensitive
16   BOOST_CHECK_EQUAL( a.exists('a'), true);
17   BOOST_CHECK_EQUAL( a.exists('A'), true);
18   BOOST_CHECK_EQUAL( a.exists('Q'), false);
19   BOOST_CHECK_EQUAL( a.exists('q'), false);
20   
21   // copied from alphabet.cpp
22   BOOST_CHECK_EQUAL( Alphabet::reduced_dna_cstr, "AaCcGgTtNn\012\015");
23 }
24
25 BOOST_AUTO_TEST_CASE( alphabet_equality)
26 {
27   Alphabet a(Alphabet::reduced_dna_alphabet());
28   BOOST_CHECK_EQUAL( a, Alphabet::reduced_dna_alphabet() );
29 }
30
31 /*
32 BOOST_AUTO_TEST_CASE( alphabet_rc_invalid )
33 {
34   Alphabet a1 = Alphabet::get_alphabet(empty_alphabet);
35   BOOST_CHECK_THROW(a1.get_complement_map(), mussa_error);
36
37   Alphabet a2 = Alphabet::get_alphabet(protein_alphabet);
38   BOOST_CHECK_THROW(a2.create_complement_map(), mussa_error);
39 }
40 */
41
42 BOOST_AUTO_TEST_CASE( alphabet_rc_reduced_dna)
43 {
44   Alphabet a = Alphabet::get_alphabet(reduced_dna_alphabet);
45   
46   std::string rc_map = a.get_complement_map();
47   BOOST_CHECK_EQUAL(rc_map['A'], 'T');
48   BOOST_CHECK_EQUAL(rc_map['a'], 't');
49   BOOST_CHECK_EQUAL(rc_map['T'], 'A');
50   BOOST_CHECK_EQUAL(rc_map['t'], 'a');
51   BOOST_CHECK_EQUAL(rc_map['G'], 'C');
52   BOOST_CHECK_EQUAL(rc_map['g'], 'c');
53   BOOST_CHECK_EQUAL(rc_map['C'], 'G');
54   BOOST_CHECK_EQUAL(rc_map['c'], 'g');
55   BOOST_CHECK_EQUAL(rc_map['U'], '~');
56   BOOST_CHECK_EQUAL(rc_map['u'], '~');
57   BOOST_CHECK_EQUAL(rc_map['Q'], '~');
58   BOOST_CHECK_EQUAL(rc_map['*'], '~');
59 }
60
61 BOOST_AUTO_TEST_CASE( alphabet_rc_reduced_rna)
62 {
63   Alphabet a = Alphabet::get_alphabet(reduced_rna_alphabet);
64   
65   std::string rc_map = a.get_complement_map();
66   BOOST_CHECK_EQUAL(rc_map['A'], 'U');
67   BOOST_CHECK_EQUAL(rc_map['a'], 'u');
68   BOOST_CHECK_EQUAL(rc_map['G'], 'C');
69   BOOST_CHECK_EQUAL(rc_map['g'], 'c');
70   BOOST_CHECK_EQUAL(rc_map['C'], 'G');
71   BOOST_CHECK_EQUAL(rc_map['c'], 'g');
72   BOOST_CHECK_EQUAL(rc_map['T'], '~');
73   BOOST_CHECK_EQUAL(rc_map['t'], '~');
74   BOOST_CHECK_EQUAL(rc_map['U'], 'A');
75   BOOST_CHECK_EQUAL(rc_map['u'], 'a');
76   BOOST_CHECK_EQUAL(rc_map['Q'], '~');
77   BOOST_CHECK_EQUAL(rc_map['*'], '~');
78 }
79
80 BOOST_AUTO_TEST_CASE( alphabet_rc_dna)
81 {
82   Alphabet a = Alphabet::get_alphabet(dna_alphabet);
83   
84   std::string rc_map = a.get_complement_map();
85   BOOST_CHECK_EQUAL(rc_map['A'], 'T');
86   BOOST_CHECK_EQUAL(rc_map['a'], 't');
87   BOOST_CHECK_EQUAL(rc_map['C'], 'G');
88   BOOST_CHECK_EQUAL(rc_map['c'], 'g');
89   BOOST_CHECK_EQUAL(rc_map['G'], 'C');
90   BOOST_CHECK_EQUAL(rc_map['g'], 'c');
91   BOOST_CHECK_EQUAL(rc_map['T'], 'A');
92   BOOST_CHECK_EQUAL(rc_map['t'], 'a');
93   BOOST_CHECK_EQUAL(rc_map['R'], 'Y');
94   BOOST_CHECK_EQUAL(rc_map['r'], 'y');
95   BOOST_CHECK_EQUAL(rc_map['Y'], 'R');
96   BOOST_CHECK_EQUAL(rc_map['y'], 'r');
97   BOOST_CHECK_EQUAL(rc_map['S'], 'S');
98   BOOST_CHECK_EQUAL(rc_map['s'], 's');
99   BOOST_CHECK_EQUAL(rc_map['W'], 'W');
100   BOOST_CHECK_EQUAL(rc_map['w'], 'w');
101   BOOST_CHECK_EQUAL(rc_map['K'], 'M');
102   BOOST_CHECK_EQUAL(rc_map['k'], 'm');
103   BOOST_CHECK_EQUAL(rc_map['M'], 'K');
104   BOOST_CHECK_EQUAL(rc_map['m'], 'k');
105   BOOST_CHECK_EQUAL(rc_map['B'], 'V');
106   BOOST_CHECK_EQUAL(rc_map['b'], 'v');
107   BOOST_CHECK_EQUAL(rc_map['V'], 'B');
108   BOOST_CHECK_EQUAL(rc_map['v'], 'b');
109   BOOST_CHECK_EQUAL(rc_map['D'], 'H');
110   BOOST_CHECK_EQUAL(rc_map['d'], 'h');
111   BOOST_CHECK_EQUAL(rc_map['H'], 'D');
112   BOOST_CHECK_EQUAL(rc_map['h'], 'd');
113   BOOST_CHECK_EQUAL(rc_map['N'], 'N');
114   BOOST_CHECK_EQUAL(rc_map['n'], 'n');
115
116   BOOST_CHECK_EQUAL(rc_map['U'], '~');
117   BOOST_CHECK_EQUAL(rc_map['u'], '~');
118   BOOST_CHECK_EQUAL(rc_map['Q'], '~');
119   BOOST_CHECK_EQUAL(rc_map['*'], '~');
120 }
121
122 BOOST_AUTO_TEST_CASE( alphabet_rc_rna)
123 {
124   Alphabet a = Alphabet::get_alphabet(rna_alphabet);
125   
126   std::string rc_map = a.get_complement_map();
127   BOOST_CHECK_EQUAL(rc_map['A'], 'U');
128   BOOST_CHECK_EQUAL(rc_map['a'], 'u');
129   BOOST_CHECK_EQUAL(rc_map['C'], 'G');
130   BOOST_CHECK_EQUAL(rc_map['c'], 'g');
131   BOOST_CHECK_EQUAL(rc_map['G'], 'C');
132   BOOST_CHECK_EQUAL(rc_map['g'], 'c');
133   BOOST_CHECK_EQUAL(rc_map['U'], 'A');
134   BOOST_CHECK_EQUAL(rc_map['u'], 'a');
135   BOOST_CHECK_EQUAL(rc_map['R'], 'Y');
136   BOOST_CHECK_EQUAL(rc_map['r'], 'y');
137   BOOST_CHECK_EQUAL(rc_map['Y'], 'R');
138   BOOST_CHECK_EQUAL(rc_map['y'], 'r');
139   BOOST_CHECK_EQUAL(rc_map['S'], 'S');
140   BOOST_CHECK_EQUAL(rc_map['s'], 's');
141   BOOST_CHECK_EQUAL(rc_map['W'], 'W');
142   BOOST_CHECK_EQUAL(rc_map['w'], 'w');
143   BOOST_CHECK_EQUAL(rc_map['K'], 'M');
144   BOOST_CHECK_EQUAL(rc_map['k'], 'm');
145   BOOST_CHECK_EQUAL(rc_map['M'], 'K');
146   BOOST_CHECK_EQUAL(rc_map['m'], 'k');
147   BOOST_CHECK_EQUAL(rc_map['B'], 'V');
148   BOOST_CHECK_EQUAL(rc_map['b'], 'v');
149   BOOST_CHECK_EQUAL(rc_map['V'], 'B');
150   BOOST_CHECK_EQUAL(rc_map['v'], 'b');
151   BOOST_CHECK_EQUAL(rc_map['D'], 'H');
152   BOOST_CHECK_EQUAL(rc_map['d'], 'h');
153   BOOST_CHECK_EQUAL(rc_map['H'], 'D');
154   BOOST_CHECK_EQUAL(rc_map['h'], 'd');
155   BOOST_CHECK_EQUAL(rc_map['N'], 'N');
156   BOOST_CHECK_EQUAL(rc_map['n'], 'n');
157
158   BOOST_CHECK_EQUAL(rc_map['T'], '~');
159   BOOST_CHECK_EQUAL(rc_map['t'], '~');
160   BOOST_CHECK_EQUAL(rc_map['Q'], '~');
161   BOOST_CHECK_EQUAL(rc_map['*'], '~');
162 }
163
164
165 //enum AlphabetRef { reduced_nucleic_alphabet,   nucleic_alphabet, };
166 BOOST_AUTO_TEST_CASE( alphabet_reverse_complement )
167 {
168   Alphabet a = Alphabet::get_alphabet(reduced_dna_alphabet);
169   std::string seq("AAAAGCT");
170   std::string known_rc_seq("AGCTTTT");
171   boost::shared_ptr<std::string> new_seq(a.reverse_complement(seq));
172   
173   BOOST_CHECK_EQUAL(*new_seq, known_rc_seq);
174   
175 }