Support scanning for split fastq files generated by HiSeq demultiplexing

[htsworkflow.git] / htsworkflow / pipelines / test / test_sequences.py
diff --git a/htsworkflow/pipelines/test/test_sequences.py b/htsworkflow/pipelines/test/test_sequences.py

index 157246a94e3eae277e78df2813f5670aabb89621..e00f5ec8efaf12ee2a94d70749407c44fe754742 100644 (file)
--- a/htsworkflow/pipelines/test/test_sequences.py
+++ b/htsworkflow/pipelines/test/test_sequences.py
@@ -128,7 +128,7 @@ class SequenceFileTests(unittest.TestCase):
          pathname = os.path.join(path,name)
          f = sequences.parse_fastq(path, name)
  
-        self.failUnlessEqual(f.filetype, 'fastq')
+        self.failUnlessEqual(f.filetype, 'split_fastq')
          self.failUnlessEqual(f.path, pathname)
          self.failUnlessEqual(f.flowcell, '42BW9AAXX')
          self.failUnlessEqual(f.lane, 1)
@@ -142,7 +142,7 @@ class SequenceFileTests(unittest.TestCase):
          pathname = os.path.join(path,name)
          f = sequences.parse_fastq(path, name)
  
-        self.failUnlessEqual(f.filetype, 'fastq')
+        self.failUnlessEqual(f.filetype, 'split_fastq')
          self.failUnlessEqual(f.path, pathname)
          self.failUnlessEqual(f.flowcell, '42BW9AAXX')
          self.failUnlessEqual(f.lane, 1)
@@ -152,6 +152,22 @@ class SequenceFileTests(unittest.TestCase):
          self.failUnlessEqual(f.index, 'AAATTT')
          self.failUnlessEqual(f.cycle, 38)
  
+    def test_project_fastq_hashing(self):
+        """Can we tell the difference between sequence files?
+        """
+        path = '/root/42BW9AAXX/C1-38/Project_12345'
+        names = [('11111_NoIndex_L001_R1_001.fastq.gz',
+                  '11111_NoIndex_L001_R2_001.fastq.gz'),
+                 ('11112_NoIndex_L001_R1_001.fastq.gz',
+                  '11112_NoIndex_L001_R1_002.fastq.gz')
+                 ]
+        for a_name, b_name in names:
+            a = sequences.parse_fastq(path, a_name)
+            b = sequences.parse_fastq(path, b_name)
+            self.failIfEqual(a, b)
+            self.failIfEqual(a.key(), b.key())
+            self.failIfEqual(hash(a), hash(b))
+
      def test_eland(self):
          path = '/root/42BW9AAXX/C1-38'
          name = 's_4_eland_extended.txt.bz2'