Improve support for eland searching a single fasta containing multiple records.
authorDiane Trout <diane@caltech.edu>
Tue, 10 Mar 2009 01:11:22 +0000 (01:11 +0000)
committerDiane Trout <diane@caltech.edu>
Tue, 10 Mar 2009 01:11:22 +0000 (01:11 +0000)
commite68fe89868dfae80af7ea6d752e335397ec81437
tree59d6efcaa23dd349814d6044ec71f72655696777
parent35e13dfcdf42d60b0f20145ea8ec852f723db2ef
Improve support for eland searching a single fasta containing multiple records.
the problem was that I was assuming / was a path seperator between genome
directory name and chromosome, but eland was also reporting it as
fasta file name / fasta record.

By happy accident in genome map, the fasta file with multiple records would
be stored in the GenomeMap dictionary as having the same name, value pair
while things that had the genome encoded would be fasta filename mapping to
genome/fasta filename.

as a result it appears that splitting a mapped item on the path seperator /
and then looking the "base path" up in the genome map will allow me to
determine if an element is a genome directory "path" or a multi record
fasta file by its absence (for genome dirs) or presence (for multi
fasta records)
htsworkflow/pipelines/runfolder.py
htsworkflow/pipelines/test/simulate_runfolder.py
htsworkflow/pipelines/test/test_runfolder110.py
htsworkflow/pipelines/test/test_runfolder_ipar100.py
htsworkflow/pipelines/test/test_runfolder_pair.py