Return read_length for file properties
authorDiane Trout <diane@caltech.edu>
Thu, 24 Sep 2015 18:49:18 +0000 (11:49 -0700)
committerDiane Trout <diane@caltech.edu>
Thu, 24 Sep 2015 18:49:18 +0000 (11:49 -0700)
htsworkflow/submission/aws_submission.py
htsworkflow/templates/aws_metadata.sparql

index f4cd5c0b755179f5de40443be27130aa1b137490..d6f3cdb9133a9f2815745b692b6fa1ceb34234e2 100644 (file)
@@ -106,6 +106,8 @@ class AWSSubmission(Submission):
         for row in results:
             if 'platform' in row:
                 row['platform'] = platform_alias[row['platform']]
+            if 'read_length' in row:
+                row['read_length'] = int(row['read_length'])
             flowcell_details = {}
             for term in ['machine', 'flowcell', 'lane', 'barcode']:
                 if term in row:
index fd99df8e2097b011313756a0139abd9780e084d4..dc2ae329c227ff0f82dfb8062c1f2f213fe7c066 100644 (file)
@@ -6,7 +6,7 @@ PREFIX ncbiTaxon: <http://www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi?id=>
 PREFIX geoSoft: <http://www.ncbi.nlm.nih.gov/geo/info/soft2.html#>
 PREFIX cells: <http://encodewiki.ucsc.edu/EncodeDCC/index.php/Cell_lines#>
 
-select distinct ?dataset ?replicate ?award ?lab ?lane ?barcode ?submitted_file_name ?file_format ?file_size ?output_type ?md5sum ?flowcell ?machine ?platform
+select distinct ?dataset ?replicate ?award ?lab ?lane ?read_length ?barcode ?submitted_file_name ?file_format ?file_size ?output_type ?md5sum ?flowcell ?machine ?platform
 WHERE {
   <{{submission}}> a submissionOntology:submission ;
                    encode3:dataset ?dataset ;
@@ -23,6 +23,7 @@ WHERE {
         htswlib:library ?library ;
         htswlib:flowcell ?flowcell_url ;
         htswlib:lane_number ?lane ;
+        htswlib:read_length ?read_length ;
         a ?fileClass .
 
   ?flowcell_url htswlib:sequenced_by ?machine ;