Rework ucsc gather to use RDF models for gathering and storing track metadata.
authorDiane Trout <diane@caltech.edu>
Sat, 18 Jun 2011 21:03:36 +0000 (14:03 -0700)
committerDiane Trout <diane@caltech.edu>
Sat, 18 Jun 2011 21:03:36 +0000 (14:03 -0700)
commitdd850bd4f1cfd68a30fcb1b02170c44cc8d25062
tree6a3acc1e3b7a798fb4149659b24c17185f78eafd
parent1011742ef95a437d53e4cea23b63e21c62c06a32
Rework ucsc gather to use RDF models for gathering and storing track metadata.

I dumped all of my rdf namespace definitions into rdfhelp.py to comply
with don't-repeat-yourself.

The major step forward for this is I can now specify additional
attributes for a submission that aren't found in the htsworkflow database.

Also the daf model attribute lookup function implements a brute force
owl:sameAs search. (If it can't find the term you asked for, it'll search for
sameAs terms and look for those).

The TestDAFMapper unit test is a bit slow as it needs to check
the htsworkflow server for one of the test cases. I should come
up with a way to preload the required information into the testcase.
extra/ucsc_encode_submission/encode_find.py
extra/ucsc_encode_submission/ucsc_gather.py
htsworkflow/submission/daf.py
htsworkflow/submission/test/test_daf.py
htsworkflow/util/rdfhelp.py