12c1f55cfdc98b321f9780dfd37f514375ac6ad2
[htsworkflow.git] / htsworkflow / util / schemas / htsworkflow.turtle
1 @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
2 @prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
3 @prefix owl: <http://www.w3.org/2002/07/owl#> .
4 @prefix dc: <http://purl.org/dc/elements/1.1/> .
5 @prefix xml: <http://www.w3.org/XML/1998/namespace> .
6 @prefix xsd: <http://www.w3.org/2001/XMLSchema#> .
7 @prefix htswlib: <http://jumpgate.caltech.edu/wiki/LibraryOntology#> .
8
9 # I'm still learning how to do modeling & validation
10 # this version is just using rdfs:Literal for
11 # any literal node.
12
13 <http://jumpgate.caltech.edu/wiki/LibraryOntology#>
14     dc:title "HTS-Workflow ontology" ;
15     a owl:Ontology .
16
17 htswlib:Class rdfs:subClassOf rdfs:Class ;
18               a rdfs:Class .
19 rdfs:Resource a rdfs:Class.
20
21 htswlib:IlluminaFlowcell
22     a rdfs:Class, htswlib:Class;
23     rdfs:comment "information about a illumina flowcell" ;
24     rdfs:label "Flowcell" .
25
26 htswlib:IlluminaLane
27     a rdfs:Class, htswlib:Class ;
28     rdfs:comment "information specific to a lane in a flowcell" ;
29     rdfs:label "Lane" .
30
31 htswlib:Library
32     a rdfs:Class, htswlib:Class ;
33     rdfs:comment "a biological library that can be run on a flowcell" ;
34     rdfs:label "library" .
35
36 htswlib:Sequencer
37     a rdfs:Class, htswlib:Class;
38     rdfs:comment "an instrument that converts libraries into sequence reads" ;
39     rdfs:label "Sequencer" .
40
41 htswlib:Species
42     a rdfs:Class, htswlib:Class ;
43     rdfs:comment "What 'species' was our sample created from." ;
44     rdfs:label "Species" .
45
46 htswlib:MappedCount
47     a rdfs:Class, htswlib:Class ;
48     rdfs:comment "Count of reads with locations" ;
49     rdfs:label "Mapped locations" .
50
51 # reused properties?
52 htswlib:flowcell
53     a rdf:Property ;
54     rdfs:comment "link to our source flowcell" ;
55     rdfs:label "Flowcell" ;
56     rdfs:domain htswlib:IlluminaLane ;
57     rdfs:range htswlib:IlluminaFlowcell .
58
59 htswlib:has_lane
60     a rdf:Property ;
61     rdfs:comment "which lanes are attached to a flowcell" ;
62     rdfs:label "lanes" ;
63     # cheating, only flowcells & libraries can have lanes
64     rdfs:domain htswlib:Library ;
65     rdfs:domain htswlib:IlluminaFlowcell ;
66     rdfs:range htswlib:IlluminaLane .
67
68 htswlib:date
69     a rdf:Property ;
70     rdfs:comment "Date thing was constructed" ;
71     rdfs:label "made on" ;
72     rdfs:domain htswlib:IlluminaFlowcell ;
73     rdfs:domain htswlib:Library ;
74     rdfs:range xsd:dateTime .
75
76 htswlib:total_unique_locations
77     a rdf:Property ;
78     rdfs:comment "How many reads mapped uniquely" ;
79     rdfs:label "Unique locations" ;
80     rdfs:domain htswlib:Library ;
81     rdfs:domain htswlib:IlluminaLane ;
82     rdfs:range xsd:integer .
83
84 htswlib:has_mappings
85     a rdf:Property ;
86     rdfs:comment "collection of counts against sequence collections" ;
87     rdfs:label "Has mapping" ;
88     rdfs:domain htswlib:Library ;
89     rdfs:domain htswlib:IlluminaLane ;
90     rdfs:range htswlib:MappedCount .
91
92 # flowcell properties
93 htswlib:flowcell_id
94     a rdf:Property ;
95     rdfs:comment "Serial number of a flowcell, used as unique key" ;
96     rdfs:label "Flowcell ID" ;
97     rdfs:domain htswlib:IlluminaFlowcell ;
98     rdfs:range rdfs:Literal .
99
100 htswlib:flowcell_notes
101     a rdf:Property ;
102     rdfs:comment "Comments about flowcell" ;
103     rdfs:label "Notes" ;
104     rdfs:domain htswlib:IlluminaFlowcell ;
105     rdfs:range rdfs:Literal .
106
107 htswlib:control_lane
108     a rdf:Property ;
109     rdfs:comment "Control lane used for image analysis/base calling" ;
110     rdfs:label "Control Lane" ;
111     rdfs:domain htswlib:IlluminaFlowcell ;
112     rdfs:range rdfs:Literal .
113
114 htswlib:read_length
115     a rdf:Property ;
116     rdfs:comment "How many cycles did we run the sequencer for" ;
117     rdfs:label "Read length" ;
118     rdfs:domain htswlib:IlluminaFlowcell ;
119     rdfs:range rdfs:Literal .
120
121 htswlib:flowcell_type
122     a rdf:Property ;
123     rdfs:comment "What kind of flowcell, e.g. single, paired." ;
124     rdfs:label "Flowcell Type" ;
125     rdfs:domain htswlib:IlluminaFlowcell ;
126     rdfs:range rdfs:Literal .
127
128 htswlib:image_software
129     a rdf:Property ;
130     rdfs:comment "Image analysis software name." ;
131     rdfs:label "Image processor" ;
132     rdfs:domain htswlib:IlluminaFlowcell ;
133     rdfs:range rdfs:Literal .
134
135 htswlib:image_version
136     a rdf:Property ;
137     rdfs:comment "Image analysis software version identifier." ;
138     rdfs:label "Image processor version" ;
139     rdfs:domain htswlib:IlluminaFlowcell ;
140     rdfs:range rdfs:Literal .
141
142 htswlib:basecall_software
143     a rdf:Property ;
144     rdfs:comment "Base caller software name." ;
145     rdfs:label "Basecaller" ;
146     rdfs:domain htswlib:IlluminaFlowcell ;
147     rdfs:range rdfs:Literal .
148
149 htswlib:basecall_version
150     a rdf:Property ;
151     rdfs:comment "Base caller software version identifier." ;
152     rdfs:label "Basecaller Version" ;
153     rdfs:domain htswlib:IlluminaFlowcell ;
154     rdfs:range rdfs:Literal .
155
156 htswlib:alignment_software
157     a rdf:Property ;
158     rdfs:comment "Alignment software name." ;
159     rdfs:label "Alignment software" ;
160     rdfs:domain htswlib:IlluminaFlowcell ;
161     rdfs:range rdfs:Literal .
162
163 htswlib:alignment_version
164     a rdf:Property ;
165     rdfs:comment "Alignment software version identifier." ;
166     rdfs:label "Aligner" ;
167     rdfs:domain htswlib:IlluminaFlowcell ;
168     rdfs:range rdfs:Literal .
169
170 htswlib:sequenced_by
171     a rdf:Property ;
172     rdfs:comment "Which sequencer sequenced this flowcell" ;
173     rdfs:label "Sequenced By" ;
174     rdfs:domain htswlib:IlluminaFlowcell ;
175     rdfs:range htswlib:Sequencer .
176
177 htswlib:sequencer_model
178     a rdf:Property ;
179     rdfs:comment "What model of sequencer was this flowcell run on." ;
180     rdfs:label "Sequencer model" ;
181     rdfs:domain htswlib:Sequencer ;
182     rdfs:range rdfs:Literal .
183
184 htswlib:sequencer_instrument
185     a rdf:Property ;
186     rdfs:comment "Sequencer instrument identifier." ;
187     rdfs:label "Instrument ID " ;
188     rdfs:domain htswlib:Sequencer ;
189     rdfs:range rdfs:Literal .
190
191 htswlib:sequencer_name
192     a rdf:Property ;
193     rdfs:comment "Local name for sequencer." ;
194     rdfs:label "Sequencer name " ;
195     rdfs:domain htswlib:Sequencer ;
196     rdfs:range rdfs:Literal .
197
198 # lane properties
199 htswlib:status
200    a rdf:Proprety ;
201    rdfs:comment "Operators opinion of lane status, e.g. were there spots in the pictures" ;
202    rdfs:label "Status" ;
203    rdfs:domain htswlib:IlluminaLane ;
204    rdfs:range htswlib:Literal .
205
206 htswlib:cluster_estimate
207    a rdf:Proprety ;
208    rdfs:comment "Estimate of clusters per tile" ;
209    rdfs:label "Cluster Estimate" ;
210    rdfs:domain htswlib:IlluminaLane ;
211    rdfs:range htswlib:Literal .
212
213 htswlib:pM
214    a rdf:Proprety ;
215    rdfs:comment "picoMolarity" ;
216    rdfs:label "picoMolarity" ;
217    rdfs:domain htswlib:IlluminaLane ;
218    rdfs:range htswlib:Literal .
219
220
221 # library only properties
222 htswlib:library_id
223     a rdf:Property ;
224     rdfs:comment "Library unique identifier" ;
225     rdfs:label "Library ID" ;
226     rdfs:domain htswlib:Library ;
227     rdfs:range rdfs:Literal .
228
229 htswlib:name
230     a rdf:Property ;
231     rdfs:comment "human readable name" ;
232     rdfs:label "Name" ;
233     rdfs:range rdfs:Literal .
234
235 htswlib:library_type
236     a rdf:Property ;
237     rdfs:comment """what type of library are we, which is primarily
238                  determined by the type of adaptors ligated onto
239                  sequence fragments.""" ;
240     rdfs:label "Library Type" ;
241     rdfs:domain htswlib:Library ;
242     rdfs:range rdfs:Literal .
243
244 htswlib:condition
245    a rdf:Property ;
246    rdfs:comment "Describes what treatment has been applied to the cells" ;
247    rdfs:label "Condition" ;
248    rdfs:domain htswlib:Library ;
249    rdfs:range rdfs:Literal .
250
251 htswlib:stopping_point
252     a rdf:Property ;
253     rdfs:comment "Protocol stopping point" ;
254     rdfs:label "Stopping Point" ;
255     rdfs:domain htswlib:Library ;
256     rdfs:range rdfs:Literal .
257
258 htswlib:concentration
259     a rdf:Property ;
260     rdfs:comment "Concentration of sample in nanograms per microliter" ;
261     rdfs:label "Concentration" ;
262     rdfs:domain htswlib:Library ;
263     rdfs:range rdfs:Literal .
264
265 htswlib:insert_size
266     a rdf:Property ;
267     rdfs:comment "The expected size of the sample sequence" ;
268     rdfs:label "Insert Size" ;
269     rdfs:domain htswlib:Library ;
270     rdfs:range rdfs:Literal .
271
272 htswlib:gel_cut
273     a rdf:Property ;
274     rdfs:comment "The estimated fragment sizes cut from gel";
275     rdfs:label "Gel Cut" ;
276     rdfs:domain htswlib:Library ;
277     rdfs:range xsd:decimal .
278
279 htswlib:made_by
280     a rdf:Property ;
281     rdfs:comment "Name of person who created library" ;
282     rdfs:label "Made by" ;
283     rdfs:domain htswlib:Library ;
284     rdfs:range rdfs:Literal .
285
286 htswlib:multiplex_index
287     a rdf:Property ;
288     rdfs:comment "multiplex sequence" ;
289     rdfs:label "index" ;
290     rdfs:domain htswlib:Library ;
291     rdfs:range rdfs:Literal .
292
293 htswlib:cell_line
294     a rdf:Property ;
295     rdfs:comment "Description of source material" ;
296     rdfs:label "cell line" ;
297     rdfs:domain htswlib:Library ;
298     rdfs:range rdfs:Literal .
299
300 htswlib:experiment_type
301     a rdf:Property ;
302     rdfs:comment "What type of sequencing is this. e.g. RNA-Seq, DeNovo etc." ;
303     rdfs:label "Experiment Type" ;
304     rdfs:domain htswlib:Library ;
305     rdfs:range rdfs:Literal .
306
307 htswlib:affiliation
308     a rdf:Property ;
309     rdfs:comment "Entity associated with this sample" ;
310     rdfs:label "affiliation" ;
311     rdfs:domain htswlib:Library ;
312     rdfs:range rdfs:Literal .
313
314 htswlib:species
315     a rdf:Property ;
316     rdfs:comment "Scientific name of sample species" ;
317     rdfs:label "Species" ;
318     rdfs:domain htswlib:Library ;
319     #rdfs:domain htswlib:IlluminaLane;
320     rdfs:range htswlib:Species .
321
322 htswlib:replicate
323     a rdf:Property ;
324     rdfs:comment "Which replicate this was" ;
325     rdfs:label "replicate" ;
326     rdfs:domain htswlib:Library ;
327     rdfs:range rdfs:Literal .
328
329 # lane only properties
330 htswlib:lane_number
331     a rdf:Property ;
332     rdfs:comment "Which lane were we run in" ;
333     rdfs:label "lane id" ;
334     rdfs:domain htswlib:IlluminaLane ;
335     rdfs:range xsd:string .
336
337 # FIXME: should this be note?
338 htswlib:comment
339     a rdf:Property ;
340     rdfs:comment "Comment about an object" ;
341     rdfs:range rdfs:Literal .
342
343 htswlib:library
344      a rdf:Property ;
345      rdfs:comment "which library was run on this lane." ;
346      rdfs:label "Library" ;
347      rdfs:domain htswlib:IlluminaLane ;
348      rdfs:range htswlib:Library .
349
350 # species properites
351 htswlib:species_name
352      a rdf:Property ;
353      rdfs:comment "Scientific name of species" ;
354      rdfs:label "Species" ;
355      rdfs:domain htswlib:Species ;
356      rdfs:range rdfs:Literal .
357
358 # mapped count properties
359 htswlib:mapped_to
360      a rdf:Property ;
361      rdfs:comment "A sequence collection, genome, chromosome, spike in, etc.";
362      rdfs:label "Mapped to" ;
363      rdfs:domain htswlib:MappedCount ;
364      rdfs:range rdfs:Literal .
365
366 htswlib:reads
367      a rdf:Property ;
368      rdfs:comment "Number of read locations" ;
369      rdfs:label "Reads" ;
370      rdfs:domain htswlib:MappedCount ;
371      rdfs:range rdfs:Literal .