# Uploaded 0.1.13 to Sid.
[samtools.git] / bamtk.c
1 #include <stdio.h>
2 #include <unistd.h>
3 #include <assert.h>
4 #include <fcntl.h>
5 #include "bam.h"
6
7 #ifdef _USE_KNETFILE
8 #include "knetfile.h"
9 #endif
10
11 int bam_taf2baf(int argc, char *argv[]);
12 int bam_pileup(int argc, char *argv[]);
13 int bam_mpileup(int argc, char *argv[]);
14 int bam_merge(int argc, char *argv[]);
15 int bam_index(int argc, char *argv[]);
16 int bam_sort(int argc, char *argv[]);
17 int bam_tview_main(int argc, char *argv[]);
18 int bam_mating(int argc, char *argv[]);
19 int bam_rmdup(int argc, char *argv[]);
20 int bam_flagstat(int argc, char *argv[]);
21 int bam_fillmd(int argc, char *argv[]);
22 int bam_idxstats(int argc, char *argv[]);
23 int main_samview(int argc, char *argv[]);
24 int main_import(int argc, char *argv[]);
25 int main_reheader(int argc, char *argv[]);
26 int main_cut_target(int argc, char *argv[]);
27 int main_phase(int argc, char *argv[]);
28
29 int faidx_main(int argc, char *argv[]);
30 int glf3_view_main(int argc, char *argv[]);
31
32 int bam_tagview(int argc, char *argv[])
33 {
34         bamFile fp;
35         bam_header_t *header;
36         bam1_t *b;
37         char tag[2];
38         int ret;
39         if (argc < 3) {
40                 fprintf(stderr, "Usage: samtools tagview <in.bam> <tag>\n");
41                 return 1;
42         }
43         fp = strcmp(argv[1], "-")? bam_open(argv[1], "r") : bam_dopen(fileno(stdin), "r");
44         assert(fp);
45         header = bam_header_read(fp);
46         if (header == 0) {
47                 fprintf(stderr, "[bam_view] fail to read the BAM header. Abort!\n");
48                 return 1;
49         }
50         tag[0] = argv[2][0]; tag[1] = argv[2][1];
51         b = (bam1_t*)calloc(1, sizeof(bam1_t));
52         while ((ret = bam_read1(fp, b)) >= 0) {
53                 uint8_t *d = bam_aux_get(b, tag);
54                 if (d) {
55                         printf("%s\t%d\t", bam1_qname(b), b->core.flag);
56                         if (d[0] == 'Z' || d[0] == 'H') printf("%s\n", bam_aux2Z(d));
57                         else if (d[0] == 'f') printf("%f\n", bam_aux2f(d));
58                         else if (d[0] == 'd') printf("%lf\n", bam_aux2d(d));
59                         else if (d[0] == 'A') printf("%c\n", bam_aux2A(d));
60                         else if (d[0] == 'c' || d[0] == 's' || d[0] == 'i') printf("%d\n", bam_aux2i(d));
61                         else if (d[0] == 'C' || d[0] == 'S' || d[0] == 'I') printf("%u\n", bam_aux2i(d));
62                         else printf("\n");
63                 }
64         }
65         if (ret < -1) fprintf(stderr, "[bam_view] truncated file? Continue anyway. (%d)\n", ret);
66         free(b->data); free(b);
67         bam_header_destroy(header);
68         bam_close(fp);
69         return 0;
70 }
71
72 static int usage()
73 {
74         fprintf(stderr, "\n");
75         fprintf(stderr, "Program: samtools (Tools for alignments in the SAM format)\n");
76         fprintf(stderr, "Version: %s\n\n", BAM_VERSION);
77         fprintf(stderr, "Usage:   samtools <command> [options]\n\n");
78         fprintf(stderr, "Command: view        SAM<->BAM conversion\n");
79         fprintf(stderr, "         sort        sort alignment file\n");
80         fprintf(stderr, "         pileup      generate pileup output\n");
81         fprintf(stderr, "         mpileup     multi-way pileup\n");
82         fprintf(stderr, "         faidx       index/extract FASTA\n");
83 #if _CURSES_LIB != 0
84         fprintf(stderr, "         tview       text alignment viewer\n");
85 #endif
86         fprintf(stderr, "         index       index alignment\n");
87         fprintf(stderr, "         idxstats    BAM index stats (r595 or later)\n");
88         fprintf(stderr, "         fixmate     fix mate information\n");
89         fprintf(stderr, "         glfview     print GLFv3 file\n");
90         fprintf(stderr, "         flagstat    simple stats\n");
91         fprintf(stderr, "         calmd       recalculate MD/NM tags and '=' bases\n");
92         fprintf(stderr, "         merge       merge sorted alignments\n");
93         fprintf(stderr, "         rmdup       remove PCR duplicates\n");
94         fprintf(stderr, "         reheader    replace BAM header\n");
95         fprintf(stderr, "         targetcut   cut fosmid regions (for fosmid pool only)\n");
96         fprintf(stderr, "         phase       phase heterozygotes\n");
97         fprintf(stderr, "\n");
98 #ifdef _WIN32
99         fprintf(stderr, "\
100 Note: The Windows version of SAMtools is mainly designed for read-only\n\
101       operations, such as viewing the alignments and generating the pileup.\n\
102       Binary files generated by the Windows version may be buggy.\n\n");
103 #endif
104         return 1;
105 }
106
107 int main(int argc, char *argv[])
108 {
109 #ifdef _WIN32
110         setmode(fileno(stdout), O_BINARY);
111         setmode(fileno(stdin),  O_BINARY);
112 #ifdef _USE_KNETFILE
113         knet_win32_init();
114 #endif
115 #endif
116         if (argc < 2) return usage();
117         if (strcmp(argv[1], "view") == 0) return main_samview(argc-1, argv+1);
118         else if (strcmp(argv[1], "import") == 0) return main_import(argc-1, argv+1);
119         else if (strcmp(argv[1], "pileup") == 0) return bam_pileup(argc-1, argv+1);
120         else if (strcmp(argv[1], "mpileup") == 0) return bam_mpileup(argc-1, argv+1);
121         else if (strcmp(argv[1], "merge") == 0) return bam_merge(argc-1, argv+1);
122         else if (strcmp(argv[1], "sort") == 0) return bam_sort(argc-1, argv+1);
123         else if (strcmp(argv[1], "index") == 0) return bam_index(argc-1, argv+1);
124         else if (strcmp(argv[1], "idxstats") == 0) return bam_idxstats(argc-1, argv+1);
125         else if (strcmp(argv[1], "faidx") == 0) return faidx_main(argc-1, argv+1);
126         else if (strcmp(argv[1], "fixmate") == 0) return bam_mating(argc-1, argv+1);
127         else if (strcmp(argv[1], "rmdup") == 0) return bam_rmdup(argc-1, argv+1);
128         else if (strcmp(argv[1], "glfview") == 0) return glf3_view_main(argc-1, argv+1);
129         else if (strcmp(argv[1], "flagstat") == 0) return bam_flagstat(argc-1, argv+1);
130         else if (strcmp(argv[1], "tagview") == 0) return bam_tagview(argc-1, argv+1);
131         else if (strcmp(argv[1], "calmd") == 0) return bam_fillmd(argc-1, argv+1);
132         else if (strcmp(argv[1], "fillmd") == 0) return bam_fillmd(argc-1, argv+1);
133         else if (strcmp(argv[1], "reheader") == 0) return main_reheader(argc-1, argv+1);
134         else if (strcmp(argv[1], "targetcut") == 0) return main_cut_target(argc-1, argv+1);
135         else if (strcmp(argv[1], "phase") == 0) return main_phase(argc-1, argv+1);
136 #if _CURSES_LIB != 0
137         else if (strcmp(argv[1], "tview") == 0) return bam_tview_main(argc-1, argv+1);
138 #endif
139         else {
140                 fprintf(stderr, "[main] unrecognized command '%s'\n", argv[1]);
141                 return 1;
142         }
143         return 0;       
144 }