erange version 4.0a dev release
[erange.git] / regionBins.py
index 2d1649bd6614066656a0ef72a75aa7a90a4ffffc..d6c858de23c670a8526459bf41ba25dc807ac78d 100755 (executable)
@@ -10,14 +10,15 @@ except:
     print 'psyco not running'
 
 import sys
+import ReadDataset
+from commoncode import getMergedRegions, computeRegionBins
+
 print '%s: version 2.0' % sys.argv[0]
 
 if len(sys.argv) < 4:
     print 'usage: python %s regionfile rdsfile outfilename [-bins numbins] [-field fieldNum] [-raw] [-padregion bp] [-mergeregion bp] [-cache]' % sys.argv[0]
     sys.exit(1)
 
-from commoncode import *
-
 regionfilename = sys.argv[1]
 hitfile =  sys.argv[2]
 outfilename = sys.argv[3]
@@ -55,7 +56,7 @@ if '-bins' in sys.argv:
     binfield = sys.argv.index('-bins') + 1
     bins = int(sys.argv[binfield])
 
-hitRDS = readDataset(hitfile, verbose = True, cache=doCache)
+hitRDS = ReadDataset.ReadDataset(hitfile, verbose=True, cache=doCache)
 readlen = hitRDS.getReadSize()
 normalizationFactor = 1.0
 if normalize:
@@ -65,7 +66,7 @@ if normalize:
 chromList = hitRDS.getChromosomes(fullChrom=False)
 chromList.sort()
 
-regionDict = getMergedRegions(regionfilename, maxDist = mergeregion, keepLabel = True, verbose = True, chromField = cField, pad=padregion)
+regionDict = getMergedRegions(regionfilename, maxDist=mergeregion, keepLabel=True, verbose=True, chromField=cField, pad=padregion)
 
 hitDict = hitRDS.getReadsDict(doMulti=True, findallOptimize=True)
 
@@ -76,6 +77,7 @@ for regionID in regionsBins:
     tagCount = 0.
     for binAmount in regionsBins[regionID]:
         tagCount += binAmount
+
     outfile.write('%s\t%s\t%.1f\t%d' % (regionID, regionID, tagCount, Len[gid]))
     for binAmount in gidBins[gid]:
             if normalizeBins: