ATAC-seq分析：数据处理（5）

1. 子集划分我们可能希望将比对的读数分成代表核小体游离和核小体占据的读数。在这里，我们通过使用插入大小来过滤读取，为代表无核小体、单核小体和双核小体的读取创建 BAM 文件。atacReads_NucFree <- atacReads[insertSizes < 100, ]atacReads_MonoNuc <-&n

冷冻工厂

648人浏览 · 2023-01-08 16:55:24

冷冻工厂 · 2023-01-08 16:55:24 发布

1. 子集划分

我们可能希望将比对的读数分成代表核小体游离和核小体占据的读数。在这里，我们通过使用插入大小来过滤读取，为代表无核小体、单核小体和双核小体的读取创建 BAM 文件。

atacReads_NucFree <- atacReads[insertSizes < 100, ]
atacReads_MonoNuc <- atacReads[insertSizes > 180 & insertSizes < 240, ]
atacReads_diNuc <- atacReads[insertSizes > 315 & insertSizes < 437, ]

2. BAM创建

读取的结果可以写回 BAM 文件，用于我们分析的其他部分，或者通过 rtracklayer 包中的函数在 IGV 等程序中进行可视化。

nucFreeRegionBam <- gsub("\\.bam", "_nucFreeRegions\\.bam", sortedBAM)
monoNucBam <- gsub("\\.bam", "_monoNuc\\.bam", sortedBAM)
diNucBam <- gsub("\\.bam", "_diNuc\\.bam", sortedBAM)

library(rtracklayer)
export(atacReads_NucFree, nucFreeRegionBam, format = "bam")
export(atacReads_MonoNuc, monoNucBam, format = "bam")
export(atacReads_diNuc, diNucBam, format = "bam")

3. 创建 GRanges 片段

我们可以从单端读取中重新创建全长片段，以评估重复率并创建片段的 bigwig。在这里，我们使用 granges() 函数从配对的单端读取中重新创建完整片段。

atacReads[1, ]

atacFragments <- granges(atacReads)
atacFragments[1, ]

我们可以使用 duplicated() 函数来识别我们的全长片段的非冗余（非重复）部分。

duplicatedFragments <- sum(duplicated(atacFragments))
totalFragments <- length(atacFragments)
duplicateRate <- duplicatedFragments/totalFragments
nonRedundantFraction <- 1 - duplicateRate
nonRedundantFraction

4. 创建 bigWig

通过创建一个 bigWig 文件，我们可以大大加快在基因组浏览器中查看 ATACseq 信号堆积的速度。此时可以对总映射读取进行额外的标准化。

openRegionRPMBigWig <- gsub("\\.bam", "_openRegionRPM\\.bw", sortedBAM)
myCoverage <- coverage(atacFragments, weight = (10^6/length(atacFragments)))
export.bw(myCoverage, openRegionRPMBigWig)

欢迎Star -> 学习目录

更多教程 -> 转录组测序分析教程合集

更多教程 -> 单细胞系列教程：合集

本文由 mdnice 多平台发布

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

【计算机视觉】Pixel逐像素分类&Mask掩码分类理解摘要

魔乐社区

计算机视觉（opencv）实战三十二——CascadeClassifier 人脸微笑检测（摄像头）

本文从原理到实现，详细介绍了基于 OpenCV Haar 分类器的人脸与微笑检测：讲解了 Haar 特征和级联检测原理。对代码逐行拆解并解释参数含义。画出完整流程图，帮助理解执行过程。给出了常见问题和优化建议，甚至扩展到深度学习方法。这种方法简单、轻量、实时性好，非常适合入门和小型应用项目。但如果需要更高准确率和更强鲁棒性，建议使用深度学习检测器替代 Haar 分类器。