Fastq、Fasta文件操作

用Linux命令行或软件对Fastq、Fasta文件进行操作

fastq转换为fasta

1
awk '{if(NR%4 == 1){print ">" substr($0, 2)}}{if(NR%4 == 2){print}}' $fastq > $fasta

fasta去重

1
fastx_toolkit_0.0.13/bin/fastx_collapser -i Target.fa -o Target.dedup.fa

fastq提取并统计某个部分碱基序列

1
2
# 这里举例的是第101个碱基~最后一个碱基
less $fastq | sed -n '0~2p' | sed -n '1~2p' | cut -c 101- | sort | uniq -c | sed -r 's/^\s+//' | sed 's/\s/\t/' > $stat_tsv