Linux学习资源:
1.4文本处理 wget RUL ##从制定的URL下载文件 cat name ##查看文件类型 man wget ##查看WGET说明书 wc filename ##查看文件的字数、行数、列数等 head -n filename ##查看文件前n行 tail -n filename ##查看文件最后n行 more filenam ##查看文档,按Q退出,空格键向下翻阅 less -S filname ##将文档精简,看的更清晰 grep xxxx filename ##查找文件中的xxxx并print cat -n filename |grep xxxx > names.file ##管道符号,代表将前面的数据进行后面的处理## cut -f 1 filename ##截取文件中第一列的数据 cut -f 1-3 test.bed |awk '{print "xxxx"$1":"$2","$3}' > new ##将cut提取出的文档打印出第1、2、3列并在列之间加东西## sort -k2,2nr test.bed ##test.bed第二列数值的倒序排列## 函数 --help ##查看帮助文档 tar -zxvf filenam ##解压压缩文件 学习过程中遇到的问题 ①Q:Unable to locate package错误解决办法 A:sudo apt-get update ②Q:部分命令如tree、bedtools无法使用 A:apt install package 安装package后使用 Linux20题 第八题、下载 http://www.biotrainee.com/jmzeng/igv/test.bed 文件,后在里面选择含有 H3K4me3 的那一行是第几行,该文件总共有几行。 wget http://www.biotrainee.com/jmzeng/igv/test.bed ##下载 cat -n test.bed ##查看文件有多少行 cat -n test.bed |grep H3K4me3 ##查看H3K4me3在哪一行 第九题、下载 http://www.biotrainee.com/jmzeng/rmDuplicate.zip 文件,并且解压,查看里面的文件夹结构 wget URL ##下载 apt install unzip ##安装解压zip文件工具 apt install tree ##安装tree tree rmDuplicate.zip ##查看文件夹结构 第十题、打开第九题解压的文件,进入 rmDuplicate/samtools/single 文件夹里面,查看后缀为 .sam 的文件,搞清楚 生物信息学里面的SAM/BAM 定义是什么。 cd samtools/ cd single/ more tmp.sam less -S tmp.sam SAM格式定义:浅谈SAM格式 SAM的全称是sequence alignment/map format。而BAM就是SAM的二进制文件(B源自binary)。 1.5软件安装 生物信息学常见1000个软件的安装方式 http://www.biotrainee.com/thread-856-1-1.html conda的安装 https://www.jianshu.com/p/edaa744ea47d conda config --set show_channel_urls yes ##显示安装的频道 conda config --get channels ##查看已添加的chanels vim ~/.condarc ##已添加的chanels在哪里查看 conda install gatk ##安装gatk package ---------------------------------------------------------------------------------------------------------------------- 我们尊重原创,也注重分享,文章来源于微信公众号:生物信息技术分析学习杂记,建议关注公众号查看原文。如若侵权请联系qter@qter.org。 ---------------------------------------------------------------------------------------------------------------------- |