NGSデータ解析
はじめに 集団遺伝学ツールとして有名なArlequin(アルルカン)。 HW平衡からの逸脱を調べたり、遺伝構造の階層を見たりと、何かと重宝する。 しかし、Windows専用というのが、なかなかめんどくさい。 そこで、WineをインストールしてMac上でWindowsソフトを…
はじめに pyRADって何?どうやってインストールするの?って方はこちら↓ pyRADのインストール|OS X ElCapitan (10.11.6) - マクロ生物学徒の備忘録 ここではインストールが済んでいる前提で書きます。 pyRADの使い方は公式サイトのチュートリアルにわりとわ…
pyRADとは 集団遺伝学用の解析ツール。 次世代シーケンサで取得した大量のfastqファイルをde novoでアセンブリして、SNPs情報をアウトプットする。 アウトプットの形式は .nex .phy .str .vcf など、幅広く対応している。 似たようなソフトにStacksがあるが…
はじめに RAD-seqやMIG-seqなどで取得できるSNP情報は、もろもろの解析に使用する前に連鎖不平衡を調べて除去してやる必要がある。 ここではplinkを使用してSNP間の相関係数をペアワイズで計算し、閾値(こちらで設定できる)よりも相関係数が大きな組み合わ…
plinkとは? GWAS解析やQTL解析などに使える便利ツール。 HW平衡からの逸脱や、連鎖不平衡の解析もやってくれるとか。 詳しくはこれから勉強するところ。 インストール とても簡単。ダウンロードして、解凍して、パスを通すだけ。 PLINK: Whole genome data …
FASTX-toolkitとは? FASTX-toolkitはターミナル上で動き、次世代シーケンサによって得られるfastq形式のファイルから、クオリティの低い配列を除去してくれる便利なやつ。 アライメントソフトもクオリティが低いものは使わないようになっていることが多いが…