2008年6月4日水曜日

遺伝子分布の傾向をみる(1-2) 、データ取得:UCSC

[2] UCSC Genome Bioinfomatics
http://hgdownload.cse.ucsc.edu/downloads.html

染色体上の遺伝子位置のデータを取得する方法を示す。
~~~
(1)
VERTEBRATES - Complete annotation sets
で、参照したい対象生物を選択する。
~~~
(2)
例)ヒトの場合、「Human」を選択する。
~~~
(3)
「Full data set」を選択。
~~~
(4)
先頭のファイル:chromAgp.zip をダウンロードする。
※これ以外のファイルに関しては、内容未確認! ※TODO※
~~~
(5)
chromAgp.zipを展開すると、染色体ごとのファイルができる。
例)染色体1番=chr1.agp ※テキストエディタで開ける。
chr1.agp の先頭を抜粋する。
:見出しはなく、生データがそのまま。
===
chr1 1 616 1 F AP006221.1 36116 36731 -
chr1 617 167280 2 F AL627309.15 241 166904 +
......
2項目、3項目目が遺伝子の開始位置、終了位置であると思われる。
~~~
(6)
2項目、3項目目を、OpenOffice OpenDocument表計算でCSV形式にする。
~~~
(7)
対象生物を変更して、同様にCSV形式のファイルを作成する。

0 件のコメント: