- あのデータベースが、丸ごとダウンロード可能に!-

生命科学系データベースアーカイブ

PGDBj - オルソログデータベース

Cluster (緑色植物)

データ説明

info データ名 Cluster (緑色植物)
info バージョン info データ内容の説明

NCBI Reference Sequenceデータベースから取得した緑色植物のアミノ酸配列を配列間のBLASTによる網羅的なホモロジー情報に基づいて各系統群ごとにクラスタリ ングしたデータ。各系統群では1つのアミノ酸配列は必ず1つのクラスターに所属する。

info データファイル
データファイル名:
pgdbj_ortholog_db_viridiplantae_cluster.zip
ファイルサイズ:
16.6 MB
info 簡易検索URL info データ取得方法

Protein (緑色植物)のデータを使用。

info 解析方法

NCBI Taxonomyデータベースから取得した生物種間の系統関係を遡る方向に下位系統群でのクラスター(subcluster)を併合して上位系統群でのク ラスター(supercluster)を再帰的に生成している。

info データ件数

2,310,444 件

データ詳細

項目名項目の説明
Cluster ID オルソログクラスターに付けられるID
各系統群でのオルソログクラスタは0からの通し番号(「クラスターID」)を付けて管理されている。異なった系統群での「クラスターID」を区別するためにTaxonomy IDを":"(コロン)で繋げて管理する。例えば、Taxonomy IDが"33090"の系統群の0番目の「クラスターID」は"33090:0"となる。「クラスターID」は「オルソログDB」が独自に付けているものである。
Cluster size クラスターに所属するアミノ酸配列数
Supercluster 1つ上位の系統群でのクラスターID
Subcluster 1つ下位の系統群でのクラスターID

AltStyle によって変換されたページ (->オリジナル) /