CONTACT
Technology

GBIF Backbone Taxonomy の活用と実装戦略

約7分で読めます

概要

IKIMONの種リスト(分類体系)は、世界最大級の生物多様性データ基盤である GBIF (Global Biodiversity Information Facility) が管理する GBIF Backbone Taxonomy に完全準拠します。 これは、従来の多くの国内アプリが採用してきた「独自リスト」や「国内限定リスト(YListなど)」とは一線を画す、野心的な技術選定です。

なぜGBIF準拠が革新的なのか?

1. 国際標準ID (NubKey) による相互運用性

GBIF Backboneには、生物種ごとに一意のID(NubKey)が振られています。これをIKIMONの内部IDとして採用することで、以下のメリットが生まれます。
  • 海外データとの結合:将来的にiNaturalistやeBirdなど、海外の巨大プラットフォームからデータを取り込んだり、逆に提供したりする際、IDベースで瞬時にデータ結合が可能になります。
  • 学名の「揺らぎ」の吸収:生物分類は日々変更され、同じ種でも複数の学名(シノニム)が存在するカオスな世界です。GBIF Backboneはこのシノニム関係を整理しており、「古い学名で検索しても、現在の正しい種にヒットする」仕組みを自動的に享受できます。

2. 「ローカルな発見」を「グローバルな科学」へ

国内独自の分類コードを使っていると、集めたデータは「日本国内でしか通用しないローカルデータ」になりがちです。 最初からGBIF準拠で作られたIKIMONのデータは、そのまま世界中の研究者が利用可能なフォーマット(Darwin Core準拠)となります。 ユーザーに対し、「あなたの投稿は、即座に世界の科学に貢献できる状態にある」と胸を張って言える、これが最大の価値です。

なぜこれまで実現が難しかったのか?(技術・運用の壁)

これまで多くのサービスが独自リストに走ったのには、明確な理由(障壁)がありました。

1. 「和名」のカバレッジ問題

GBIFは国際機関であり、基本言語は「学名(ラテン語)」と「英語」です。 日本語の「和名」も登録されていますが、日本の図鑑や学会が採用している標準和名と完全に一致していない(欠落・誤字・俗称の混入)ケースが多々ありました。 → IKIMONの対策: GBIFを正(マスター)としつつ、日本固有の「標準和名リスト(日本産生物目録など)」をサブレイヤーとして被せるハイブリッド構造で解決します。

2. 分類体系の不一致(Taxonomic Conflict)

日本の植物学会などで使われている分類体系と、GBIFが採用している体系が食い違うことがよくあります(科が変わっているなど)。 ユーザーから「手持ちの図鑑と違う!」と指摘されるリスクがあるため、多くの事業者は国内図鑑に合わせる道を選びました。 → IKIMONの対策: UI上で「国内では〇〇科とされることもあります」と注記を出すなど、データの正確性とユーザーの利便性を両立させるUI設計でカバーします。

3. パフォーマンスの問題

GBIFのAPIは膨大で、検索に時間がかかることがあります。アプリのサクサク感を損なう恐れがありました。 → IKIMONの対策: Backboneデータ全体を定期的にダウンロードし、自社の高速検索サーバー(Elasticsearch等)にインデックス化することで、通信ラグをゼロにします。

実装方針:GBIF Backbone API の活用

基本アーキテクチャ

リアルタイムでGBIFのAPIを叩くのではなく、「定期同期型の自社ミラーAPI」を構築します。
  1. 定期インポート:GBIFから `backbone-current.zip`(全分類データ)と `VernacularName.tsv`(多言語名)を取得。
  2. フィルタリング:日本国内に生息する種(JBIFのリスト等を参照)にフラグ立てを行い、検索優先度を上げる。
  3. 検索API:ユーザーが「カブトムシ」と入力した際、まずは自社DBの和名インデックスを検索し、対応する `NubKey` を特定。紐付く学名や階層情報を返す。

活用する主要APIエンドポイント

(※開発時の参照用)
  • Match API (`/species/match`): 文字列から種を推定する。曖昧検索に強い。
  • Name Parser (`/parser/name`): 学名の文字列を属・種小名などに分解する。
  • Search API (`/species/search`): 複雑な条件(階層、生息状況など)での検索。

まとめ

GBIF Backbone Taxonomyへの準拠は、初期の開発コスト(名寄せやシステム構築)は高いものの、長期的には「分類メンテナンスコストの外部化(GBIFに任せる)」「データの国際的価値の最大化」という計り知れないリターンをもたらします。 これは、IKIMONが集めるデータが単なる趣味の記録にとどまらず、「信頼性の高い科学データ」として活用されるための重要な技術的基盤です。

IKIMONが目指すもの

技術的な話は難しく聞こえるかもしれません。 でも、私たちが伝えたいのはシンプルなこと。

「あなたが撮った1枚が、世界の科学に貢献できる。」

日本のどこかで撮った写真が、そのまま世界中の研究者が参照できるデータになる。 そんな仕組みを、私たちは作ろうとしています。

地域の発見を、世界の知識へ。 IKIMONは、そのための「日本と世界をつなぐ」データ基盤です。

参考文献

  • GBIF. The GBIF Backbone Taxonomy. https://www.gbif.org/dataset/d7dddbf4-2cf0-4f39-9b2a-bb099caae36c
  • iNaturalist. Managing Taxonomy. https://www.inaturalist.org/pages/curator+guide#taxonomy

3 / 6