自動運転開発を加速する日本
国内実走行データを中核とした
高品質オープンデータセットの
ご提供

自動運転システムの研究・先行開発において、学習・評価に用いるデータセットの質と適合性は、開発スピードと到達レベルを大きく左右する極めて重要な要素です。こうした状況を鑑み、当社は経済産業省令和6年度補正事業「地域の移動課題解決に向けた自動運転サービス開発・実証支援事業」の成果として、
日本国内のデータを中核とするオープンデータセットを構築しました。本データセットは、自動車OEM、Tier1企業、および学術機関による自動運転の研究開発を支援することを目的としています。
ティアフォーは、自動運転システムのオープンソース化に加え、本データセットの公開を通じ、自動運転技術のさらなる「民主化」に貢献してまいります。

本事業の概要

本事業は、地域が抱える移動課題の解決に向け、自動運転技術の社会実装を加速することを目的としています。特に、研究・先行開発段階においてボトルネックとなりがちな高品質な
データへのアクセス不足を解消するため、産業界で幅広く活用可能なデータ基盤の整備が
求められてきました。当社はこの取り組みの中で、商用開発でも実利用可能な品質水準を
意識したデータセットを設計・構築しています。

データセットについて
(最終更新: 2026年2月)

今回公開するデータセットは、計測車両から得られた「実走行データ」と、エッジケース
拡充のために生成AIで構築した「仮想データ」の2種に大別されます。実走行データは、
日本全国の広範な環境を網羅する「データセット1」と、自動運転サービスの実装を想定し
特定領域を高密度にカバーする「データセット2」から成り、各々の目的に応じた
センサー構成を備えています。

また、実環境では収集が困難な事象を補完するため、生成AIによる仮想データ「データセット3」を用意しました。これには、画像内に仮想オブジェクト配置による動画生成を
用いた「3-1」と、既存の実走行データに対し時間帯や天候の条件を変換した「3-2」の2つのアプローチが含まれます。

データセット1

乗用車に搭載したセンサーで取得した、広範囲・大規模データ

  • 100時間分(1クリップあたり30秒)

    センサーデータ

    • カメラ8台 20Hz

    • LiDAR 4台 10Hz

  • 走行場所

    • 日本全国

  • アノテーションデータ

    • 2Dパノプティックセグメンテーション

    • 2D 信号認識

    • 3D バウンディングボックス

データセット2

ロボットタクシー車両で取得した特定ドメイン適合用データ

  • 約1時間分 (1クリップ
    あたり60秒)

  • 走行場所

    • 東京都お台場周辺

  • アノテーションデータ

    • 2Dパノプティックセグメンテーション

    • 2D 信号認識

    • 3D バウンディングボックス

データセット3

エッジケース補完のための仮想合成データ

データセット3-1 
(インペイント型)

  • 約1時間分

  • アノテーションデータ

    • 2Dパノプティックセグメンテーション

データセット3-2 

  • 約1時間分

  • アノテーションデータ

    • 2Dパノプティックセグメンテーション

利用申し込みについて

本データセットのサンプルデータ(各データセット1シーン)を、Google Driveにて公開しております。 全データセット(約100時間相当)のご利用を希望される場
合は、利用規約への同意と、申込書によるお手続きが必要となります。以下のリンクより利用申込書をダウンロードいただき、必要事項をご記入の上、
下記メールアドレスまでお送りください。

お問い合わせ・利用申込書の送付先: dataset-2025@tier4.jp