DEV Community

NexGenData
NexGenData

Posted on • Originally published at thenextgennexus.com

法人番号API実践:国税庁レジストリから日本企業500万社を構造化JSONで検索(コード付き)

日本企業のKYC(取引先審査)、B2B営業のリスト作成、M&A;のデューデリジェンス——どれも「正確な企業マスタ」が出発点です。国税庁の法人番号 公表データは、日本のほぼ全法人(500万社超)を網羅する公式オープンデータ(CC BY 4.0)ですが、そのままだと一件ずつ手で引くしかなく、業務に組み込むには整形と一括取得の仕組みが要ります。

この記事では、Apify 上の Japan Corporate Registry(法人番号 企業登記) Actor を紹介します。国税庁の法人番号レジストリを検索し、法人番号・商号(漢字/カナ/英語)・所在地・都道府県・法人種別・状態などを構造化 JSON で返します。クラウド実行・従量課金で、無料枠から始められます。

1. 課題:公式データはあるが、業務に組み込みにくい

  • 一括取得が前提でない。 公表サイトは個別照会向きで、リスト化・自動化には不向き。
  • 表記ゆれ。 漢字・カナ・英語表記、所在地の整形を自前で揃える必要がある。
  • 差分管理。 新設・商号変更・登記状態の更新を追うのが手間。
  • 他データとの突合。 営業リストや与信データと法人番号で名寄せしたいが、キーが揃わない。

2. このActorでできること

法人番号そのものでの照会、商号(社名)フィルタ、都道府県フィルタ(47都道府県)、法人種別フィルタ(株式会社等/外国法人/合同会社)での検索に対応します。出典は国税庁の法人番号公表データ(CC BY 4.0 の公式オープンデータ)です。

主な入力パラメータ:corporate_number(法人番号)、company_name_filter(商号)、prefecture_filter(都道府県)、category_filter(法人種別)、max_records(最大取得件数、既定 200)、nta_api_key(任意:国税庁アプリケーションID)。

3. こんな方におすすめ

  • KYC/コンプラ: 取引先の法人番号・登記状態を一括で確認。
  • B2B営業/RevOps: 都道府県・業種で企業リストを抽出し、法人番号で名寄せ。
  • M &A;/調査: 候補企業の正式名称・所在地・種別をデューデリの起点に。
  • データ基盤: 公式の企業マスタを自社DBに取り込み、キーとして活用。

4. 出力フィールド例

フィールド 内容
corporate_number 法人番号(13桁)
company_name / company_name_kana / company_name_en 商号(漢字 / カナ / 英語)
prefecture / prefecture_jp / city / address 都道府県 / 市区町村 / 所在地
corporate_type / category 法人種別 / 区分
status 登記状態
registration_date / last_change_date 登記日 / 最終変更日
source_url / data_source 出典リンク / データソース

1社あたりの JSON はおおよそ次のような形です:


    {
      "corporate_number": "1234567890123",
      "company_name": "サンプル株式会社",
      "company_name_kana": "サンプルカブシキガイシャ",
      "company_name_en": "Sample Inc.",
      "prefecture_jp": "東京都",
      "city": "千代田区",
      "corporate_type": "株式会社",
      "status": "登記",
      "data_source": "NTA 法人番号"
    }
Enter fullscreen mode Exit fullscreen mode

※ 値はフォーマット例示用のサンプルです。実データは実行時に取得されます。

5. 活用例

  • 地域別リスト: prefecture_filter で特定エリアの法人を抽出。
  • 名寄せキー付与: 既存リストに法人番号を付け、与信・営業データと突合。
  • 新設モニタリング: 定期実行で新規登記・商号変更を検知。
  • 正式名称の正規化: 漢字・カナ・英語表記を一括取得して表記統一。

6. Apify で実行する

Actor ページ:Japan Corporate Registry on Apify。新規登録で $5 の無料クレジットこちらから登録)。


    from apify_client import ApifyClient

    client = ApifyClient("YOUR_APIFY_TOKEN")
    run = client.actor("nexgendata/japan-houjin-bangou-corporate-registry").call(run_input={
        "company_name_filter": "ソフト",
        "prefecture_filter": "Tokyo",
        "max_records": 100,
    })

    for item in client.dataset(run["defaultDatasetId"]).iterate_items():
        print(item["corporate_number"], item["company_name"], item["city"])

Enter fullscreen mode Exit fullscreen mode

料金:いくらかかる?

従量課金(Pay-Per-Event) :起動 $0.005 + 1社あたり $0.03 。たとえば 200 社で約 $6。無料枠の $5 で約 160 社まで取得でき、まず動作確認できます。出典は国税庁の公式オープンデータ(CC BY 4.0)です。

7. 関連Actor:日本データスタックを組む

8. よくある質問

データの出典は?

国税庁の法人番号公表データ(CC BY 4.0 の公式オープンデータ)です。

何社くらい収録されていますか?

日本のほぼ全法人、500万社超が対象です。

英語表記やカナは取れますか?

はい。商号は漢字・カナ・英語(提供がある場合)で返します。

個人情報は含まれますか?

法人の公開登記情報のみを扱い、個人のプライバシー情報は含みません。

pandas や Excel にそのまま読み込めますか?

はい。結果は Apify のデータセットに保存され、CSV / Excel / JSON でエクスポート、またはデータセット API から pandas に直接読み込めます。

今すぐ試す: Japan Corporate Registry を実行 · $5 無料クレジットで登録

Top comments (0)