日本企業のKYC(取引先審査)、B2B営業のリスト作成、M&A;のデューデリジェンス——どれも「正確な企業マスタ」が出発点です。国税庁の法人番号 公表データは、日本のほぼ全法人(500万社超)を網羅する公式オープンデータ(CC BY 4.0)ですが、そのままだと一件ずつ手で引くしかなく、業務に組み込むには整形と一括取得の仕組みが要ります。
この記事では、Apify 上の Japan Corporate Registry(法人番号 企業登記) Actor を紹介します。国税庁の法人番号レジストリを検索し、法人番号・商号(漢字/カナ/英語)・所在地・都道府県・法人種別・状態などを構造化 JSON で返します。クラウド実行・従量課金で、無料枠から始められます。
1. 課題:公式データはあるが、業務に組み込みにくい
- 一括取得が前提でない。 公表サイトは個別照会向きで、リスト化・自動化には不向き。
- 表記ゆれ。 漢字・カナ・英語表記、所在地の整形を自前で揃える必要がある。
- 差分管理。 新設・商号変更・登記状態の更新を追うのが手間。
- 他データとの突合。 営業リストや与信データと法人番号で名寄せしたいが、キーが揃わない。
2. このActorでできること
法人番号そのものでの照会、商号(社名)フィルタ、都道府県フィルタ(47都道府県)、法人種別フィルタ(株式会社等/外国法人/合同会社)での検索に対応します。出典は国税庁の法人番号公表データ(CC BY 4.0 の公式オープンデータ)です。
主な入力パラメータ:corporate_number(法人番号)、company_name_filter(商号)、prefecture_filter(都道府県)、category_filter(法人種別)、max_records(最大取得件数、既定 200)、nta_api_key(任意:国税庁アプリケーションID)。
3. こんな方におすすめ
- KYC/コンプラ: 取引先の法人番号・登記状態を一括で確認。
- B2B営業/RevOps: 都道府県・業種で企業リストを抽出し、法人番号で名寄せ。
- M &A;/調査: 候補企業の正式名称・所在地・種別をデューデリの起点に。
- データ基盤: 公式の企業マスタを自社DBに取り込み、キーとして活用。
4. 出力フィールド例
| フィールド | 内容 |
|---|---|
corporate_number |
法人番号(13桁) |
company_name / company_name_kana / company_name_en
|
商号(漢字 / カナ / 英語) |
prefecture / prefecture_jp / city / address
|
都道府県 / 市区町村 / 所在地 |
corporate_type / category
|
法人種別 / 区分 |
status |
登記状態 |
registration_date / last_change_date
|
登記日 / 最終変更日 |
source_url / data_source
|
出典リンク / データソース |
1社あたりの JSON はおおよそ次のような形です:
{
"corporate_number": "1234567890123",
"company_name": "サンプル株式会社",
"company_name_kana": "サンプルカブシキガイシャ",
"company_name_en": "Sample Inc.",
"prefecture_jp": "東京都",
"city": "千代田区",
"corporate_type": "株式会社",
"status": "登記",
"data_source": "NTA 法人番号"
}
※ 値はフォーマット例示用のサンプルです。実データは実行時に取得されます。
5. 活用例
-
地域別リスト:
prefecture_filterで特定エリアの法人を抽出。 - 名寄せキー付与: 既存リストに法人番号を付け、与信・営業データと突合。
- 新設モニタリング: 定期実行で新規登記・商号変更を検知。
- 正式名称の正規化: 漢字・カナ・英語表記を一括取得して表記統一。
6. Apify で実行する
Actor ページ:Japan Corporate Registry on Apify。新規登録で $5 の無料クレジット (こちらから登録)。
from apify_client import ApifyClient
client = ApifyClient("YOUR_APIFY_TOKEN")
run = client.actor("nexgendata/japan-houjin-bangou-corporate-registry").call(run_input={
"company_name_filter": "ソフト",
"prefecture_filter": "Tokyo",
"max_records": 100,
})
for item in client.dataset(run["defaultDatasetId"]).iterate_items():
print(item["corporate_number"], item["company_name"], item["city"])
料金:いくらかかる?
従量課金(Pay-Per-Event) :起動 $0.005 + 1社あたり $0.03 。たとえば 200 社で約 $6。無料枠の $5 で約 160 社まで取得でき、まず動作確認できます。出典は国税庁の公式オープンデータ(CC BY 4.0)です。
7. 関連Actor:日本データスタックを組む
- J-PlatPat 特許・商標 —— 特許庁 知財検索(解説記事)
- TDnet 適時開示 —— 東証の当日適時開示(解説記事)
- 東証銘柄スクリーナー —— 日経225・TOPIX 株価・時価総額(解説記事)
- EDINET 大量保有報告書 —— インサイダー/大量保有データ
8. よくある質問
データの出典は?
国税庁の法人番号公表データ(CC BY 4.0 の公式オープンデータ)です。
何社くらい収録されていますか?
日本のほぼ全法人、500万社超が対象です。
英語表記やカナは取れますか?
はい。商号は漢字・カナ・英語(提供がある場合)で返します。
個人情報は含まれますか?
法人の公開登記情報のみを扱い、個人のプライバシー情報は含みません。
pandas や Excel にそのまま読み込めますか?
はい。結果は Apify のデータセットに保存され、CSV / Excel / JSON でエクスポート、またはデータセット API から pandas に直接読み込めます。
Top comments (0)