データエンリッチメントパイプライン
の構築手順
生のデータには価値がありません。エンリッチされたデータが商談を成立させます。その2つをつなぐパイプラインを構築しましょう。
データベース
·
·
6分で読めます
コンセプト
データエンリッチメントパイプラインとは何ですか?
データエンリッチメントパイプラインとは、生の連絡先データや企業データを、スコアリング済みで営業対応可能なインテリジェンスへと変換する多段階の自動化プロセスです。組み立てラインを思い浮かべてください。一方の端から原材料が入り、もう一方の端から完成品が出てきます。Clearbitのデータオペレーション調査によると、構造化されたエンリッチメントパイプラインを持つ企業はコンバージョン率が2~3倍に高まります。
パイプラインがない場合、エンリッチメントは場当たり的になります。担当者がここで企業を手作業で調べ、あそこでメールの形式を推測し、ときにはLinkedInで役職を確認します。この手作業のやり方は1件あたり10~15分かかり、ミスだらけになります。パイプラインなら同じ作業を数秒で、一貫して、大規模に処理できます。
パイプラインという概念はデータエンジニアリングに由来しますが、構築するためにエンジニアである必要はありません。ZoomInfo、Apollo.io、Vonselなどの最新ツールを使えば、ノーコードの連携でパイプラインを組み立てられます。
構築する
エンリッチメントパイプラインの5段階
各段階がインテリジェンスの層を1つずつ積み重ねます。LushaのB2Bデータプレイブックは、最大限の効率を得るために、データをまさにこの順序で処理することを推奨しています。
1
段階1:収集、生の入力を集める
あらゆるソースからリードを取り込みます。Webフォーム、イベント、購入リスト、LinkedInのエクスポート、リードジェネレーションキャンペーンなどです。入力形式はすぐに正規化します。すべてのソースが同じスキーマ(氏名、メール、企業名、役職、ソース)にマッピングされるようにしましょう。
2
段階2:検証、連絡先データを検証する
すべてのメールを検証APIに通します。電話番号をキャリアのデータベースと照合します。企業ドメインが有効であることを確認します。この段階では通常、レコードの15~25%が除去されます。1,500件の不正確なリードよりも、1,000件のクリーンなリードを扱うほうが望ましいです。B2Bデータベースをクリーニングする方法に関するガイドもご覧ください。
3
段階3:エンリッチメント、ファーモグラフィックおよびテクノグラフィックデータを追加する
企業規模、業種、売上、利用技術、資金調達状況、SNSプロフィールを付加します。これにより、氏名とメールだけの情報が完全な見込み客プロフィールへと変わります。Snov.ioの調査によると、エンリッチされたレコードは返信率が73%高くなります。
4
段階4:正規化、統一して重複を排除する
業種名、役職の階層、企業規模の区分、地域の形式を標準化します。ドメインと企業名の照合を使って重複を統合します。これにより、ボリュームが増えてもデータ品質を高く保てます。
5
段階5:スコアリング、ICP適合度で順位付けする
各リードを、あなたの理想的な顧客プロフィールにどれだけ合致するかに応じて0~100でスコアリングします。企業規模、業種、技術スタック、地域などの要素に重み付けします。スコアの高いリードはすぐに担当者へ振り分け、低いスコアはナーチャリングキャンペーン用にキューに入れます。
パイプラインの強さは、最も弱い段階で決まります。ほとんどの失敗は段階2(検証)で起こります。時間を節約しようとしてチームがこの段階を省くからです。検証を省くということは、その後のすべての段階が不正確なデータで動くことを意味します。
ツールスタック
各パイプライン段階向けのツール
| 段階 | 機能 | ツールの選択肢 |
| 収集 | 生のリードを集める | Vonsel、LinkedIn、Webフォーム、イベント |
| 検証 | メール & 電話番号を検証する | ZeroBounce、NeverBounce、MillionVerifier |
| エンリッチメント | ファーモグラフィックデータを追加する | Clearbit、ZoomInfo、Apollo、Vonsel |
| 正規化 | 標準化 & 重複排除する | CRMルール、Dedupe.io、カスタムスクリプト |
| スコアリング | ICP適合度で順位付けする | HubSpot、Salesforce、MadKudu |
モジュール式パイプラインの利点は、すべてを作り直さずに、どの段階でもツールを差し替えられることです。シンプルに始めて、ボリュームが増えるにつれて複雑さを加えていきましょう。
生のデータはコストセンターです。 エンリッチされたデータは収益エンジンです。