今回は後編として、2つのケースについて、名寄せの手順をご紹介したいと思います。

【ケース3】入力ルールが異なり、データが整っていない

(株式会社/㈱や斉/齊のような同じ意味で違う表記となっているものが混在するExcelデータ

 例えば、下記をご覧ください。A1セルとA3セルには同じABCという会社名の記載がありますが、A3は(株)と省略して記載されています。また、名前も「斉藤」と「齊藤」のように記載が異なります。これらのデータのように、「表記の揺れ」があるものは整理が必要ですね。これらの情報を名寄せする方法をご紹介します。

まず、このような入力ルールが徹底されておらず、表記に揺れがあるリストを整理する手順をご紹介します。

1, 不要なものを除く

2, 正式社名へ変更する

3,人名の表記ゆれを確認する

順を追って進めていけば難しいことではありません。では、詳しく解説しましょう。

1, 不要なものを除く

 すでに上記で御覧頂いたExcelのリストのA1セルには「空白」や「大阪営業所」という社名ではない情報も含まれています。まずはこれを整理しましょう。

Excelでは「置換」を用います。下記のように

検索する文字列、置換後の文字列を空白の状態で「すべて置換」をクリックします。

すると「株式会社 大阪営業所」の間にある空白を削除することが出来ます。

なお、このExcel上では気づきませんが、人名に存在する見えない空白「太郎」「太郎  」のようなものも一斉に削除しました。

次に、A列に記載されている「大阪営業所」を削除しましょう。仮に削除ではなく、残しておきたい場合、リスト内のデータの総数が少なく、かつこのように「~営業所」「~事業所」などの付随情報が記載されているデータが少なければ、目視でB列先頭に移してもよいでしょう。<br>

削除する際には下記のようなキーワードを探し、すべて「空白」に置換することで、社名ではない情報を整理することができます。

「所」「部」「センター」「事業」「カンパニー」

これらは「関東営業所」「技術センター」などの社名に付随して記載されやすい情報を探しだすための手がかりとなります。なお、「カンパニー」については正式社名の一部の可能性やカンパニー制の企業の場合もありますので、一斉置換ではなく「検索」で一度目視での確認をされてください。

2, 正式社名へ変更する

 次に正式社名へ変更しましょう。

(株)や㈱などを「株式会社」に置換します。続いて「会社」を含まないものを検索します。例えば「CO., LTD.」のような表記や「ABC」のみで記載されているケースを想定しています。この場合、目視で確認し、Webサイトで正式社名を調べる必要があります。

3,人名の表記ゆれを確認する

ここまで終わるとあと一歩です。続いて、リスト内の重複をチェックします。「メールアドレスを一意」に重複を確認してみましょう。この際、上記のリストでは同じメールアドレスの方の氏名が「斉藤」「齊藤」と2種類登録されています。どちらを残すかどうかは下記のような情報を手がかりに判断されて下さい。

・社内に存在する名刺情報

・字数が多い漢字

・機種依存ではない漢字

例えば、「髙木」の「髙」という次は機種依存文字に該当します。お手持ちのメール配信システムによっては対応しないものもあるため、リストを整理する際には登録予定のシステムが対応できない「文字」について事前に調べておくと、文字化けの可能性を軽減できます。

これらの情報が整理されればケース3の名寄せは完了です。<br>

では、いよいよ最後のケースですね。ご紹介しましょう。

【ケース4】異なるエクセルシートにデータが点在しており、入力項目がバラバラ(メールアドレスが紐付いたデータもあれば、名前が氏・名で分かれている・いないデータがあるなど、フォーマットの入力項目が異なるものを1つに集約したい場合)

最も手がかかるリストですね。まずは下記をご覧ください。非常に似ているExcel上のデータですが、これらを名寄せし、一つに集約されたい場合、課題がいくつかあります。

・項目名が異なる

・氏名が分割されていない

これらを解決するためには4つの手順で進めていきましょう。

1,集約するExcelに、必要な項目名を用意する

2,氏名を分割する

3,1で整理・追加した項目の情報を抜き出す

4,残された2つのデータを統合し重複を削除

1,集約するExcelに必要な項目名を用意する

今回の場合、片方には「都道府県」が片方には「担当営業」の情報がついています。

まずは、これらを一つの型にしてしまいましょう。今回の場合は「都道府県」の右隣に「担当営業」の項目名を追加し、集約する型を準備します。

2,氏名を分割する

氏名の分割は「空白」で分かれていると区切りやすいのですが、今回の場合、空白のないものもありますので、下記のような「LEFT」関数を用います。

C2セルでは、B2セルの左から2文字までを抜き出すよう指示をしています。しかし、これらの場合、「小竹山」のような3文字の苗字の方は「小竹」のように抜き出されてしまいますので、これは目視で確認の必要があります。ご注意下さい。

続いて、「名」を抜き出す関数ですが、下記のようにD2セルでは、B2内の文字からC2の文字と空白を除いた文字を抜き出すように指示をします。これで氏名の分割が完了しました。

3,1で整理・追加した項目の情報を抜き出す

続いて、担当営業情報を冒頭の「都道府県」情報のみが付与されていたデータに加えます。

該当する方には担当営業情報が加わり、なければ空白にします。

用いるのは「VLOOKUP」関数です。G2セルにはE2と同じメールアドレスがF12からF16のセルの間に存在すれば、そのメールアドレスから2列目の値(今回の場合は営業担当)が表示されるように指示します。これが整えばあと一歩です。

4,残された2つのデータから重複を削除

 さて、残されたデータから重複を削除する必要があります。これはこれまでご紹介した通りです。「メールアドレスを一意」に重複の確認を行い、その後、重複のあるデータを並び替え、目視で確認したうえで不要なものを削除します。

以上で名寄せが完了です。ここまで、お手元のデータを用いて実際に作業をされていた方、お疲れ様でした。名寄せは慣れてしまえば簡単です。社内に眠っている情報を営業活動に生かすためにも、まずは根気強く、社内の情報のデータ化が必要です。今回のテーマが少しでもみなさんの業務のお役に立てば幸いです。