ExcelでURL一覧からドメイン名を抽出する

  • これを共有
Michael Brown

Excelの数式を使用してURLのリストからドメイン名を取得する際に、いくつかのヒントとアドバイスを提供します。 数式の2つのバリエーションにより、URLプロトコル(http、https、ftpなどがサポートされています)にかかわらず、www付きのドメイン名とwwwなしのドメイン名を抽出できます。 このソリューションは、2010から2016までのすべてのExcelの最新バージョンで動作します。

Google Analyticsのトラフィック取得レポート、ウェブマスターツールの新規リンクレポート、競合他社のバックリンクレポート(興味深い事実がたくさん含まれています;))などです。などなど。

10件から100万件に及ぶリンク集を処理するには、Microsoft Excelが最適です。

「なぜ10本から100万本までなのですか? と聞かれるかもしれません。 10本以下のリンクを処理するためのツールは絶対に必要ありませんし、100万本以上のインバウンドリンクがあれば、ほとんど必要ありません。 この場合、あなたのニーズに合わせて特別にビジネスロジックを作成したカスタムソフトウェアをすでに開発されていると思います。 そして私が熟読するのはあなたの記事で、その逆はありません。)

URLのリストを分析する際、次のような作業が必要になることがよくあります。さらなる処理のためにドメイン名を取得する、ドメインごとにURLをグループ化する、すでに処理済みのドメインからリンクを取り除く、ドメイン名で2つのテーブルを比較・結合する、などです。

    URLのリストからドメイン名を抽出する簡単な5ステップ

    例として、Googleウェブマスターツールが作成したablebits.comのバックリンクレポートのスニペットを見てみましょう。

    ヒント: ahrefs.comを使って、自分のサイトや競合他社のサイトへの新しいリンクをタイムリーに発見することをお勧めします。

    1. を追加します。 ドメイン " カラムをテーブルの末尾に追加します。

      のデータをエクスポートしました。 シーエスブイ このため、Excelで言えば、データは単純な範囲になっています。 Ctrl + Tキーを押してExcelの表に変換した方が、はるかに作業しやすいからです。

    2. の最初のセルで、" ドメイン "列(B2)に、ドメイン名を抽出するための数式を入力します。
      • URLの中にwww.がある場合は、www.でドメインを抽出します。

    =MID(A2,FIND(":",A2,4)+3,FIND("/",A2,9)-FIND(":",A2,4)-3)

  • wwwを省略し、純粋なドメイン名を取得します。
  • =IF(ISERROR(FIND("//www.",A2)), MID(A2,FIND(":",A2,4)+3,FIND("/",A2,9)-FIND(":",A2,4)-3), MID(A2,FIND(":",A2,4)+7,FIND(":/",A2,9)-FIND(":",A2,4)-7)))

    2番目の数式は長すぎて複雑に見えるかもしれませんが、それは本当に長い数式を見たことがない場合だけです。 MicrosoftがExcelの新しいバージョンで数式の最大長を8192文字まで増やしたのは、理由がないわけではありません :)

    VBAマクロを使えば、Excelのタスクを自動化することはそれほど難しくありません。 VBAマクロの作成方法と使い方については、こちらの記事をご覧ください。 しかし、このケースでは、数式を使った方が手っ取り早くて簡単なので、VBAマクロは必要ありません。

    注)技術的には。 www は第3レベルドメインですが、通常のWebサイトではwww.はプライマリドメインのエイリアスにすぎません。 インターネットの初期には、電話やラジオの広告で「ダブルユー、ダブルユー、ダブルユー アワークールネームドットコム」と言えば、誰もが完全に理解して場所を覚えてくれたものですが、もちろんあなたのクールネームが次のようなものでない限り、です。www.llanfairpwllgwyngyllgogerychwyrndrobwyll-llantysiliogogogoch.com :)

    そうしないと、例えば "co.uk "ドメインやblogspot.comなどの異なるアカウントからのリンクが台無しになります。

  • 本格的な表ができたので、Excelは自動的に列のすべてのセルに数式をコピーします。

    完了!ドメイン名が抽出された列ができました。

    次のセクションでは、「ドメイン」列に基づいてURLのリストを処理する方法について学びます。

    ヒント:後でドメイン名を手動で編集したり、結果を別のExcelワークシートにコピーする必要がある場合は、式の結果を値に置き換えてください。 これを行うには、次の手順を実行します。

    • Domain列の任意のセルをクリックし、Ctrl+Spaceキーを押すと、その列のすべてのセルが選択されます。
    • Ctrl + Cキーでクリップボードにコピーし、次に ホーム タブをクリックし、" 貼り付け " ボタンを押して " を選択します。 価値 " をドロップダウン・メニューから選択します。
  • ドメイン名列を用いたURLの一覧処理

    ここでは、私の経験から、URLリストのさらなる処理に関するいくつかのヒントを紹介します。

    URLをドメインでグループ化

    1. の任意のセルをクリックします。 ドメイン の欄があります。
    2. Domainでテーブルをソートする:に移動します。 データ タブをクリックし A-Z ボタンをクリックします。
    3. 表を範囲に戻す:表の任意のセルをクリックし、「範囲」を選択します。 デザイン タブをクリックし、" 範囲に変換する " ボタンをクリックします。
    4. に行ってみてください。 データ タブをクリックし、" 小計 " のアイコンを表示します。
    5. 小計」ダイアログボックスで、以下のオプションを選択します。 を変更するたびに : "ドメイン" 使用機能 カウントと に小計を追加する。 ドメインです。

  • OKをクリックします。
  • Excelでは、画面左側にデータのアウトラインが作成されます。 アウトラインには3つのレベルがあり、現在表示されているのは、拡張ビュー、つまりレベル3のビューです。 左上隅の2番をクリックするとドメインごとの最終データが表示され、プラスとマイナスの記号(+ / -)をクリックして、ドメインごとの詳細を拡大/縮小することができます。

    同一ドメイン内の2つ目以降のURLを強調表示する

    前項では、URLをドメイン別にグループ化する方法を紹介しましたが、グループ化の代わりに、URLの中に同じドメイン名の重複したエントリーを素早く色分けすることができます。

    詳しくは、「Excelで重複を強調表示する方法」をご覧ください。

    異なるテーブルからドメインカラムでURLを比較する

    ドメイン名のリストを保存しているExcelワークシートは、1つまたは複数あります。 テーブルには、スパムやすでに処理したドメインなど、作業したくないリンクが含まれている場合があります。 また、興味深いリンクを持つドメインのリストを保存し、それ以外のものを削除する必要がある場合があります。

    例えば、私のタスクは、スパムメールのブラックリストに載っているドメインをすべて赤色にすることです。

    時間を無駄にしないために、テーブルを比較して不要なリンクを削除することができます。 詳細については、2つのExcel列を比較して重複を削除する方法 をご覧ください。

    最良の方法は、ドメイン名で2つのテーブルをマージすることです。

    これは最も高度な方法であり、私が個人的に好む方法です。

    このワークシートには、リンク交換のためのウェブマスターの連絡先や、あなたのウェブサイトがこのドメインで言及された日付が記録されています。 また、ウェブサイトのタイプ/サブタイプや、以下のスクリーンショットのようにコメントを記載した別の列を作成することもできます。

    新しいリンクのリストを入手したらすぐに、ドメイン名で2つのテーブルを照合し、ドメイン検索テーブルと新しいURLシートの情報をわずか2分で結合することができます。

    これにより、リストから削除するURLと処理するURLを確認することができます。

    2つのテーブルをドメイン名でマッチングさせ、データをマージする。

    1. 最新版のMerge Tables Wizard for Microsoft Excelをダウンロードし、インストールします。

      この気の利いたツールは、2つのExcel 2013-2003ワークシートを瞬時にマッチングしてマージします。 一意の識別子として1つまたは複数の列を使用し、マスターワークシートの既存の列を更新したり、ルックアップテーブルから新規に追加できます。 当社のWebサイトでテーブルマージウィザードについてもっと読むのは自由にしてください。

    2. ExcelでURLリストを開き、上記のようにドメイン名を抽出します。
    3. 表中の任意のセルを選択し、[Select] ボタンをクリックします。 エイブルビットのデータ タブをクリックし 2つのテーブルを結合する アイコンをクリックすると、アドインが起動します。
    4. を押してください。 次のページ ボタンを2回クリックし、ドメイン情報を含むワークシートを ルックアップテーブル .
    5. ドメイン]の横にあるチェックボックスにチェックを入れて、[ドメイン]として識別します。 一致列 .
    6. URLリストに追加するドメインに関する情報を選択し、[次へ]をクリックします。
    7. を押してください。 仕上がり 処理が終了すると、アドインは結合の詳細を示すメッセージを表示します。

    ほんの数秒で、各ドメイン名に関するすべての情報が一目瞭然になります。

    マージテーブルウィザード for Excelをダウンロードして、あなたのデータで実行し、その有用性を確認することができます。

    URLリストからドメイン名とルートドメインのサブフォルダ(.com, .edu, .us など)を抽出するアドインを無料で入手したい方は、コメントをお寄せください。 その際、Excel 2010 64-bit などのExcelバージョンを指定し、該当フィールドにメールアドレスを入力してください(公開されることはありません)。 もし投票数が多ければ、以下のように対応します。このようなアドインを作成し、お知らせします。 よろしくお願いします。

    Michael Brown は、ソフトウェア ツールを使用して複雑なプロセスを簡素化することに情熱を注ぐ熱心なテクノロジー愛好家です。テクノロジー業界で 10 年以上の経験があり、Microsoft Excel と Outlook、さらに Google Sheets と Docs のスキルを磨いてきました。 Michael のブログは、彼の知識と専門知識を他の人と共有することに特化しており、生産性と効率を向上させるためのわかりやすいヒントとチュートリアルを提供しています。経験豊富なプロフェッショナルであろうと初心者であろうと、Michael のブログでは、これらの重要なソフトウェア ツールを最大限に活用するための貴重な洞察と実践的なアドバイスを提供しています。