Table of contents
一些提示和建议将帮助你使用Excel公式从URL列表中获取域名。 公式的两个变体可以让你提取带和不带www的域名,而不考虑URL协议(支持http、https、ftp等)。该解决方案适用于所有现代版本的Excel,从2010到2016。
如果你关注推广你的网站(像我一样)或在专业层面上做SEO,推广客户的网站赚钱,你经常需要处理和分析大量的URL列表:Google Analytics关于流量获取的报告,Webmaster tools关于新链接的报告,关于你的竞争对手网站的反向链接的报告(其中确实包含大量有趣的事实;)),等等。上,等等。
要处理这样的名单,从10个到100万个链接,Microsoft Excel是一个理想的工具。 它功能强大、敏捷、可扩展,并让你直接从Excel表格中向客户发送报告。
"为什么是这个范围,从10到100万?"你可能会问我。 因为你肯定不需要一个工具来处理少于10个的链接;如果你有超过一百万的入站链接,你几乎不需要任何工具。 我敢打赌,在这种情况下,你已经有一些特别为你开发的定制软件,有一个专门为你的需求而定制的业务逻辑。 而将会是我仔细阅读你的文章,而不是相反的方式 :)
在分析URL列表时,你经常需要执行以下任务:获取域名以便进一步处理,按域名对URL进行分组,从已处理的域名中删除链接,按域名比较和合并两个表格等。
从URL列表中提取域名的5个简单步骤
作为一个例子,让我们来看看谷歌网站管理员工具生成的 ablebits.com 的反向链接报告的一个片段。
提示:我建议使用ahrefs.com来及时发现你自己的网站和你的竞争对手网站的新链接。
- 添加" 领域 "列到你的表格的末尾。
我们将数据从一个 CSV 文件,这就是为什么在Excel方面,我们的数据是在一个简单的范围内。 按Ctrl + T将它们转换为Excel表格,因为它在工作上要方便得多。
- 在""的第一个单元格中 领域 "列(B2),输入公式提取一个域名。
- 如果一个URL中存在www.,则提取带有www.的域名。
=MID(A2,FIND(":",A2,4)+3,FIND("/",A2,9)-FIND(":",A2,4)-3)
=IF(ISERROR(FIND("//www.",A2)), MID(A2,FIND(":",A2,4)+3,FIND("/",A2,9)-FIND(":",A2,4)-3), MID(A2,FIND(":",A2,4)+7, FIND("/", A2,9)-FIND(":", A2, 4) -7)
第二个公式可能看起来太长、太复杂,但前提是你没有看到真正的长公式。 微软在新版本的Excel中把公式的最大长度增加到8192个字符,这不是没有原因的:)
好在我们不必使用额外的列或VBA宏。 事实上,使用VBA宏来自动化你的Excel任务并不像看起来那么困难,请看一篇非常好的文章--如何创建和使用VBA宏。 但在这种特殊情况下,我们实际上并不需要它们,使用公式会更快更容易。
注:从技术上讲。 淘宝网 是第三级域名,尽管在所有正常的网站中,www.只是主域名的一个别名。 在互联网的早期,你可以在电话中或在广播广告中说 "双u,双u,双u我们的酷名点com",每个人都完全理解并记住在哪里可以找到你,当然,除非你的酷名是这样的www.llanfairpwllgwyngyllgogerychwyrndrobwyll-llantysiliogogogoch.com :)
你需要留下所有其他三级域名,否则你会弄乱来自不同网站的链接,例如使用 "co.uk "域名或来自blogspot.com上的不同账户等。
完成了!我们有一个提取域名的栏目。
在下一节中,你将学习如何根据域名列来处理一个URL列表。
提示:如果你以后可能需要手动编辑域名或将结果复制到另一个Excel工作表中,请将公式结果替换为数值。 要做到这一点,请按以下步骤进行。
- 点击域列中的任何单元格,按Ctrl+Space键选择该列中的所有单元格。
- 按Ctrl + C将数据复制到剪贴板,然后转到 首页 选项卡,点击""。 粘贴 "按钮,并选择" 价值 "从下拉菜单中。
使用域名列处理一个URL列表
在这里,你会发现根据我自己的经验,有一些进一步处理URL列表的提示。
按域名对URL进行分组
- 点击任何单元格中的 领域 列。
- 按领域对你的表格进行排序:到 数据 选项卡,并点击 A-Z 按钮。
- 将你的表格转换为一个范围:点击表格中的任何单元格,进入到 设计 标签,并点击" 转换到范围 "按钮。
- 转到 数据 标签,并点击" 小计 "图标。
- 在 "小计 "对话框中,选择以下选项。 在每个变化的 : "域名" 使用功能 计算和 将小计加到 领域。
Excel在屏幕左侧为你的数据创建了一个大纲。 大纲有3个层次,你现在看到的是扩展的视图,或者说是第3层次的视图。 点击左上角的数字2,按领域显示最终数据,然后你可以点击加号和减号(+/-),以扩展/折叠每个领域的细节。
突出显示同一域中的第二个和所有后续的URLs
在上一节中,我们展示了如何按域名对URL进行分组。 与其说是分组,不如说是对URL中相同域名的重复条目快速着色。
更多细节请见如何在Excel中突出显示重复的内容。
通过域名列比较不同表格中的URLs
你可能有一个或几个独立的Excel工作表,在那里你保留了一个域名列表。 你的表格可能包含你不想处理的链接,如垃圾邮件或你已经处理过的域名。 你也可能需要保留一个有有趣链接的域名列表,并删除所有其他的域名。
例如,我的任务是将所有在我的垃圾邮件黑名单中的域名涂成红色。
不要浪费太多的时间,你可以比较你的表格,删除不必要的链接。 完整的细节,请阅读 如何比较两个Excel列并删除重复的内容
最好的方法是按域名合并两个表
这是最先进的方式,也是我个人比较喜欢的方式。
假设你有一个单独的Excel工作表,上面有你曾经工作过的每个领域的参考数据。 这个工作表记录了链接交换的站长联系人和你的网站在这个领域被提及的日期。 也可以有网站的类型/子类型和一个单独的列,上面有你的评论,比如下面的截图。
一旦你得到一个新的链接列表,你就可以按域名匹配两个表格,并在短短两分钟内将域名查询表和你的新URLs表的信息合并。
结果你会得到域名以及网站类别和你的评论。 这将让你看到列表中你需要删除的URL和你需要处理的URL。
按域名匹配两个表并合并数据。
- 下载并安装最新版本的Microsoft Excel合并表向导
这个灵巧的工具将在瞬间匹配和合并两个Excel 2013-2003工作表。 你可以使用一个或几个列作为唯一的标识符,更新主工作表中的现有列或从查找表中添加新的列。 请随时在我们的网站上阅读更多关于合并表向导的信息。
- 在Excel中打开你的URLs列表,如上所述提取域名。
- 选择表格中的任何一个单元格,然后转到 阿博比特数据 选项卡,并点击 合并两张表 图标来运行该插件。
- 按下 下一页 按钮两次,然后选择你的工作表,将域信息作为 查询表 .
- 勾选 "域 "旁边的复选框,以确定其为 匹配列 .
- 选择你想添加到URLs列表中的域名信息,然后点击下一步。
- 按下 完成 当处理结束时,该插件将向你显示一条关于合并细节的信息。
只需几秒钟--你就能对每个域名的所有信息一目了然。
你可以下载《Excel合并表向导》,在你的数据上运行它,看看它有多大用处。
如果你有兴趣获得一个免费的插件,用于从URL列表中提取域名和根域名的子文件夹(.com、.edu、.us等),只需给我们留言即可。 这样做时,请指定你的Excel版本,如Excel 2010 64位,并在相应的字段中输入你的电子邮件地址(不要担心,它不会被公开显示)。 如果我们有相当多的投票,我们将如果你想创建这样的插件,我会告诉你的,谢谢你。