alexa前100万网站列表下载与应用

2016-11-14 at 03:32 下午 kk

1、直接上结果:

alexa前100万网站列表下载:

http://s3.amazonaws.com/alexa-static/top-1m.csv.zip

2、在哪里找到这个列表的

https://support.alexa.com/hc/en-us/articles/200449834-Does-Alexa-have-a-list-of-its-top-ranked-websites

3、找的方法

用google查询  site:alexa.com top-1m.csv.zip

4、这个列表有什么用?

(1)例子1:判断域名应用率,国内域名应用率

  1. 先把国内经常会用的域名后缀列出来:com、cn、com.cn、net、net、gov.cn
  2. 从列表中筛选出这些域名
  3. python爬虫遍历,再次确认他们语言是中文
  4. 再拆分后缀,统计数据,计算占比
  5. 一直在吹嘘的某些泡沫后缀,其实可以完全不计了,米农要跳过这些泡沫,不要玩。也可以看前缀,看看有那些优秀的网站用的是什么域名前缀,还是否有这样的前缀机会。同时也可以找到优秀域名将来可能会启用的域名,提前布局。当然还有一种域名就更牛了,直接是行业词,例如geyan.com xiaohua.com 或者大流量站,上升流量站还没有收购终端域名,都值得提前布局。

(2)例子2:挖行业词库

  1. 如例子1找到这些中文站,爬虫抓取标题
  2. Search标题的核心词,举例:手表,就搜索“表”按alexa排序,牛叉的行业站就出来了
  3. python遍历爱站关键词,就是行业词库了

更多应用场景,等你来开发

------------------------------------------------------------------------------------------
作者:
宽宽@网站策划运营
本站所有文章均为宽宽原创。
版权所有。转载时必须以链接形式注明作者和原始出处及本声明。

Leave a Reply