关于java截取多重域名的笔记…
- 1353 次检阅

最近一直在做域名筛选,因为之前一直在学javaweb,但是来到这个公司,一直是让我去截取数据。

所以自己也做下笔记吧..

先上图再说需求吧

需求:

如:把www.baidu.com 或者news.baidu.com,截取分布拆成

即,先去除www和后缀com/net/cn/com.cn....

然后输入结果为:.baidu.(根域名)news.(二级)news.baidu.(二级全域名)

实现步骤...

1.先把数据,即url除去www/后缀

2.使用java代码去跑,分析判断,如果遇到4级、5级域名,就重复跑(即把含有几级的数据,跑到只剩下根域名)

下面是主要代码吧。有点乱,做的过程我自己也很懵逼...

下面代码是判断域名里面还有几个‘.’即可判断还有几级没有拆分

数据库类

最后在用sql语句 统计拆分出现的次数

SELECT MFR_NAM_ID as ID,TAC,RULE as 域名,count(1) as 次数 from x5
GROUP BY MFR_NAM_ID,TAC,RULE ORDER BY count(1) DESC

 

分享到:

这篇文章有3条评论

  1. NO:2699 / 發布於 - 2018-1-31 #1 回复

    最近一直和博客友情,加个链接可否?

发表评论