Skip to content

Commit 0ed9e05

Browse files
committed
update readme
1 parent f1922b5 commit 0ed9e05

File tree

1 file changed

+17
-0
lines changed

1 file changed

+17
-0
lines changed

README.md

+17
Original file line numberDiff line numberDiff line change
@@ -85,3 +85,20 @@ GradientBoosting > SVM > LogisticRegression > KNN > RandomForest > DecisionTree
8585
### 8. 总结
8686
- 数据打标完全依赖与微步IP信誉库,打标结果有问题
8787
- 特征选择方式有问题,并且没有对特征进行降维
88+
- 对于识别撞库来看,采集的数据不是很好
89+
90+
91+
## 后续的一些想法(数据真是个大问题)
92+
- 检测撞库
93+
一、从单个账户维度,基于用户行为进行异常判断。
94+
1. 常用浏览页面/路径 VS 撞库后的浏览行为
95+
2. 常用登录地点 VS 撞库后的登录地点
96+
3. 常用登录设备类型、设备指纹 VS 撞库后的登录设备
97+
4. 常用登录时间段 VS 撞库后的登录时间
98+
5. 登录之前的访问路径
99+
二、从全局维度,基于速度特征和一些请求特征进行异常判断。
100+
1. 单个IP的登录请求次数。
101+
2. 单个IP的登录失败次数/失败率。
102+
3. 是否有cookie/session
103+
4. 单个IP的登录请求中cookie/session是否重复
104+
5. 整体登录失败率均值/标准差,

0 commit comments

Comments
 (0)