怎样使用追寻代码来发现网站之间的“相关”

访客5年前黑客文章1391

前些年Lawrence Alexander颁发了一篇使用Google Analytics查找网页之间的联络联络的文章,客岁,我也宣告了一个关于若何使用Python自动开掘信息,然后将其可视化的帖子,不幸的是Meanpath API被关闭了,所以多么的技巧便不再有用了。
侥幸的是,Spyonweb.com的还在异常供应就事。就在前不久,南非记者Jan Cronje就在极力地开掘一些他正在研讨的器械的联络联络(点击这儿阅读),这是重组以前的代码的一个完善的机会:使用Spyonweb来找到这些联接,末端再将其可视化。

给你敲代码的手指热热身,并准备好享受一些喜好,因为我们即即将探索若何使用Python自动创造网页之间的联络联络。
使用SpyOnWeb API
SpyOnWeb.com是一个赓续抓取网站追寻代码,称谓就事器和其他信息的网站,所以它能资助体现网站之间的联接。他们的API有许多订价层,从收费初步(抵挡这篇文章,收费的确实完善),一直到每个月69.95美元。
点击这儿前去api.Spyonweb.com
在这儿注册一个账号,然后主控制面板上就会出现一个access token,我们不才面的文章中会用到。

要留心的是,你更好不要和其他人同享你的access token,假设你不小心泄漏了,点击上图赤色箭头旁的小按钮,它会为你重新天然生成access token。
现在我们有了Spyonweb的access token,接下来就是写代码了。
准备
在这篇文章里,你必要一些Python库,可以使用pip设备
pip install networkx requests requests[security]
其他,你假设想在末端中止可视化,那就必要额外下载Gephi。
代码与分析
热热身,发动你最喜好的IDE(我使用的是WingIDE,用着真的不错),新建一个叫website_connections.py的文件,齐备源码【点击这儿下载】。

第1-5行:我们正在导入我们的剧本中所必要的悉数相干Python模块。
第7-8行:我们界说了一个变量spyonweb_access_token,你必要把以前取得的access token粘贴到这儿,然后我们界说了一个变量来保存Spyonweb API调用的URL。
第10-11行:这儿为Google Adsense和Google Analyse准备了两个正则表达式方式,我们将经由进程剧本在意图域名中提取这些代码。
第13-20行:在这儿我们设置命令行参数分析,以便轻松地通报一个域名,一个包含域名列表的文件,并容许为我们的图形输入指定的文件名。
我们现在增加一个简略的函数,它将在 *** 以前清算追寻代码。让我们先来看看:

完善!现在我们我们初步之一个函数,用于从意图域名直接提取追寻代码。将以下片断增加进代码中:


第38行:我们界说了extract_tracking_codes函数来接纳我们要遍历的域名列表来实行提取。
第43行今后:我们初步遍历域名列表(43行),然后在向意图域名发送Web乞求(53行)以前构建恰当的URL(50-51行),假设未能成功联接,则转到下一个域名(57行)。
第62-64行:假设我们成功联接到意图站点,那末就设置一个空缺列表来保存我们提取的代码(62行),我们检验考试使用正则表达式(63行)来找到悉数Google Adsense代码,然后对Google Analyse代码做相同的作业(64行)。
第67-69行:我们遍历提取代码的列表(67行),然后将其经由进程clean_tracking_code函数将其通签到清算和规范代码部分,接下来测验我们能否曾经有了这个代码(72行),假设没有,就将其增加到联接字典中,然后我们就可以对意图域名中止追寻了。
第82行:我们前去联接字典,以便稍后处置效果。
现在我们构建一个函数来向Spyonweb API发送乞求,现在承继增加以下代码:

第87行:我们构建spyonweb_request来接收数据,可以是一个域名,追寻代码,也可以是其他支撑的输入,我们还构建了request_type参数,该参数将组成Spyonweb乞求格式的URL的一部分。
第89-90行:我们创建一个字典,此中包含Spyonweb的access token,它将在HTTP乞求中传给Spyonweb。
第92行:我们使用静态构建的URL将乞求发送给Spyonweb,并传入params字典。
第94-102行:我们中止检讨以保证收到一个有用的HTTP相应(94行),假设乞求成功,就分析 *** ON(96行)。然后测验字典效果(98行)来看看我们能否收到了Spyonweb的有用效果,假设是,前去悉数字典。假设没有取得任何效果,就前去None(102行)。
现在我们将构建一个函数来处置向Spyonweb发送特定乞求的分析代码。

[1] [2]  黑客接单网

相关文章

30秒攻破恣意密码保护的PC:深化了解5美元黑客神器PoisonTap

近来,闻名硬件黑客Samy Kamkar运用5美元设备打造的黑客东西PoisonTap,只需30秒,就可以攻破设置有恣意暗码的电脑体系,并完成长时间后门装置。PoisonTap不是暴力破解暗码,而是...

高手对决 -- 博客服务器被黑的故事

  每一个高手在生长路上, 都需要与墙作足够的对立. 要么你成功, 站在国际之颠, 然后纵情罗致到尖端的常识; 或许或被它打趴下, 成为芸芸众生中的一人, 然后对它习以为常. 我也不破例. 前不久,...

技能共享:几种常见的JavaScript混杂和反混杂东西剖析实战

信息安全常被描述成一场军备竞赛,白帽与黑帽,浸透测验者与黑客,善与恶,本文将聚集这场永无止境决战中的一个小点。 HTML5 & JS 运用中充满着对输入进行验证/注入的问题,需求开发人员一直...

换个视点看看,为什么垂钓进犯总能成功

当我榜首次收到银行发来的“安全”邮件时,我榜首反响便是这儿是否有诈?由于在我看来,它实在是太像垂钓邮件了。这封躺在收件箱里的邮件来历于我银行司理的个人邮箱地址,而非Chase银行的官方邮箱。邮件中不...

你的网站是怎样被黑的

前语 这个标题的来历是@evilcos(余弦大大)在Github上共享的一个PPT,感兴趣的能够去他的repo下载。写这篇博客主要是想给自己最近业余时间学到的安全相关的常识做个总结,主要是关于网站常见...

根底事情呼应中的Volatility作业流程

最近,我发现自己需求对完好内存转储进行一些查询。通过一段时间的搜索,我发现了Volatility-Labs的这篇文章,依据其间的辅导办法,我能够很好的来评价内存转储。当然,你或许会有更好、更深度的内存...