• SEO文章推广! 合作联系qq:122325244 正式全面改版 !免费SEO地址:https://www.seozhan.cn/tool 站长QQ群
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏SEO站长博客吧

Dirmap:一款高级Web目次文献扫描东西

脚本编程 SEO站长博客 2个月前 (08-01) 49次浏览 未收录 0个评论

摘要

绪言

自己是一名立志安好开荒的大学生,有一年安好测试履历,有时正在刷 src 的时分,需求搜检统统 target 的web生意体例是否泄漏敏锐目次、文献,劳动量极度伟大,于是 Dirmap 出世了~

著名的web目次文献扫描东西有良众,如:御剑 1.5、DirBuster、Dirsearch、cansina。

其他开源的各式轮子,更是不可胜数。

此次咱们不制轮子,咱们需求制的是一辆车!open source 的那种 XD

   需求分解

何为一个非凡的web目次扫描东西?

通过巨额调研,总结一个非凡的web目次扫描东西起码具备以下功效:

并发引擎

能操纵字典

能纯爆破

能爬取页面动态天生字典

能 fuzz扫描

自界说恳求

自界说呼应结果处分…

   功效特色

你爱的形貌,我都有,小鸽鸽了然下我吧:

赞成 n 个 target*n 个 payload 并发

赞成递归扫描

赞成自界说需求递归扫描的形态码

赞成(单众)字典扫描

赞成自界说字符集爆破

赞成爬虫动态字典扫描

赞成自界说标签 fuzz 标的 url

自界说恳求 User-Agent

自界说恳求随机延时

自界说恳求超常常间

自界说恳求代办

自界说正则外达式般配假性 404 页面

自界说要处分的呼应形态码

自界说跳过巨细为 x 的页面

自界说显示 content-type

自界说显示页面巨细

按域名去反复存储结果

   扫描成果 递归扫描

   字典形式

   爆破形式

   爬虫形式

   fuzz 形式

Q:这么棒棒呀!那 Dirmap 该若何操纵呢?

A:啊哈,你往下滑。

   操纵手腕 情况计算 git clone cd dirmap python3 -m pip install -r requirement.txt 疾速操纵 单个标的 python3 dirmap.py -iU 众个标的 python3 dirmap.py -iF urls.txt -lcf

Q:哎呀,扫描闭幕了,我的结果呢 qwq?

A:莫慌主动存储的呀。

   结果存储

结果将主动存储正在项目根目次下的 output 文献夹中,每一个标的天生一个 txt,定名体式为标的域名.txt。结果主动去反复,无须费心形成巨额冗余。

Q:矮油,不错呦,然而我还念研习下高级用法呢。

A:好嘞,这就来,屏住呼吸,往下看。

   高级操纵

自界说dirmap装备,滥觞索求dirmap高级功效,一时采用加载装备文献的格式实行详尽装备,不赞成操纵号令行参数实行详尽装备!

编辑项目根目次下的,实行装备。

dirmap.conf 装备详解:

   #递归扫描处分装备 [RecursiveScan] #是否开启递归扫描:闭塞:0;开启:1 conf.recursive_scan = 0 #碰到这些形态码,开启递归扫描。默认装备[301,403] conf.recursive_status_code = [301,403] #成立排斥扫描的目次。默认装备空。其他装备:e.g:[/test1,/test2] #conf.exclude_subdirs = [/test1,/test2] conf.exclude_subdirs = #扫描形式处分装备(4 个形式,1 次只可拔取 1 个) [ScanModeHandler] #字典形式:闭塞:0;单字典:1;众字典:2 conf.dict_mode = 1 #单字典形式的旅途 conf.dict_mode_load_single_dict = dict_mode_dict.txt #众字典形式的旅途,默认装备 dictmult conf.dict_mode_load_mult_dict = dictmult #爆破形式:闭塞:0;开启:1 conf.blast_mode = 0 #天生字典最小长度。默认装备 3 conf.blast_mode_min = 3 #天生字典最大长度。默认装备 3 conf.blast_mode_max = 3 #默认字符集:a-z。暂未操纵。 conf.blast_mode_az = abcdefghijklmnopqrstuvwxyz #默认字符集:0-9。暂未操纵。 conf.blast_mode_num = 0123456789 #自界说字符集。默认装备 abc。操纵 abc 构制字典 conf.blast_mode_custom_charset = abc #自界说不停字符集。默认装备空。 conf.blast_mode_resume_charset = #爬虫形式:闭塞:0;开启:1 conf.crawl_mode = 0 #解析 robots.txt 文献。暂未达成。 conf.crawl_mode_parse_robots = 0 #解析 html 页面的 xpath 外达式 conf.crawl_mode_parse_html = //*/@href //*/@src //form/@action #是否进手脚态爬虫字典天生:闭塞:0;开启:1 conf.crawl_mode_dynamic_fuzz = 0 #Fuzz 形式:闭塞:0;单字典:1;众字典:2 conf.fuzz_mode = 0 #单字典形式的旅途。 conf.fuzz_mode_load_single_dict = fuzz_mode_dir.txt #众字典形式的旅途。默认装备:fuzzmult conf.fuzz_mode_load_mult_dict = fuzzmult #成立 fuzz 标签。默认装备{dir}。操纵{dir}标签当成字典插入点,将更换成字典中的每一行.php。其他装备:e.g:{dir};{ext} #conf.fuzz_mode_label = {ext} conf.fuzz_mode_label = {dir} #处分 payload 装备。暂未达成。 [PayloadHandler] #处分恳求装备 [RequestHandler] #自界说恳求头。默认装备空。其他装备:e.g:test1=test1,test2=test2 #conf.request_headers = test1=test1,test2=test2 conf.request_headers = #自界说恳求 User-Agent。默认装备 chrome 的 ua。 conf.request_header_ua = Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36 #自界说恳求 cookie。默认装备空,不行立 cookie。其他装备 e.g:cookie1=cookie1; cookie2=cookie2; #conf.request_header_cookie = cookie1=cookie1; cookie2=cookie2 conf.request_header_cookie = #自界说 401 认证。暂未达成。由于自界说恳求头功效可满意该需求(懒 XD) conf.request_header_401_auth = #自界说恳求手腕。默认装备 get 手腕。其他装备:e.g:get;head #conf.request_method = head conf.request_method = get #自界说每个恳求超常常间。默认装备 3 秒。 conf.request_timeout = 3 #随机延迟(0-x)秒发送恳求。参数必需是整数。默认装备 0 秒,无延迟。 conf.request_delay = 0 #自界说单个标的,恳求协程线程数。默认装备 30 线程 conf.request_limit = 30 #自界说最大重试次数。暂未达成。 conf.request_max_retries = 1 #成立历久连合。是否操纵 session()。暂未达成。 conf.request_persistent_connect = 0 #302 重定向。默认 False,不重定向。其他装备:e.g:True;False conf.redirection_302 = False #payload 后增加后缀。默认空,扫描时,不增加后缀。其他装备:e.g:txt;php;asp;jsp #conf.file_extension = txt conf.file_extension = #处分呼应装备 [ResponseHandler] #成立要记实的呼应形态。默认装备[200],记实 200 形态码。其他装备:e.g:[200,403,301] #conf.response_status_code = [200,403,301] conf.response_status_code = [200] #是否记实 content-type 呼应头。默认装备 1 记实 #conf.response_header_content_type = 0 conf.response_header_content_type = 1 #是否记实页面巨细。默认装备 1 记实 #conf.response_size = 0 conf.response_size = 1 #自界说般配 404 页面正则 #conf.custom_404_page = fake 404 conf.custom_404_page = #自界说般配 503 页面正则。暂未达成。感触用不着,或许要烧毁。 #conf.custom_503_page = page 503 conf.custom_503_page = #自界说正则外达式,般配页面实质 #conf.custom_response_page = ([0-9]){3}([a-z]){3}test conf.custom_response_page = #跳过显示页面巨细为 x 的页面,若不行立,请装备成 None,默认装备“None”。其他巨细装备参考 e.g:None;0b;1k;1m #conf.skip_size = 0b conf.skip_size = None #代办选项 [ProxyHandler] #代办装备。默认成立“None”,不开启代办。其他装备 e.g:{http:,https:} #conf.proxy_server = {http:,https:} conf.proxy_server = None #Debug 选项 [DebugMode] #打印 payloads 并退出 conf.debug = 0 #update 选项 [CheckUpdate] #github 获取更新。暂未达成。 conf.update = 0

Q:我倒,装备文献这么众,毕竟看完了,不过我还念了然下默认的字典,另有若何增加本人的字典?

A:哦呼,这里有默认字典文献先容。另有增加自界说字典,需求将你的字典放入 data 文献夹,并删改 dirmap.conf 就可能操纵了。

   默认字典文献

字典文献存放正在项目根目次中的 data 文献夹中:

dict_mode_dict.txt “字典形式”字典,操纵 dirsearch 默认字典;

crawl_mode_suffix.txt “爬虫形式”字典,操纵 FileSensor 默认字典;

fuzz_mode_dir.txt “fuzz 形式”字典,操纵 DirBuster 默认字典;

fuzz_mode_ext.txt “fuzz 形式”字典,操纵常睹后缀修制的字典;

dictmult 该目次为“字典形式”默认众字典文献夹,包罗:BAK.min.txt(备份文献小字典),BAK.txt(备份文献大字典),LEAKS.txt(消息泄漏文献字典);

fuzzmult 该目次为“fuzz 形式”默认众字典文献夹,包罗:fuzz_mode_dir.txt(默认目次字典),fuzz_mode_ext.txt(默认后缀字典)。

Q:哇哦~

A:hhh,若何啦?另有其他题目吗?

Q:嘻嘻,Dirmap 看来是有点像小车车啦,话说落成这个项目,你参考了众少个轮子呀?

A:有良众良众,大大批都是 gayhub 上找到的项目,这里对这些项目功勋者显示感激~!

   叩谢声明

dirmap 正在编写进程中,鉴戒了巨额的非凡开源项目标形式与思念,特此申明并显示感激。

Sqlmap(架构参考)

POC-T(架构参考)

Saucerframe(架构参考)

gwhatweb(并发参考)

dirsearch(递归扫描达成参考)

cansina(解析 header 参考)

weakfilescan(爬虫动态字典形式参考)

FileSensor(爬虫动态字典形式参考)

BBscan(并发参考)

werdy(纯爆破形式参考)

另有良众开源的小剧本(字典形式参考)

另有良众的互联网文献材料(debug 参考)


SEO站长博客 , 版权所有丨如未注明 , 均为原创丨本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:Dirmap:一款高级Web目次文献扫描东西
喜欢 (0)
[h4ck3st@126.com]
分享 (0)
发表我的评论
取消评论
表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址