十年网站开发经验 + 多家企业客户 + 靠谱的建站团队
量身定制 + 运营维护+专业推广+无忧售后,网站问题一站解决
1.反射型xss的介绍

xss代码出现在URL中,浏览器访问这个url后,服务端响应的内容中包含有这段xss代码,这样的xss被称作反射型xss.
2.工具的介绍
reflected_xss工具目前可以用来检测网站中是否可能存在反射型xss,程序是用python写的.
我用的python版本是2.7.3,系统上需要有python的requests模块.
工具有四个文件
spider.py用来爬取网页中的符合规则的url,可以指定爬取深度,然后生成一个urllist文件
reflect_xss.py检测urllist文件中的每一个url是否可能存在反射型xss漏洞
filter.py中的函数会被spider.py调用,过滤掉一些不带参数的url和重复的url.
config文件中,目前只有两个选项:timeout和sleep.
timeout是请求最多等待响应的时间.发送响应时,超过timout秒后就当作请求超时了.
sleep是每次请求url的间隔时间,因为有的网站会限制ip访问速度.
3.工具工作的流程
spider.py接受一个url参数,根据这个url发送请求,接收到响应后,把响应中符合规则的url提取出来,保存到urllist文件中.如果有指定爬取深度的话,会递归的爬取规则的url.这个规则是用正则写的,目前的规则是爬取到的url都应该是一个网站下的,并且url必须是带参数了的.
比如,spider.py “http://127.0.0.1/test.php?x=1″ 能够保存的url都是以http://127.0.0.1开头的,并且url中有一个?号.
reflect_xss.py会检查urllist文件中的每一个url是否存在反射型xss.检测流程是:分析每一个url的参数,将”参数”挨个替换成”参数+xss payload”,然后发送出去,分析响应的内容中是否有xss payload字符串.其中的xss payload可以自定义,keywords文件中的每一行都会被当作一个xss payload.可以向keywords文件添加或删除xss payload.
4.工具用法演示
先来大致看下当前目录下的文件吧
再来看看我用来在本机测试的两个文件吧.
只有http://127.0.0.1/rxss.php?a=1&x=2这个url是符合规则的,所以一会儿爬虫爬完了,urllist中应该只有这一条url.
spider.py就是我们的小爬虫.
直接运行spider.py可以看到用法.
爬虫爬完了,生成了一个urllist文件,文件中只有一条url,一会儿就来检测这条url是否可能存在反射型xss缺陷
这个url参数最好还是要带上双引号,就跟用sqlmap的时候一样.
reflect_xss.py就是用来检测的.
直接python reflect_xss.py 运行程序就可以检测了.
如果有发现可能存在反射型xss,会在当前目录下生成一个Found文件,文件记录了有缺陷的url.
检测的时候,如果发生了异常,会被记录到当前目录下的error.log日志文件.这里没什么异常,所以没有记录.这个日志文件记录的比较简洁明了,我就不多做介绍了.
我的邮箱是:happy7513159@qq.com 欢迎交流
下载地址:http://vdisk.weibo.com/lc/3GawHF1w1aTxKu2BJjr 密码:CMB6
核心代码:
spider.py:
- #!/usr/bin/env python
 - #coding=utf-8
 - import requests
 - import re
 - import string
 - import sys
 - import filter
 - headers={'Connection':'keep-alive',"User-Agent":"Mozilla/5.0 (X11; Linux i686) AppleWebkit/537.36 (KHTML, like Gecko) Chrome/27.0.1453.93 Safari/537.36","Origin":"http://www.oschina.net",'Accept-Encoding':'gzip,deflate,sdch','Accept-Language':'zh-CN,zh;q=0.8,en-US;q=0.6,en;q=0.4','X-Requested-With':'XMLHttpRequest','Accept':'application/json,text/javascript,*/*;q=0.01'}
 - def saveurl(urlset):
 - try:
 - f=open("urllist","a")
 - for url in urlset:
 - #unicode字符码写入文件,添加换行
 - f.write(url.encode('UTF-8')+"n")
 - #except:
 - # print "Failed to write urllist to file!"
 - finally:
 - f.close()
 - def main(requestsurl,depth):
 - try:
 - #print "%d"%depth
 - depth=depth+1
 - urlset=parseContent(requests.get(requestsurl,timeout=2,headers=headers).text)
 - saveurl(urlset)
 - if depth==string.atoi(sys.argv[2]):
 - pass
 - else:
 - for u in urlset:
 - main(u,depth)
 - except:
 - pass
 - def parseContent(content):
 - strlist = re.split('"',content)
 - urlset = set([])
 - for strstr in strlist:
 - #python正则匹配时,需要\\表示
 - #if re.match('http://.*com(/|w)+', str):
 - #这个正则有点简单,只匹配了当前网站
 - #if re.match('http://'+domain, str):
 - rules="http://"+domain+"[^,^ ^ ^']*"
 - #strstr是unicode对象
 - result=re.compile(rules).findall(strstr.encode("utf-8"))
 - #result是一个数组
 - if len(result)==0:
 - pass
 - else:
 - for i in result:
 - urlset.add(i)
 - return list(urlset)
 - if __name__=="__main__":
 - if len(sys.argv)!=3:
 - print "usage:"+sys.argv[0]+" http://test.com/"+" depth"
 - print "example:"+sys.argv[0]+' "http://127.0.0.1/a.php?c=1"'+" 3"
 - else:
 - domain=sys.argv[1].split('/')[2]
 - #保存最开始的url
 - tmp=[]
 - tmp.insert(0,sys.argv[1]);
 - saveurl(tmp)
 - #开始抓取
 - main(sys.argv[1],0)
 - filter.filter()
 
reflect_xss.py
- #!/usr/bin/env python
 - #coding=utf-8
 - import requests
 - import sys
 - import time
 - import re
 - #global payloads
 - #payloads=['">','
 ']
- jindu=0
 - def readconf(keyname):
 - isFound=0
 - try:
 - f=open("config","r")
 - lines=f.readlines()
 - for line in lines:
 - if line.startswith(keyname):
 - isFound=1
 - return line.split('=')[1]
 - if isFound==0:
 - errorlog("Warn:Can not to read key "+keyname+" from configure file")
 - return False
 - except:
 - errorlog("Warn:can not to read configure file ")
 - return False
 - def errorlog(str):
 - str=str+"n"
 - t=time.strftime('%m-%d %H.%M.%S--->',time.localtime(time.time()))
 - f=open("error.log","a")
 - f.write(t+str)
 - f.close()
 - def findlog(url):
 - try:
 - f=open("Found","a")
 - f.write(url+"n")
 - except:
 - errorlog("Fail:open 'Found' file")
 - finally:
 - f.close()
 - def main(payload,canshu,checkurl):
 - global jindu
 - url=checkurl.replace(canshu,canshu+payload)
 - #print "checking: "+url
 - #TODO timeout,防止ip被屏蔽应该有
 - if readconf("sleep"):
 - time.sleep(float(readconf("sleep")))
 - #可能有Timeout异常
 - try:
 - a=requests.get(url,timeout=1)
 - if a.text.find(payload)!=-1:
 - #print "Find!!!!"
 - #print url
 - #print "-----------------------"
 - findlog(url)
 - else:
 - if jindu%10==0:
 - print time.strftime('%H:%M.%S->',time.localtime(time.time()))+"checking the "+str(jindu)+"th"+" url:"+url
 - except:
 - errorlog("Fail:request.get "+url)
 - jindu=jindu+1
 - def parse(url):
 - #url=http://test.com/test.php?a=1&b=2&c=3
 - #canshus=["a=1","c=3"]
 - #有可能url是http://test.com这种,没有参数
 - #这种情况,返回一个空对象
 - try:
 - canshus=url.split("?")[1].split("&")
 - return canshus
 - except:
 - kong=[]
 - return kong
 - pass
 - def readfile(filename):
 - #这个global的位置放在上面效果就不一样,不懂为什么
 - #global payloads
 - try:
 - aa=open(filename,"r")
 - f=aa.readlines();
 - for i in range(0,len(f)):
 - #过滤掉n
 - f[i]=f[i].rstrip("n")
 - return f
 - except:
 - print "Failed to access "+'"'+filename+'" '"file!"
 - finally:
 - aa.close()
 - if __name__=="__main__":
 - if len(sys.argv)!=1:
 - print 'usage:'+sys.argv[0]+" url depth"
 - print 'example:'+sys.argv[0]+'"http://url/test.php?x=1&y=2" 3'
 - else:
 - #global payloads
 - payloads=readfile("keywords.txt")
 - urls=readfile("urllist")
 - for checkurl in urls:
 - for payload in payloads:
 - for canshu in parse(checkurl):
 - if len(canshu)!=0:
 - main(payload,canshu,checkurl)