海安零距离 海安论坛 海安新闻 海安

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 2905|回复: 0

如何用python“优雅的”调用有道翻译?

[复制链接]

6234

主题

6234

帖子

1万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
18716
发表于 2019-12-27 19:01 | 显示全部楼层 |阅读模式
着实在以前就盯上 有道翻译了 的,但是由于时间题目一直没有研究(我的 骚利用还在背面 ,记得关注),本文紧张讲授怎样用python调用有道翻译,讲授 这个爬虫与有道翻译 的js“ 斗争 ”的过程!


分析

对于一个网站,起首肯定要的就是分析,分析此中的网页规则
[img=auto,auto]http://www.dlct.net/https://imgconvert.csdnimg.cn/aHR0cHM6Ly91cGxvYWQtaW1hZ2VzLmppYW5zaHUuaW8vdXBsb2FkX2ltYWdlcy8yMDU5MjgwNy0zOWM4OTUwNWI4OTBhNjcz?x-oss-process=image/format,png[/img]


分析url
进入有道翻译你会发现它的url是没有变化的,也就是说它的哀求是通过ajax异步交互的。点击F12,很容易在 XHR 中找到这个交互的哀求,点击查察信息,你会发现一串参数,此中有几个照旧加密了的,啥salt盐啥的。先有个数。
在这里插入图片形貌
分析参数01
可以大胆推测:这个关键参数肯定在一块。我们搜刮 salt ,然后正常的点击,格式化睁开,在js中再次搜刮 salt 。想找相干salt附近看看 能不能找到断点 举行调试!当然,终极你可以找到11个相干内容可以在每个附近举行断点调试。你这样乐意找到相干位置关键加密字段和函数。

在这里插入图片形貌

在这里插入图片形貌

在这里插入图片形貌
分析参数02
这次,咱们利用欣赏器调用堆栈的功能,查察js实行的堆栈举行查找。直接点击到对应模块打断点即可举行观察。终极你会找到这个位置 generateSaltSign(n) 的这个函数,紧张加密函数都在内里实行

在这里插入图片形貌

在这里插入图片形貌
加密分析
着实有道翻译的加密是比较简单的了,你一看,

  • 不知道 navigator.appVersion 是啥是吧,我打印一看。就是 欣赏器头举行md5加密的嘛 ,可以固定不变的,也就是说这个 bv(t) 参数它可以是固定不变的。
  • 这个 ts 不就是13位当前时间戳吗!
  • 这个 salt 不就是时间戳背面加上100内的随机数吗,恣意取一个就行。
  • 这个 sign 不就是 "fanyideskweb" + 翻译的字符串 + salt + "n%A-rKaT5fb[Gy?;N5@Tj" 这么一串串数字然后 md5加密的嘛!
通事背面的分析发现这些参数并没有变化。所以这次天生的是唯一的,但是有一个条件是5000字以内,如果超出5000字他会截取前5000字,这点须要注意一下。
在这里插入图片形貌
模仿哀求

注意点
既然有了上面的规则,那么咱们就可以通过这部分的规则和抓包的信息整适用python模仿完成js的变乱,发送哀求。这内里有几点须要注意的。

  • Fristly ,你要搞定python中 md5加密模块 , 时间time模块 ,可以大概做出一些等价的一些转化。刚好,py的 hashlib 和 time 模块 can fullfill 你。这个题目管理。
  • In addition ,post哀求的主体data字典须要举行url编码才华当成data发送哀求发已往。
  • last but not least ,管理完加密最紧张的就是 header ,各人肯定不要麻批大意。这个content—length,颠末我的履历告诉我它如果填错了就会报错,而且不填颠末抓包分析体系会主动天生。所以不要盘算主体长度的, 这个参数肯定要省略不放cookie会报错 ,放了cookie颠末测试你会发现有些可以该以致无关紧急,有些必须服从其样式。而 cookie 中必须服从的就是 OUTFOX_SEARCH_USER_ID=-1053218418@117.136.67.240 即 数字+@+ip情势地址 。可能是为了查验而用,这个可以直接举行模仿。
在这里插入图片形貌
哀求代码
返回效果是一串json,直接拿即可!
  1. import requestsimport hashlibimport timeimport urllib.parse# 创建md5对象def nmd5(str):    m = hashlib.md5()    # Tips    # 此处必须encode    # 若写法为m.update(str)  报错为: Unicode-objects must be encoded before hashing    # 由于python3里默认的str是unicode    # 大概 b = bytes(str, encoding='utf-8'),作用类似,都是encode为bytes    b = str.encode(encoding='utf-8')    m.update(b)    str_md5 = m.hexdigest()    return  str_md5def formdata(transtr):    # 待加密信息    headerstr = '5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'    #print(round(time.time()*1000))    bv=nmd5(headerstr)    ts=str(round(time.time()*1000))    salt=ts+'90'    strexample='fanyideskweb'+transtr+salt+'n%A-rKaT5fb[Gy?;N5@Tj'    sign=nmd5(strexample)    #print(sign)    i=len(transtr)    #print(i)    # print('MD5加密前为 :' + headerstr)    # print('MD5加密后为 :' + bv)    dict={'i':transtr,'from':'AUTO','TO':'AUTO','smartresult': 'dict',          'client':'fanyideskweb',          'salt':salt,          'sign':sign,          'ts':ts,          'bv':bv,          'doctype':'json',          'version':'2.1',          'keyfrom':'fanyi.web',          'action':'FY_BY_REALTlME'    }    return dicturl='http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule'header={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36', 'Referer':'http://fanyi.youdao.com/', 'Origin': 'http://fanyi.youdao.com', 'Content-Type':'application/x-www-form-urlencoded; charset=UTF-8', 'X-Requested-With':'XMLHttpRequest', 'Accept':'application/json, text/javascript, */*; q=0.01', 'Accept-Encoding':'gzip, deflate', 'Accept-Language':'zh-CN,zh;q=0.9', 'Connection': 'keep-alive', 'Host': 'fanyi.youdao.com', 'cookie':'_ntes_nnid=937f1c788f1e087cf91d616319dc536a,1564395185984; OUTFOX_SEARCH_USER_ID_NCOO=; OUTFOX_SEARCH_USER_ID=-10218418@11.136.67.24; JSESSIONID=; ___rl__test__cookies=1' }input=input("请输入翻译内容:")dict=formdata(input)dict=urllib.parse.urlencode(dict)dict=str(dict)#dict=urllib.parse.urlencode(dict).encode('utf-8')req=requests.post(url,data=dict,headers=header)val=req.json()print(val['translateResult'][0][0]['tgt'])
复制代码
实行效果
在这里插入图片形貌
结语

就这样,我们从0开始 优雅 的揭开有道翻译的面纱!你可以利用这个做一些风趣的事变( 待续------)

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|深圳论坛-深圳人的网上家园  

GMT+8, 2020-7-16 22:29 , Processed in 0.132684 second(s), 30 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表