[Python代码]人人网状态墙抓取脚本
在很多活动中,会使用诸如人人墙、微博墙这类产品增强现场的氛围,而在活动后,如何保留这些状态呢?我们不可能会指望着以后再登录这些网站一页一页翻看下去,因为像人人墙15条状态一页,一次活动很容易就几十上百页,甚至不能指望这些网站永久的正确保留这些状态墙(比如,现在去查看比较早的人人墙,发表时间一律是2011-09-06 01:26,原始的时间数据就已经丢失了)。这时,我们就需要把这些状态墙抓取下来留作永久保存的几年了。
阅读全文
在很多活动中,会使用诸如人人墙、微博墙这类产品增强现场的氛围,而在活动后,如何保留这些状态呢?我们不可能会指望着以后再登录这些网站一页一页翻看下去,因为像人人墙15条状态一页,一次活动很容易就几十上百页,甚至不能指望这些网站永久的正确保留这些状态墙(比如,现在去查看比较早的人人墙,发表时间一律是2011-09-06 01:26,原始的时间数据就已经丢失了)。这时,我们就需要把这些状态墙抓取下来留作永久保存的几年了。
阅读全文
用Python实现的人人网登录脚本在网上并不少见,但是一般都没有对登录失败和验证码进行处理,而本文中的代码将对登录失败的情况进行具体的错误提示,并通过自动下载验证码手动输入的方式处理验证码问题。
本文中的代码是去年一次活动中,为了获得人人墙中的状态而编写的,代码中的一些部分参考了网上其他的脚本,今天又做了一定的修改。
阅读全文
最新评论