[Python代码]人人网状态墙抓取脚本
在很多活动中,会使用诸如人人墙、微博墙这类产品增强现场的氛围,而在活动后,如何保留这些状态呢?我们不可能会指望着以后再登录这些网站一页一页翻看下去,因为像人人墙15条状态一页,一次活动很容易就几十上百页,甚至不能指望这些网站永久的正确保留这些状态墙(比如,现在去查看比较早的人人墙,发表时间一律是2011-09-06 01:26,原始的时间数据就已经丢失了)。这时,我们就需要把这些状态墙抓取下来留作永久保存的几年了。
阅读全文
在很多活动中,会使用诸如人人墙、微博墙这类产品增强现场的氛围,而在活动后,如何保留这些状态呢?我们不可能会指望着以后再登录这些网站一页一页翻看下去,因为像人人墙15条状态一页,一次活动很容易就几十上百页,甚至不能指望这些网站永久的正确保留这些状态墙(比如,现在去查看比较早的人人墙,发表时间一律是2011-09-06 01:26,原始的时间数据就已经丢失了)。这时,我们就需要把这些状态墙抓取下来留作永久保存的几年了。
阅读全文
最新评论