最近做了下web数据采集 尝试采集了下google地图和mapabc的数据找不到方法
看了大众点评的网站感觉可以 试着写了点代码抓取网站
有几点注意点
- 1.大众点评网站服务器访问做了限制 http请求要带上浏览器的签名
- 2.大众点评网站做访问频率做了限制 可以使用HTTP代理和增加请求延迟来减少和避免http403的错误
- 3.大众点评网站数据的加密
详细的技术文章可以参考
http://www.site-digger.com/html/articles/20120621/37.html
http://www.site-digger.com/html/articles/20111110/18.html
这是我写的java抓取大众点评网数据的代码
之后把带gps信息的数据采集下
再者就是低调 低调