项目预算:1千~5千
开发周期:30天
发布时间:2018/8/8
要求地区:任意
需求:B/S架构web项目,建议开发语言为java或python,基于webmagic或scrapy等开源爬虫框架开发,持续有效的采集目标网站(网站、博客、微博、微信,一共约60个采集对象),并存入数据库(需同时支持Mysql和MSSQLSERVER两种)。支持定向网址采集和搜索引擎关键词采集两种方式。支持多线程,代理IP,主要是能持续采集到数据,界面要求不高,页面在10个以内。
要求做过爬虫系统项目,预算不多,如果没做过的请勿投标。
验收标准:提供全部源码,源码编写符合规范,注释详细,交互界面简洁美观,提供部署说明。