IT人力外包人才简历库

返回列表

数据采集与自动化测试工程师

驻场外包人员
工作年限:1年 意向城市:北京 浏览:9次 发布时间:近期

技能标签

Python开发 Scrapy框架 数据采集 Selenium自动化 反爬虫策略 数据库优化 HTML5解析 自动化测试 正则表达式 数据可视化

专业技能

精通Python编程语言,熟练掌握Scrapy框架进行数据采集,熟悉XPath/正则表达式数据提取技术,精通MongoDB与MySQL数据库设计与优化,掌握HTML5结构解析及动态渲染页面处理,熟练运用Selenium进行浏览器自动化操作与反爬虫策略应对,具备数据可视化工具(如Tableau/Power BI)使用经验,熟悉自动化测试框架(如PyTest)及持续集成流程

工作履历(脱敏处理)

主导多个数据采集项目开发,包括房天下房产数据采集系统(日均处理5万条数据)、拉钩网招聘数据抓取平台,以及多平台图片爬虫系统。开发自动化测试框架,实现12306、B站等平台的登录自动化及弹幕发送功能,完成VIP视频破解工具开发,支持爱奇艺、腾讯视频等平台的视频资源获取。优化数据采集流程,采用分布式爬虫架构提升采集效率30%,设计验证码识别模块突破反爬机制,实现95%以上的数据采集成功率。

项目经验(脱敏处理)

1. 房天下房产数据采集系统:基于Scrapy框架构建分布式爬虫架构,采用Redis队列管理任务分发,通过XPath与正则表达式提取房源信息,日均处理5万条数据,数据存储至MySQL数据库并定期生成CSV文件,支持多字段筛选查询。

2. 多平台图片爬虫系统:开发基于Selenium的图片采集工具,支持搜狗/百度图片搜索,通过动态渲染页面技术获取高清图片,采用多线程下载机制实现秒级响应,支持自定义图片类型筛选及分类存储。

3. VIP视频破解平台:构建自动化测试框架实现视频资源抓取,通过分析视频加密协议开发解密模块,支持爱奇艺/腾讯视频等平台的云首发视频获取,采用代理IP池应对反爬机制,实现95%以上的视频资源采集成功率。

4. 弹幕自动化系统:基于Selenium实现B站账号自动化登录,开发弹幕发送模块支持定时发布功能,集成验证码识别服务突破登录限制,日均处理5000+条弹幕数据,支持消息队列异步处理。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

1年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接