IT人力外包人才简历库

返回列表

数据采集工程师

驻场外包人员
工作年限:3年 意向城市:杭州 浏览:6次 发布时间:近期

技能标签

Python开发 爬虫技术 数据采集 分布式爬虫 数据库管理 反爬虫策略 OCR识别 浏览器自动化 网络请求 数据解析

专业技能

精通Python编程语言,熟悉网络请求与数据解析技术,掌握requests、selenium、parsel等爬虫框架与工具。具备分布式爬虫开发能力,熟练运用多线程/异步编程提升采集效率。熟悉Redis、MongoDB及MySQL等数据库的增删改查操作,具备数据存储与优化经验。擅长反爬虫技术实施,熟练使用pytesseract、百度智能云OCR、超级鹰等工具实现验证码识别与图像文字解析。熟悉浏览器自动化操作,具备处理动态渲染页面的实战能力。

工作履历(脱敏处理)

专注于数据采集系统开发与优化,主导设计基于selenium的浏览器自动化采集方案,解决动态渲染页面数据抓取难题。开发分布式爬虫框架,通过多线程与异步编程提升采集效率300%。实施反爬虫策略,采用OCR技术突破验证码识别瓶颈,成功完成多个电商平台数据采集项目。优化数据库存储方案,设计合理的索引与分表策略,提升数据查询效率。持续跟进爬虫技术演进,保持对反爬机制的应对能力。

项目经验(脱敏处理)

电商平台数据采集项目:基于selenium实现浏览器自动化,处理动态渲染页面数据抓取。采用CSV批量存储方案,通过循环机制完成数据持久化。针对反爬机制,集成pytesseract与OCR服务实现验证码识别,突破网站访问限制。开发分布式爬虫架构,通过多线程技术提升采集效率,成功完成日均百万级数据采集任务。优化数据存储方案,设计Redis缓存与MySQL分库分表策略,确保系统高并发稳定性。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

3年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接