银行信贷业务材料合规性检测算法开发工程师(远程兼职)

项目概述

我们正在寻找经验丰富的算法工程师,参与开发先进的银行信贷业务材料合规性检测模型及生产工具。主要用于地方商业银行的信贷业务风控、合规检查。

核心职责

图像篡改检测算法开发

1)开发银行流水单、票据、证件等信贷业务佐证材料的图像篡改检测算法

2)实现基于深度学习的图像篡改识别模型

3)构建多模态融合的图片篡改验证系统

文本文件格式合规检测算法开发

1)设计多格式文档结构解析和验证算法

2)开发业务规则引擎和数据格式校验系统

3)实现智能化的格式异常识别系统

垂直领域大模型开发

1)基于金融领域数据训练专用 NLP 大模型

2)开发文档逻辑一致性检验算法

3)实现智能化的异常模式识别

系统集成与部署

1)设计微服务架构的检测系统

2)完成 Linux 服务器环境的部署适配

3)实现高性能、高可用的生产环境部署

技术栈要求

机器学习与深度学习

a.深度学习框架: PyTorch, TensorFlow 2.x

b.计算机视觉: OpenCV, PIL, scikit-image

c.图像处理: 图像增强、特征提取、对抗样本检测

d.模型架构: CNN, ResNet, EfficientNet, Vision Transformer

自然语言处理

a.大模型技术: Transformers, BERT, GPT 系列, LLaMA

b.NLP 框架: Hugging Face, spaCy, NLTK

c.向量化技术: Word2Vec, FastText, Sentence-BERT

d.文本分析: 语义分析、情感分析、异常检测

后端开发技术

a.编程语言: Python 3.8+, Go/Java

b.Web 框架: FastAPI, Flask, Django

c.数据库: PostgreSQL, MySQL, MongoDB, Redis

d.消息队列: RabbitMQ, Apache Kafka

云计算与部署

a.容器化: Docker, Kubernetes

b.Linux 系统: Ubuntu, CentOS, 熟悉 Shell 脚本

c.CI/CD: Jenkins, GitLab CI, GitHub Actions

d.监控运维: Prometheus, Grafana, ELK Stack

数据处理与存储

a.大数据技术: Apache Spark, Hadoop (加分项)

b.数据处理: Pandas, NumPy, Dask

c.特征工程: scikit-learn, Feature-engine

d.模型服务: MLflow, TensorFlow Serving, TorchServe

文档格式处理

a.文档解析: PyPDF2, python-docx, openpyxl, lxml

b.格式验证: JSON Schema, XML Schema, Cerberus

c.正则表达式: re, regex, 复杂模式匹配

d.业务规则引擎: PyKE, Experta, 自定义规则解析器

Linux 部署环境要求

a.操作系统: Ubuntu 20.04 LTS / CentOS 8+

b.Python 环境: Python 3.8+ with conda/virtualenv

c.GPU 支持: CUDA 11.x + cuDNN 8.x

d.内存要求: 32GB+ RAM (模型推理需求)

e.存储空间: 500GB+ SSD (模型和数据存储)

岗位要求

技术能力

1)5 年以上机器学习/深度学习项目经验

2)熟悉计算机视觉和自然语言处理算法

3)具备大模型训练和微调经验

4)精通 Python 及相关机器学习库

5)熟悉 Linux 系统管理和 Docker 部署

领域经验(优先)

1)金融科技或风控系统开发经验

2)文档图像处理和 OCR 技术经验

3)文档格式标准化和合规检测系统经验

4)反欺诈或异常检测系统开发经验

5)大规模机器学习系统部署经验

软技能

1)强烈的技术责任心和安全意识

2)良好的代码规范和文档习惯

3)具备独立解决复杂技术问题的能力

4)优秀的沟通协调能力

看这里:

vx:baixiangguo99999999 请备注 银行材料检测算法