数据挖掘工程师(大模型方向)_XC at Bosch Group
Shanghai, Shanghai, China -
Full Time


Start Date

Immediate

Expiry Date

17 Feb, 26

Salary

0.0

Posted On

19 Nov, 25

Experience

2 year(s) or above

Remote Job

Yes

Telecommute

Yes

Sponsor Visa

No

Skills

Data Mining, Deep Learning, Vector Retrieval, Semantic Search, Embedding Strategies, Feature Fusion, Similarity Search, Quality Analysis, Collaboration, Programming, PyTorch, Transformers, LangChain, Multimodal Models, RAG Architecture, Data Processing

Industry

Software Development

Description
Company Description Do you want beneficial technologies being shaped by your ideas? Whether in the areas of mobility solutions, consumer goods, industrial technology or energy and building technology - with us, you will have the chance to improve quality of life all across the globe. Welcome to Bosch. Job Description 构建下一代 智能数据挖掘平台,以大模型为核心驱动力,通过文本搜索、图像搜索、多模态理解等方式,实现大规模自动驾驶数据的智能发现与价值提炼。负责设计与实现基于 Qwen / CLIP / EVA / BLIP 等多模态模型的语义搜索与向量检索方案,支持感知难例挖掘、仿真场景检索、标签一致性分析等任务,推动数据生产与模型训练的智能化。 主要职责 负责构建 文本 / 图像 / 多模态搜索系统,实现语义级别的数据检索; 基于 Qwen / CLIP / EVA / BLIP / SigLip 等模型,设计 embedding 策略与特征融合方法; 构建并优化 向量索引(Faiss / Milvus / Elasticsearch),支持高效相似度搜索与难例发现; 设计数据挖掘与评估策略,如跨模态检索精度评估、embedding 质量分析、Recall / Precision 优化; 与标注、算法、仿真团队协作,推动图文搜索在数据筛选、质量控制与模型反馈闭环中的落地; 探索 生成式搜索(Retrieval-Augmented Generation, RAG) 在数据挖掘中的创新应用。 Qualifications 计算机科学、人工智能、电子信息或相关专业本科及以上学历; 熟悉 深度学习 / 向量检索 / 数据挖掘 相关技术; 精通 PyTorch / Transformers / LangChain 等框架; 熟悉至少一种 大语言模型或多模态模型(Qwen / LLaVA / BLIP / CLIP / EVA); 理解 embedding 表征、相似度度量、RAG 架构与语义索引 的基本原理; 具备良好的编程习惯与工程实现能力(Python / FastAPI / Docker 优先)。 加分项: 熟悉 Qwen 系列模型 或具备其二次开发 / 推理部署经验; 具备 图文检索系统 / 数据挖掘平台 架构经验; 有大规模数据处理经验(Spark / Ray / Elastic / Milvus); 熟悉自动驾驶数据结构(场景、标签、难例定义等); 有算法评估与可视化工具开发经验。
Responsibilities
Build the next generation intelligent data mining platform centered around large models, enabling intelligent discovery and value extraction from large-scale autonomous driving data. Design and implement semantic search and vector retrieval solutions based on multimodal models.
Loading...