職位描述
職位描述:- 端到端與視覺語言動作模型 VLA 工程師- 構建場景理解系統(物體屬性推理、空間關系解析)- 設計跨模態對齊機制,提升指令-視覺-執行的連貫性- 設計并優化視覺-動作和視覺-語言-動作端到端模型- 開發多模態視覺語言模型,實現圖像-語言-動作的聯合理解- 優化模型在邊緣設備的部署效率(TensorRT/MNN)- 開發zero-shot場景適應框架職位要求:- 精通Transformer架構及微調技術(LoRA/P-tuning)- 精通CLIP/BLIP/Flamingo等VLM架構,熟悉對比學習、跨模態注意力機制- 掌握提示工程技巧,有機器人領域微調經驗優先- 有機器人移動或者操作任務(抓取/導航)數據集構建經驗優先- 在視覺-語言多模態領域發表頂會論文者加分
企業介紹
它石智航(TARS)正式成立于2025年2月5日,是一家由 AI 驅動的具身智能技術公司。它石智航的使命是以物理世界 AI 和通用機器人技術為核心,構建可信賴的超級具身智能系統,讓高性能 AI 規模化地融入人類社會的生產與生活中。它石智航的愿景是成為全球具身智能領域的領軍企業。TARS的創始團隊是迄今為止具身智能領域“AI 全棧能力最強戰隊”:CEO 陳亦倫博士是中國具身智能、自動駕駛領域技術及產業的領軍人;董事長李震宇曾任百度智能駕駛事業群總裁,是中國無人駕駛領軍人物;首席科學家丁文超博士,原華為“天才少年”,是具身智能領域青年科學家、復旦大學機器人研究院研究員,曾從0到1主導華為智駕端到端決策網絡,打造復旦大學首個人形機器人;首席架構師陳同慶是清華大學博士,國家重大專項首席科學家,原華為 ADS 智能導航部部長,空間感知首席技術專家,深耕工業制造、AI、自動駕駛、機器人等產業,引領多個產品成功商用。