NO.680-【獵頭職位:北京朝陽(yáng)區(qū)/上海張江需要多位 AI芯片引擎工程師】聯(lián)系人:edward-duan,郵箱:hr@kthr.com,微信也可查詢職位了!打開(kāi)手機(jī)微信,搜號(hào)碼“KTHR_COM”或查找微信公眾帳號(hào)“KT人才”或掃描以下二維碼即可添加,歡迎大家關(guān)注! 崗位職責(zé): 1、負(fù)責(zé)開(kāi)發(fā)AI推理框架,通過(guò)CPU/GPU/DSP/NPU的并行計(jì)算優(yōu)化、架構(gòu)設(shè)計(jì)、稀疏優(yōu)化、異構(gòu)調(diào)度等多種高性能優(yōu)化技術(shù)打造業(yè)界領(lǐng)先的高性能異構(gòu)AI推理引擎; 2、負(fù)責(zé)AIGC、AI編譯優(yōu)化、端上訓(xùn)練等核心技術(shù)開(kāi)發(fā)與優(yōu)化; 3、負(fù)責(zé)AI工具鏈開(kāi)發(fā)及技術(shù)生態(tài)的建設(shè),包括但不限于不同芯片的性能瓶頸分析與優(yōu)化指引工具、模型圖優(yōu)化工具、可視化工具等。 職位要求: 2、精通C/C++,精通算法與數(shù)據(jù)結(jié)構(gòu),熟悉Python; 3、熟練掌握NPU,CPU,GPU,DSP中的1個(gè)或多個(gè)平臺(tái)高性能計(jì)算優(yōu)化技術(shù),深入理解計(jì)算機(jī)體系結(jié)構(gòu),熟悉并行計(jì)算優(yōu)化、訪存優(yōu)化等; 4、具備豐富的ARM NEON匯編優(yōu)化或OpenCL/Metal/OpenGL/Vulkan/CUDA中的至少1種GPU優(yōu)化經(jīng)驗(yàn),或熟練掌握WebAssembly、WebGL、WebGPU等技術(shù),有這些技術(shù)的AI工程優(yōu)化部署經(jīng)驗(yàn)者優(yōu)先; 5、了解深度學(xué)習(xí)算法基本原理,熟悉神經(jīng)網(wǎng)絡(luò)基本架構(gòu)和各算子計(jì)算方式,了解至少一種深度學(xué)習(xí)訓(xùn)練框架及其模型文件的解析,如Pytorch,Tensorflow; 6、熟悉常用圖像視覺(jué)計(jì)算庫(kù)及深度學(xué)習(xí)推理計(jì)算庫(kù),例如arm compute library、tensorflow lite、ncnn、mnn、tnn、mkldnn、TensorRT、CoreML等,熟悉常用的深度學(xué)習(xí)算子優(yōu)化方法例如Winograd, Strassen, Implicit GEMM等; 7、掌握AI編譯優(yōu)化技術(shù),例如TVM/MLIR/IREE等; 8、了解主流 AIGC 算法模型原理,有AIGC模型加速優(yōu)化經(jīng)驗(yàn)者優(yōu)先。 |