人工智能图像识别从业人员考核标准

知识库 你找不到我 ⋅ 于 3周前 ⋅ 843 阅读

前言

  • 本篇文章指明了学习人工智能编程的道路,即先模仿再学习最后创造。
  • 作者作为普通人,就是这样一步步成长起来的,对此深以为然。
  • 作者花费3小时完成此篇文章,根据作者半年多的工作经验总结而来。
  • 文章作用:

1、 作者自问自带,总结自己的能力,反思自己的不足,提出改进建议;
2、作者担任工作小组的组长,用来考核组员的工作能力;
3、公开给广大读者,给方向迷茫的入门者指引,向优秀的从业人员吸取建议,博采众长。

正文

如果作为面试官,你会如何制定人工智能图像识别领域从业人员的考核标准?

0、解释这2个名词的含义:

  • 项目复现:能够使用github开源代码完成对自己数据集的模型训练、模型测试。
  • 项目复写:在项目复现的基础上,为了彻底理解项目中细节,根据自己的语言习惯,重写项目中的全部代码、并确保代码能够正常运行。

1、项目复现:体现工程能力,总分20分。

1.1 每复现1个目标识别、图像分割、人脸识别项目,计5分。

  • 雷坤复现过5个项目:Tensorflow版SSD、Keras版YOLOv3、darknet版YOLOv3、Keras版RetinaNet、Keras版Mask-RCNN
  • 雷坤本项总计得分20分

2、项目复写:体现工程能力、理解并实现网络架构的能力,总分20分。

2.1 每复写1个图像分类项目,计5分;
2.2 每复写1个目标识别、图像分割、人脸识别项目,计10分;
2.3 在github开源图像识别完整代码项目,计15分;
2.4 github开源图像识别完整代码项目并且标星超过300,计20分。

  • 雷坤复写过1个图像分类项目:Mnist数据集的简单5层CNN
  • 正在复写:Cifar10数据集的ResNet,Keras版的YOLOv3、Keras版本的Mask-RCNN
  • 雷坤本项总计得分5分

3、搭建图像卷积神经网络的常用技巧,总分20分。

  • 每小点计2分(了解、理解各计1分),了解最多占12分,20选10(更多知识点等待完善):
    3.1 BatchNormalization
    3.2 激活函数
    3.3 损失函数
    3.4 1x1卷积核
    3.5 RPN(区域选择网络)
    3.6 NMS(非极大值抑制)
    3.7 soft-NMS(软NMS)
    3.8 FPN(特征金字塔网络)
    3.9 Faster-RCNN比RCNN的优点
    3.10 RetineNet网络中的损失函数FocalLoss
    3.11 网络参数量占用显存计算
    3.12 网络计算量FLOPS计算
    3.13 学习率LearningRate的变化:Momentum、Decay这2个超参数的理解
    3.14 参数初始化细节
    3.15 轻量化网络的经验:网络剪枝、网络加速
    3.16 搭建ResNet网络的经验
    3.17 非线性的表达能力,类似于分段函数
    3.18 ...
  • 雷坤了解8分、理解2分
  • 雷坤本项总计得分10分

4、图像相关竞赛获奖、论文、博客文章,总分20分。

  • 此项主要考核梳理知识的总结能力、开源精神。
    4.1 竞赛前1%计15分,前5%计10分,前10%计5分。
    4.2 因为本文作者水平未达写论文水准,顶会论文计20分,其他论文酌情计15分或10分。
    4.3 能够体现作者水平的较高质量博客文章,每篇计2分。
  • 雷坤写过图像相关较高质量博客文章列举:

a、目标检测实践_keras版Mask-RCNN训练自己的数据

b、目标检测实践_Keras版YOLOv3训练自己的数据

c、目标检测实践_keras版RetinaNet训练自己的数据

d、目标检测实践_tensorflow版SSD数据准备

e、目标检测实践_tensorflow版SSD训练自己的数据

f、基于tensorflow、CNN、清华数据集THUCNews的新浪新闻文本分类

g、基于tensorflow+RNN的新浪新闻文本分类

h、在谷歌云服务器上搭建深度学习平台,阅读量超过8000

i、基于xgboost+GridSearchCV的波士顿房价预测

j、分布式爬虫scrapy+redis入门

k、基于pandas、matplotlib、pyecharts的人工智能相关职位招聘市场数据分析

l、视频压缩工具ffmpeg的使用

  • 雷坤本项总计得分20分

5、其他相关,总分20分,超过20分按20分计。

5.1 身体健康状况,个人努力程度(是否自愿996),计10分。

  • 设立此项的目的:给水平不够但是愿意奋斗的人上升通道
  • 通俗的话表达就是:要么你水平够高,如果水平不高,就得拼
    5.2 网络通信的理解,能够C/S、B/S架构完成客户端与服务端之前的通信任务,例如独立开发网站,计10分。
    5.3 界面程序的开发经验,例如基于PyQt5开发标注工具,通信界面等,计10分。
    5.4 分布式集群GPU并行计算的经验和实现能力,计10分。
    5.5 其他同等难度的经验或能力。

  • 雷坤本项情况列举:
    a、身体较健康,自愿996并坚持身体力行;
    b、理解网络通信原理,完成过通信实验,但没有独立开发部署过网络通信项目;
    c、修改过PyQt5标注工具labelImg中的源代码,但没有独立实现过开发界面程序;
    d、基于python实现过多进程改变图片大小、多进程图片剪裁、多进程图片合成这3种图像处理任务,提高处理速度8倍;

理解生产者消费者模式,基于此实现过多进程版本。

  • 雷坤本项总计得分15分

    结果

  • 5项得分相加:20 + 5 + 10 + 20 + 15 = 70
  • 距离满分100分需要补足的能力:
    a、复写Keras版本ResNet、Keras版本的YOLOv3;
    b、学习和理解搭建卷积神经网络的常用技巧、阅读顶会论文理解其中方法优越性;
    c、复写或实现Keras版本多GPU训练。

    结论

    本章节主要给方向迷茫的初学者提供明确的结果,适用于普通人。
    有自己擅长领域的能力强者按照自己的路线继续前进即可。
    作者根据自身经验,给出分数与薪资的对应关系,可以对号入座:
    研究生学历在下面基础上加2k;
    分数 薪资
    0 - 35 未入门,自己在家学习和实践、在小公司里面实习
    35 - 55 能够拿到9-13k薪资
    55 - 70 能够拿到13-16k薪资
    70 - 80 能够拿到16-18k薪资
    80 - 90 能够拿到18-20k薪资
    90 - 100 能够拿到20-22k薪资


作者:StevenLei2017
来源:StevenLei2017@github


推荐阅读:
深圳汇顶科技股份有限公司面试经验(算法(图像)岗位)
面经 | 拿到 Google offer,我做了哪些努力?
无人驾驶专业名词概念汇总

file
△ 关注极市平台
获得最新CV干货

微信公众号: 极市平台(ID: extrememart )
每天推送最新CV干货

成为第一个点赞的人吧 :bowtie:
回复数量: 0
暂无回复~
您需要登陆以后才能留下评论!