“未来十年是 AI 的黄金十年”,业已成为各界共识。无论是硅谷巨头还是国内的华为、腾讯、阿里,都把 AI 视作开启下一个时代的钥匙。
作为核心的 AI 技术之一,深度学习成为各企业进军 AI 领域的突破口。 在经历了Caffe、Theano代表的浅层框架时代以及Tensorflow、PyTorch代表的通用框架时代,深度学习框架的发展,迎来了以 MindSpore 为代表的全场景 AI 计算框架的新时代。
MindSpore 是华为推出的深度学习框架,具备统一的模型训练、推理和导出等接口,支持端、边、云等不同场景下的灵活部署。自2020 年 3 月正式开源以来,MindSpore 已经培育了一个活跃的技术社区,软件总下载量130万,Star 数量超1.6万,PR数超5.16万。
风口之上,如何将 AI 技术落地,才是关键。AI 落地,就是要摆脱概念化,就须找到合适的场景。2021 年 9 月起,MindSpore 社区开展了“MindSpore 开源活动”,设计了很多基于实际场景需求的任务。
比如,在做图像识别时,载入图片之后,往往需要对图片进行预处理,以保证图像符合预训练模型的需求,其中一项就是把图像数据由 (H,W,C)的矩阵转换为(C,H,W)。MindSpore 现有的转换算子,只能输入三通道数的图片,Gitee @unseenme 仅用了几天时间就实现了多通道图像输入。这很有必要。在常规图像处理以外的领域,如医学图像处理,其包含图像的通道数可能达到了1000,因为医疗图像中每一层可以看成是一个切片,整张图片包含很多的切片。
自“MindSpore 开源活动”启动以来,已经提交了数十个 PR,其中近一半已经被合并。
其中一个 PR 与脑瘤识别有关。数据集是 2800 多张脑影像图片,分为 no_tumor(无肿瘤)、glioma_tumor(胶质瘤)、meningioma_tumor(脑膜瘤)、pituitary_tumor(垂体瘤)四类训练集。由于图片数量较少,且各类脑瘤对于非专业的医学人士而言难以分辨,因此任务难度很高。不过,Gitee @liyu_sup 基于卷积神经网络以及深度残差网络,很快就建立了脑瘤识别的 baseline 模型,并且将代码贡献给了 MindSpore 社区。
事实上,随着深度学习的快速发展,越来越多的研究者都在尝试将深度学习技术引入到肿瘤检测项目中。基于人工提取特征的检测算法,不仅需要专业领域的知识 ,而且耗时费力,并且最后还不一定能提取高质量特征,而利用深度学习建立模型则完美解决了这些问题。
MindSpore 合并的 PR,大部分能够应用在实际的场景中,大化地将个人智慧产生社会影响力,真正实现技术的落地。
在 AI 落地行业时,更大的挑战是如何降低开发门槛,并提供泛化能力,解决小样本、跨模态等关键技术。
因此,MindSpore 在不遗余力地引导更多开发者关注、学习 AI 技术。MindSpore 提供了详细的教程,包括训练、推理和端侧设备使用三部分,开发者可以根据自身情况选择不同阶段进行学习。教程设置由易到难,步步深入,从深度学习的发展历史,到MindSpore 的安装及使用,到深度学习算法、自然语言处理、图像识别等多种AI实战,再到MindSpore 的原理及创新算法均有涉及,甚至还会补充深度学习、机器学习基础知识。
千里之行,始于足下。学习有效的方式,就是与实践相结合。这也是“MindSpore 开源活动”出现的原因。简单来说,就是开发者先学习官方视频课程,然后动手实践任务,任务完成后经由技术人员指导审核通过即可。
MindSpore 社区设置了初、中、高三个难度级别任务,包括文档资料、语法规范、技术文章、框架 bug、API 补齐、模型开发、模型迁移、论文复现、算子开发、应用案例等 10 种任务类型。对开源新手来说,可以先做一些简单的任务,比如在代码中为函数添加注释,将中文说明文档翻译成英文。
完成任务后,可获得相应积分,凭借积分可兑换价值300元-4500元的奖品,并获得开发者证书。此外,优秀开发者更有机会成为 MindSpore 开源社区 SIG 组组长,参与到 MindSpore 核心技术演进的讨论。
“MindSpore 开源活动”将 MindSpore 学习过程与 MindSpore 开源实践结合起来,一步步引导开发者进入深度学习领域,迅速扩展和锻炼技术图谱。此外,以开源的方式贡献代码,不是属于某个人的,也不是某个公司的,而是属于所有人的。
除了技术落地之外,人才稀缺也一直是 AI 技术进一步发展的掣肘。我国AI产业在短期内实现高速增长同时,人才需求面临巨大缺口,而且 AI 人才的培养明显滞后。虽然越来越多高校已经开设了深度学习、机器视觉等AI相关专业,但招生规模仍然较小,毕业生数量远远无法满足企业需求。
《人工智能产业人才发展报告(2019-2020年版)》指出,人工智能领域仍然存在人才储备不足且培养机制不完善等问题,人才供需比严重不平衡,预计当前我国人工智能产业内有效人才缺口达30万。
正是看到这一点,华为早在 2018 年就宣布了沃土 AI开发者使能计划。其中,面向高校和科研机构,计划投入10亿元人民币用于AI人才培养;在开发者方面,计划三年培养100万开发者。
此次的“MindSpore 开源活动”,也是官方人才培养计划的一部分。也许,所谓的开源活动,不过是 MindSpore 抛出的一块饵,希望能吸引更多的开发者参与进来,一起开创一个 AI 时代。
加入 MindSpore 开源社区,迈向更广阔领域。欢迎开发者到Gitee官方网站MindSpore 开源社区参与活动。