青墨小说网

青墨小说网>学霸系统完结类 > 第73章 拿到样本数据后(第2页)

第73章 拿到样本数据后(第2页)

“O”和“0”首先就傻傻分不清楚。“I”和“1”也是一样。

再叠加车牌照片的光线明暗阴影问题,一个清清楚楚的“6”竟然能被识别成“0”,原因貌似是“6”的上半部分被阴影遮挡了。总之这识别结果结果是没法看。

齐凡脑子很清醒。

面对识别错误率过高,无非是两种解决办法。

一是细化模型的精度,把模型做得更加细致。二个加大训练样本数量,让模型去学习更多的样本数据。

提升模型精度不是问题,他系统空间的那份模型XCNN图纸,正愁没有用武之地。齐凡此前发布的XCNN_DT2.0版本,不过是这份图纸上最简单的一个模型的落地应用。

要提升精度,那只需加深网络的层数即可。当前的XCNN_DT2.0版本才5个卷积层,有足够多的冗余留给层数叠加。

人工智能深度学习中的神经网络是层层叠加的,可以将其理解为一栋高楼。其处理数据的过程,可以类比为让数据爬楼梯。

数据从一楼开始,一层层往上爬,每上一层就会被处理一次。当数据到达顶层的时候,就是最终结果出来的时候。

以数字识别为例。

进入第一层的数据是一张RGB三通道的图片,最后顶层给出的结果则是0到9之间的一个数字。

以齐凡目前所掌握的理论来说,只要模型的层数越深,也就是这栋楼的层数越高,让数据爬更多的楼层,那自然就会得出更精确的结果。

();()  数据爬楼层的过程,是对数据提取特征的过程。

爬的楼层越多,也就是被提取的特征就越多,自然就会被识别的越准确。

可就如楼房受限于地基和建材,不能无限制堆高一样。模型也是一样的。

模型受限于硬件的水平也是无法无限制加深的。

所以,模型有多深完全取决于显卡有多厉害。显卡有多厉害则完全取决于钱包有多鼓。

齐凡的钱包显然不够鼓。这个他只能后续想办法化缘。

第一个问题的症结分析完毕。

接着是第二个问题--加大训练样本数量。

第二个问题所需的样本眼下倒是有了。可是样本不是有了就行的,AI是科学不是魔术。

AI模型需要人喂给它数据,虽然这个喂的过程是很简单的--给每张照片打个标签,丢给模型就行了。

打标签的方法有两种。

一种比较简便。直接给每张车牌号照片标注出对应的车牌号,这样模型在读到这张照片的时候就能知道它实际的车牌号是多少。

另一种方法则比较麻烦。将照片中的车牌位置用数据标注工具勾勒出轮廓,再将车牌上的每个字符同样勾勒出轮廓。这样做其实就是为了告诉模型,照片中的车牌位置在哪,车牌上每个字符的位置在哪,并且每个字符对应的含义是什么。

第二种方法更费时间,但是经过这样处理后的样本数据更加精细。而越精细的样本数据,自然会得到越准确的预测结果。

如果仅仅从一张照片的角度出发。数据标注的工作是很简单的,也并不费时。

哪怕是一个高中生,稍加指导,也能熟练的完成数据标注。

可再简单的工作一旦乘以一个系数,就可能会变得很庞大。不巧的是,现在这个系数是168123。

即便齐凡偷懒,采用第一种较为简单的标注办法。

假设一分钟完成4张照片的标注,则需要700个小时。

假设采用第二种方法,一分钟只能完成一张照片的标注,那就是2800个小时。

如果为了追求识别精度,采用第二种方法。按照每天八小时工作制,节假日不休息的话,齐凡需要连续工作近一年。

想想就他娘刺激。

请勿开启浏览器阅读模式,否则将导致章节内容缺失及无法阅读下一章。

相邻推荐:我做老千的那些年  被我渣了的前任继承皇位后  当精神主播穿进女尊文  凡人三界游  我的梦里有个外星文明  大佬自救手册  阿飞正传  年代:人生大赢家  邻村有个猫土地  犯罪游戏:我真没有绑架女明星  你不是炮灰  风起一九八一  开局变成一棵树!  总裁是我渣过的人[娱乐圈]  逐梦天灵  劫天运  我做老千的那些年  荒古圣体  重生为大佬  农家官夫人  

已完结热门小说推荐

最新标签

好书推荐:揉碎温柔为夫体弱多病和情敌在古代种田搞基建我有了首都户口暗恋指南星际双修指南我只是一朵云瑜伽老师花样多妈宝女她躺平爆红了你不能这么对我带着战略仓库回大唐背叛宗门,你们后悔什么?重生之护花痞少许你三世民国重生回到古代当夫子太子殿下躺平日常我的外甥是雍正公主 驸马 重生重生宠妻时光盗不走的爱人古穿今之甜妻混世小术士高手她带着全家翻身借一缕阳光路过爸爸偷了我的女朋友的东西后妈卷走40万失踪后续