第35章神经网络（第1页）

目录
存书签

请退出浏览器阅读模式，否则将导致章节内容缺失及无法阅读下一章。🎁黑料不打烊看片

智障四人组的表情包很快在计算机学院流传开来。

其中一张流传最广的表情包，是四人对着小白板上的一个“S”

字母冥思苦想。然后不知哪位好事者正好路过给拍了下来，然后在小白板上“S”

字母旁边，P上了一个“B”

。

信息年代，传播飞快。

这个表情包很快就传遍了整个金陵大学。

好事者们给它取了个名字--名画：智慧的凝视。

然后，在金陵高校圈子里也传开了。最后，上了金陵晚报的头条，成为了金陵城一连几日街头巷尾的谈资。

这主要是金陵大学的四位天之骄子，对着“S”

和“B”

两個字母如此深思，给人视觉反差太大。

以至于金陵日报的记者都向校方约稿想采访，结果自然是被主管行政的副校长给婉拒了。

但是风波已经起来了。为此，王教授在计算机学院发飙了。

“哪个龟儿子拍的这张照片，以后还想不想毕业了。”

可即便如此，也架不住学生们恶搞的热情。

于是，那张表情包的小白板上的内容被换成了各种事物。

比如：“元芳，你怎么看。”

再比如：国足对着空门一脚打了飞机。

。

但其实，那一天四人是在深思算法。

由于数字只有10个，但如今即便只是识别英文和标点，就已经是好几十个不同符号。这其中的复杂度一下子上升了很多。

如果无脑套用原来的SVM多分类方法，先不说准确率，光是计算量就会成倍增加。就实验楼的这些破电脑，跑这种级别的运算，绝对是不可能的。

所以，齐凡等人很头疼。他们需要在保证准确率的同时，又得精简算法，以便降低运算量。

在经过多次的失败尝试之后，齐凡大胆提出设想--不再将符号识别当成分类任务，而是应该当成回归任务。

所谓的回归，其与分类的本质在于：分类是预测结果集合中的一个值，而回归则是输出一个预测数值。

回归适合的是类似波士顿房价预测那种，预测一个变化的值，而不是数字识别这种，预测一个数字。因为数值是变化的，但是数字再怎么变，也跳不出0~9的范畴。

于是齐凡转换思路。他提出不再输出一个预测的符号，而是输出每个符号对应的概率。这样一来，就把分类任务变成了回归任务。

就好比，原先模型预测的结果是：0~9这几个数字。现在模型预测的结果是0~9各自对应的概率。最终的结果可取概率最大的那个数字。

在几人连着熬了几晚后，模型确实可行，无论是复杂度还是计算量都大大降低了。可错误率却是一言难尽，达到了可怕的80%。

（）;（）　　80%！真的是牵一条华国田园犬过来训练下，都不至于会有如此之高的错误率。

这个结果不知道是不是因为张开的大嘴巴，很快不胫而走。于是新的表情包诞生了。

四个人旁边被PS了一条华国田园犬，小白板上PS了“80%”

的图标。底下是一行小字--四名金大学子与狗的终极PK。

齐凡也曾幻想过自己有一天学术有成，金陵日报来采访自己。可不曾想自己会以这种方式出名。

齐凡四人在食堂吃饭的时候，不乏有人路过对他们指指点点。对此四人倒也懒得去理会。因为他们如今脑子里都是比赛。

那80%的错误率就如一座大山，他们就像手拿锄头的愚公。望山兴叹，一筹莫展。

几天后又是齐凡站了出来。

他想到了先对各种符号做分类预处理。将数字、标点、英文分为三大类，第一步先对这三大类做分类任务。相当于先让模型去区分一个符号，到底是属于数字还是标点，亦或者是英文。

随后再针对三大类各自训练一个专用模型。

数字的模型仅用来识别数字，标点的模型仅用来是被标点，英文的模型仅用来识别英文。

照着这个思路经过几天熬夜后。数字和标点的错误率降到了15%，因为数字和标点种类最少最好识别。可英文就尴尬了，因为有26个字母。英文的错误率依然高达60%。

齐凡连日来困恼于此，以至于陪李月散步时都在想这件事情。

夜晚的金大校园，昏暗路灯下，两道狭长的身影交织漫步着。

🎁黑料不打烊看片请退出浏览器阅读模式，否则将导致章节内容缺失及无法阅读下一章。

目录
存书签

第35章 神经网络（第1页）

第35章神经网络（第1页）