侯世达不断的将木架上的白纸掀开,从🕜人类思维的模🁍🄠⚩式开始侃侃而谈。
别看未来所谓的智能输入法好像遍地开花,于是就觉得🂊🍅这东西非常简单。恰恰相反,识别率越高的输入法对技术要求就越高。尤其是侯世达对六耳输入法并不满足🇱于实现整句输入为止,而是必须在整句输入的前提下🁗🅸能够实现至少95%的首次输入正确率。
如果只是打出拼音来,然后判断每个词🕜的组成,最后用几个词语组成一句不通的句子,🍷🌱🂻那用微软的智能abc就能做到,用户不过多敲打几下空格而已。但要做到整句输入,就是要让用户一次输入整个句子,一气呵成。让后面的词语能够根据前面的内容、语义进行自动关联,这种对数据的要求,是传统表型数据无法提供💗👾🎜的。
人类对语言的处理过程,不是二维结构,而是一种空间坐标形式存在的。要想让计算机实现人🙎类的“联想”能⚚👻力,就要让数据像人类处理知识一样,具有进行空间排列。若想能够对数据进行分析、归类和查找,就要知道人类的脑海中知识是如何存在的?归根结底,是一个个神经元中的电脉冲。而神经元肯定不是二维结构,而是所🁽有脑细胞组成的三维结构。
一个神经元被激活之后,会向它附近所有的神经元发射一束电脉冲。一个神经♘元发射的电脉冲不足以激活另一个神经元,但如果一个神经元在一个单位时间内有多个电脉冲抵达,那就会被激活,这就是人类思考的过程。
智能输入法中用户输入的每一个词,都会向后面的其他词语添加一个阈值。当后面某个词的阈值突破临界🞻点之后,就可以进入备选的范围之内。而这个备选数据库,就是解决信息爆炸问题的🞃关键。因为它是一个🐩三维矩阵形式的数据库,通过knn近邻算法,就能实现非常高的选择准确率。
尤其是通过这种算法,还能对词库里没有出现过的新词,经过几次训练之后就实🟊现机器学习。这一点对无法穷尽人类词语的词库来说,意义特别重大。
然而这些侯世达😲🅓的同学们,谁也没有想过原来数据还能有三维的组织形式!这对他们来说,不啻是打🄔☹🄘开了一扇新天地的大门!
不仅是🃫🚬🖜下面的同学们🗩🞐📔听的目眩神迷、如痴如醉,就连周青山🜠身边几个高材生,听的都目光炯炯有神。
或者应该说,🁠🗋正因为他们🖣🔜都是学校里的高材生,对侯世达说的这些理论上的东西,理解的反而更加深入!
虽然侯世达说的😲🅓真就是“泛泛而谈”,并没有对这些原理在软🔒⛫🝒件上的应🆆🍓用方式多说。但在场的所有专业同学,都能在冥冥之中感觉到,这些知识将开启一个新的时代!
哪怕是平常上课的时🗩🞐📔候,再怎么不老实的学生,这时候都在全神贯注的听讲。如果在场的有他们的专业课老师,非得被气的吐血不可。这帮小兔崽子们,上教授、讲师的课,该睡觉睡🝃🈞觉、该讲悄悄话就讲悄悄话,何曾这么用心过?
但此时这里不是😲🅓宽敞明亮的大教室,而是有些昏暗、潮湿的食堂,上面讲课的♘不过一个和他们一🙝样的学生,却偏偏听的津津有味。
这可不是咄咄怪事吗?
“好了,关于我这个🗩🞐📔项目的🈔大概原理,今天就讲到这里。下面请同学们体验一下,我们六耳输入法的测试版。”