感悟创造之道实例9:创造之我见
研究生的任务就是做出有创新性的研究工作,如何创新就随着读研成了我的首要难题,通过这两年的经历,我认为创造的关键在于“熟能生巧”。
我的研究方向是有关图像的模式识别问题,有一项工作是汽车牌照的识别,图像目标的分割是我的工作难点。汽车牌照的识别并不像它表面上看起来那么简单,对于人来说,它的确是轻而易举的事,但要想在电脑上准确无误的实现却是件令人头疼的事。这份工作我是在一位师兄的指导下进行的。起初,当然是阅读国内外相关的文献,经过一段时间的调研,我确定了一个研究方案,跟着现有的方法先试试。于是,我兴高采烈地开始了实验。首先根据车牌的底色来搜索车牌。这种根据色彩的分割方法虽然简单但效果不好,没想到实验做下来,不是多找了,就是把一块车牌分成了几块,甚至根本就没找到车牌,这时候就傻眼了。分析一下,是由于光照影响。但由于车牌识别有商业价值,很多文献都隐去了解决光照影响的具体方法。有经验的师兄指导我说先做灰度均衡调整,再试着用自适应阈值切割。这虽然是常见的方法,但对于我这个刚接触研究的新手来说却是无论如何也很难想到的,但在师兄看来就是自然而然的,这是知识的不断积累的自然结果,是这些知识烂熟于心的结果。这也是我第一次在研究工作中体会到经验的重要。
“熟”不仅仅体现在相关学科的基础知识上,更体现在创造技法的应用上。采用了自适应阈值分割后,我依然解决不了一块车牌被分成好多块的情况。这个时候我还一门心思放在如何修正阈值上。师兄又提出了腐蚀、膨胀的方法。我从没接触过这两个概念,自然是想不到。师兄是从事人体三维重建算法研究的,对他来说,这是他熟得不能再熟的东西。他提出这个方法就是脑中一闪而过的念头,是直觉的反应,但在我看来简直是神来之笔。我傻乎乎反复做了很久的阈值修正,就被他这突来的闪光给替代了。别说,这个方法还真有效,着实帮上了大忙,进一步提高了分割的准确率。这一次让我更深刻地体会到知识储备的重要,让我从一定程度上懂得了为什么只有知识渊博的科学家才能做出杰出的有创造性的工作。同时也让我尝到了吸收借鉴的好处,这其实是一种基于类比的创造技法,是一种基本的创造技法。
汽车表面往往有各种各样的广告标语。电脑经常会把这些标语和真实的车牌弄混淆。按我学过的知识,我试过了边缘分割算法、直方图统计的方法。这此方法考虑到了汉字和数字在笔画结构上的不同,都没有切中要害,分割的效果自然不够理想。用数字模板匹配的方法识别数字是数字识别中一种通用的而且非常成熟的研究手段。我在师兄的提示下,把这种方法引入到车牌候选区域的验证算法中,它的确能在一定程度上区分汉字、字母和阿拉伯数字,有效的排除了部分广告标语的干扰。这件事进一步体现了熟练掌握创造技法的重要性。
经过上述方法能够有效的分割出车牌了,但一系列方法的需要耗费相当长的时间,这不符合车牌识别的实时性要求。于是就要另辟蹊径,用新的方法代替这套色彩分割算法。这时我已经做了2个月,整个思路都陷到了色彩分割的改进上。师兄这次大胆地提出了把数字模板匹配应用到车牌候选区域的初次提取中。这个大胆尝试跳出了色彩分割方案的束缚,极大地提高了运算速度,问时算法的可靠性也只是略有降低。在此基础上,他又进一步提出用递归的灰度统计方法进行预分割,这种方法有效地借鉴了色彩自适应阈值选取的方法,减小了由于光照等噪声引起的图像二值化对模板识别算法精确性的影响,提高了算法的识别率,同时减小了模板匹配的区域,进一步提高了算法的运行速度。这些方法是各种创造技法和深厚知识储备的有效结合,是熟练运用创新能力的集中体现。
通过与师兄近半年的相处,我从中学到了很多。首先是基础知识的重要,只有熟练掌握了相关知识,才能在研究工作中游刃有余,也只有熟练掌握了各项基础知识,才能触类旁通,学以致用。没有基础知识的保障,是谈不上创新的。另一方面我也认识到创造技法的重要,在整个研究过程中,始终贯串着创造技法的运用,尤其是类比族的创造技法和组合族的创造技法的应用。最后成形的算法结合使用了灰度统计判别和全局模板匹配搜索算法,这种算法即是对原有数字识别算法的类比实现,也是基于灰度操作的有机结合,更体现了对完美算法的孜孜追求。也许这些技法的使用对师兄来说并不是刻意的,只是长期参与科研潜移默化的结果。但这些方法的自然天成的运用却正好说明了熟练掌握技法的重要性。往往这种技法和知识的熟练应用形成合力,就是新思想、新方法的源头。以上就是我初接触研究对创造的一点体会。
(作者:熊进 中科大信息学院电子科学技术系2003级硕士研究生)