随着8月17日评审结果发榜,今年国家自科基金的轮回又结束了,自我2014年入所以来,先后申请过三次,今年终于中了,细细回想这三次申请历程,尤其今年这次,无论在梳理思路、提炼问题、筹备撰写还是加工润色上,我都自认为做得很多工作(当然结果也不错),不总结一下殊为可惜,而且距离下一次自科申请还有三、四年时间,我相信现在不总结,到时候会忘得一干二净。
2014年
直接把博士毕业论文按照自科的格式改了下就扔出去了,那时候对自科基金完全没有概念,目的就是了解下自科的流程。这一年所里人品爆发,一举拿下五项本学科自科基金,虽然低于龙头老大武汉大学(七项)但已是****的高度,尤其是我们团队小伙伴,入职**年就有如此亮眼表现,着实对我触动很大,让我真真切切意识到只要踏实耕耘、精心准备,自科基金是有可能拿到的。
2015年
没有好idea,放弃申请。
2016年
15年中间,开始知道知识图谱(KnowledgeGraph)这个东西,当时之所以感觉这东西重要,主要源自X兄*力推崇,X兄是我前同事,*其钻研的一个人,学术方向和我一个路数但学术水平高出我一个层次,是我崇拜的偶像,像他这种技术、工程、经验、insight兼具的人用了都说好,那知识图谱想必前途无量了,15年底我参加了CCF(中国计算机学会)举办的知识图谱前沿研讨会,会后遂将知识图谱和专利分析结合点作为自己16年自科申请的题目。
当时选这样一个点还有一个背景,就是已经搞了将近1年的主题模型在专利分析上的应用,期间虽然把概率图模型课程过了一遍,把一干常见主题模型如LDA、Labeled LDA、Author-Topic Model、Hierarchical LDA、Turbo Topic、Topic N-gram等从原理到推导到实现再到专利分析应用都过了一遍,无奈主题模型的分析粒度太粗,模型效果不好,后来自己又提了两个主题模型,可能比之前强点(之所以说可能,是因为验证数据集一个是量小,几千级别的专利数据,一个是技术领域单一,主要在硬盘磁头领域)但距离眼前一亮依然遥遥无期,然后我意识到想让主题模型和专利实际应用,如专利布局、侵权判定搭得上线,其实中间还缺着很大一块,甚至可以说当初想让主题模型和专利实际应用搭线并让知识产权企业趋之若鹜,这个想法就是不成熟的,主题模型启示了生成模型的建模思路是可以在语料库上产生实际效果的,它所产生的粗粒度的潜在语义表示,可以用来做一些事情比如分类、索引、推荐、标注、自动摘要和术语识别,但在专利分析这种拿分析结果的精准程度来体现价值的行当,这些还远远不够。So,既然主题模型给不了我想要的东西,那么我就得换个方向了。
基本想法有了未必说明申请书思路顺了,事实上情况恰恰相反,从16年1月份开始边学边想写本子到3月份提交,整个过程问题很多:
** KnowledgeGraph的来龙去脉我不知道,它和语义网、本体的关系如何,对比优势有哪些,当前行业中Knowledge Graph的主要标准和实现框架、开源工具都有哪些?
其次 KnowledgeGraph应用到专利文本上,现在有哪些研究成果,优势不足各是什么?难以解决的困难在哪里?你的方案是什么?能产生什么样的效果?这些效果解决应用上的什么问题?
*后 你打算怎样实现你的方案,实现完了要不要选择一个专利分析实际应用场景来展示下方案效果?怎样展示和验证方案效果?
经过两个多月的打磨或者折磨后本子终于提交了,坦白说写完后我是很心虚的,真正完完整整经历一次自科申请,才意识到这东西属于典型的厚积薄发,前期积累占大头,层次水平上不了境界,本子里的话你是说不到点上的;反观我的本子,从前期调研、研究基础、理论深度到方案实现都不扎实,而我也把自己*大的问题:“从未上过专利分析一线,不知道技术方案能否解决客户需求”暴露的彻彻底底。但当时我还抱着一线期望:如果大家整体水平都不好,没准我还有机会呢?
有希望就有失望,8月17日评审结果发布,还是有种当头一棒的感觉,8月22日五份评审意见下来,感触良多:
1,绝大多数评委抓点很准,点出的问题果然从前期调研绵延到方法实现,基本上都在我担心的范围之内,以为大家整体水平不好所以我的问题就不再是问题的想法理所当然破灭了;
2,对个别意见不太认同,比如有评委认为知识图谱应该是大连理工大学刘泽渊老师团队所研究的Mapping Knowledge Domain,我现在弄的Knowledge Graph从名称到内容都跟前者不搭边,属于对知识图谱理解不足,硬伤,其实对这两种知识图谱的区别我在申请书一上来就明确进行了界定,不过还是没起到作用;
3,有的评审意见说话还很难听,诸如“申请者创新思维一般”,直接说申请者笨蛋一个得了呗。
所以我说,刚拿到评审意见书时可谓百感交集,不屑、屈辱、莫名其妙各种感触纷至沓来。
(未完待续)
相关专题:基金申请