北漂女研 电子香烟 舆情分析

2024-07-02 22浏览

4月24日下午,“北漂”研究生帕蒂丽霞顺利通过研究生论文答辩,成为巴西利亚大学计算机专业信息技术方向的新科硕士。这个学位在巴西首都是有含金量的,*起码在她下个月由联邦政府支付的工资单上,会增加15%的硕士学位公务员津贴。这两天里,Facebook不停地发来好友们的点赞,从附图看得出帕蒂丽霞的喜悦心情。

帕蒂是大家对她的昵称,其老家在巴西北部海滨城市海息飛(Recife),来自一个典型的富裕中产家庭。从小上私立中小学,然后考上当地*好的联邦大学(UFPE)。毕业后参加全国公务员统考,来到首都某**法院任职,成为巴西社会精英。不过巴西利亚和北京一样,外地人来到这里闯天下不容易,工作和学习都要从头开始,从这点讲,也算是国内常说的“北漂”一族吧。

尽管帕蒂在法院工作,但职业行当是信息技术服务,在法院算是配角。我们在一些聚会瞎聊时,她曾经说起这样一些事情:现在社会把人给搞糊涂了,当年佼佼的女学霸,在社会上算是占有一席之地了,但悄然回首,看看老同学们都混得如何?遗憾的是那些个遇到数学题就犯愁的混混(帕蒂原话),绕过数理化,一路从法学院读起,现在到法院任职,竟成为帕蒂的工作服务对象!更让人难以理解的是,IT人士每天工作时间将近是Lawyer的一倍,但收入只是后者的一半左右。

附图:帕蒂的FB截图,葡文大意是2015年获巴西利亚大学计算机硕士

抱怨归抱怨,但帕蒂对科研情有独钟,很有奉献精神。读研是她的一个小小梦想,当年她考入我们系时,成绩排名**,有权选择任何导师。这在我们大学很正常,读研的生源大都是来自全国各地的高才生,从公务员考试中优胜而出的。他们素质高,爱钻研,白天工作,晚上和周末打理功课。就是这样,帕蒂用两年的时间,把硕士给读了下来。

巴西利亚大学研究生答辩有4种可能结果:1)论文通过;2)论文通过,30天内小修评委意见;3)论文不予通过,6个月内再次提交答辩;4)论文不予通过,无学位结业。我们专门邀请圣保罗大学的一位**教授和系主任参加答辩委员会。答辩中,她介绍曾对3600个微博进行手工标签,这种严肃认真的工作精神,赢得答辩委员会的赞赏。大家还开玩笑说,这是“北漂”的好处,远离家庭,晚上没更多事情,专心搞科研。经过2小时的答辩,论文顺利通过,帕蒂的聪明才智和辛勤努力得到充分肯定。

好了,下面言归正传。帕蒂丽霞的研究课题是微博舆情分析,她在短短一年的时间内完成了数据收集、文献研读、建模编程到案例分析等论文工作全过程。所建立的模型包括:标签扩充、垃圾清除、专业词库和舆情分析四个模块。案例分析是对电子香烟(e-cig,e-cigarette, e-Liquid)、iPhone6和2014年世界杯等专题的舆情分析。

电子香烟是由北京中医师韩力于2004年发明,由国内生产并逐渐在全球推广。由于电子香烟涉及到电子技术、医学、心理学、税收、教育以及行业商家利益等社会因素,非常复杂,美国的疾病控制与预防中心(USCDC)不定期发布相关研究报告。特别是在社交网络,网民们对“电子香烟”专题的议论热烈,是个经久不息的话题。有兴趣的读者和通过各种渠道获得这方面的资料,本文暂不展开探讨,只是把我们的研究结果介绍一下。

帕蒂丽霞通过Twitter的API系统,获取了4.4万与e-cigarette等标签有关的英文微博,清除56.8%的垃圾微博。在所研究的1.7万余有效微博中,85.4%的微博是正面评价的,只有14.6%的网民提出反对意见。例如某一正面评价的微博是这样写的:#ecig I love how everyone freak out when itgoes red for 20 min!!! CHILL does anyone know patience? #ecig is gold!而提出反面意见的例子如:My hands are so frozenthat I didn′t even feel my ecig slip out of my hand :-( #beeecig。

在线社交网络,特别是微博的复杂性、动态性和感情色彩十分强烈,开发有效的微博舆情分析系统,展开一些重大议题的公众舆情分析,无论从社会、经济和科技等方面,意义十分显著。尤其是对当前大数据、大金融、大科学等背景下形成的复杂网络,在线即时舆情分析面呈现出****的应用市场乃至商业价值。同时,也面临诸多困难,如日益复杂的人际网络、信息庞杂繁多、群情瞬息万变、海量垃圾信息干扰、信息不对称和信息冲突等。特别是,脸谱FB、微博等社交网络所展现的复杂网络品性和特点,对于深度舆情分析具有重要的理论价值和指导意义。换句话说,社交网络舆情分析也能够为复杂人际网络提供实例与数据支持。挑战意味着机遇,复杂网络下的舆情分析研究课题丰富,任道而重远。

帕蒂的工作就是开发一个微博舆情分析的套餐式快捷工具,在线即时给出社交网络上公众舆论的正面和反面意见分布。为了加快发表研究成果,我们特别邀请百检网李天成博主加盟,共同研发该课题,合作进展十分愉快。

2015年的第十一届中国复杂网络会议将于8月10-14日在京举行,与往年不同的是,年会将于第八届国际工业数学应用会议(The International Congress on Industrial and Applied Mathematics – ICIAM)联合召开。应北京师范大学系统科学学院樊瑛老师和中国科学院数学与系统科学研究院吕金虎老师的邀请,我们将参加这次会议,在樊瑛教授主持的“复杂网络与社会经济”论坛介绍微博舆情分析技术以及TransLab实验室近期在社交网络和数据挖掘方面的工作。她认为该项研究对“电子香烟”的舆情分析与这次会议主题贴切,希望这项工作在电子香烟的发源地—北京,能引起有关方面的关注,对社会经济和科技发展起到正面的促进作用。

本博主在此特别感谢樊瑛、金虎和天成三位老师的友情合作,预祝国际工业数学应用会议和中国复杂网络会议顺利召开,圆满成功。