当前位置: 首页 > 新闻公告 > 院系新闻 >
 
我院成功举办“大数据文本采集与分析”学术讲座
 

2023年10月31日下午,南京大学社会学博士、上海萌泰数据科技股份有限公司董事长李军莅临我校开展题为“大数据文本采集与分析”的学术讲座。讲座由涂鹏副教授主持,我院98名研究生和60名本科生参与了此次讲座。


1.png


首先,李军引用了三个生动具体的案例向同学们介绍了大数据时代下,研究者如何通过数据的采集和分析来进行学术研究。随后,李军通过这些案例向同学们总结了基于数据库、基于物联网和基于(移动)互联网的三种大数据研究方法。


2.png


其次,李军从计算机视角、统计学视角、社会科学视角三个不同的角度论述了有关大数据的定义,随后创造性地向同学们提出了自己的见解。他认为,大数据研究是指利用信息技术领域的大数据采集、存储和计算能力对总体数据进行统计、分析和挖掘,以期对确定或不确定的研究对象进行探索性或验证性研究的方法。


3.png


再者,李军引出了本场讲座的第一个重点话题,即大数据的采集。他首先向同学们介绍了三种基于大数据的信息采集方法:数据库采集、传感器采集和网络爬虫采集。他认为,大数据时代,信息采集是一项重要工作,如果单纯靠人力进行信息采集,不仅低效繁琐,搜集成本也会变高。基于此,他重点向同学们介绍了网络爬虫采集的定义和原理,并通过案例生动地向同学们展示了其运作的流程和方式。

然后,李军提出了本次讲座的第二个重点话题,大数据的分析。首先,他向同学们介绍了大数据分析技术,其中包括数据挖掘、机器学习、自然语言处理、文本分析、社会网络分析。随后,他通过案例重点介绍了文本分析所带来的快捷与便利,并总结了文本分析的七种应用方法:编码、词频、情感、角色、主题、事件、价值。他将大数据与社会科学研究方法结合,提出了两种大数据时代研究方法融合的途径:多种方法独立式研究和多种方法配合式研究。接着,他向同学们介绍了科学研究的第四范式,即数据密集型科学发现范式,并提出人工智能所带给科学研究的机遇和挑战。

最后,李军以习近平总书记关于数据获取的话语作为结尾并邀请现场同学进行提问,共同探讨大数据时代下信息的收集与采集和社会科学研究的融合发展。讲座尾声,涂鹏副教授对本次讲座予以总结陈述,讲座圆满结束。






关闭窗口
 
   

办公室电话:65336130  辅导员电话:65313303 65360581 65327561  
地址:四川外国语大学西区行政楼2楼