在线教育领域NLP论文调研

2019/04/18 paper

针对在线教育领域的几篇论文的调用总结。

1、面向MOOC课程评论的学习者话题挖掘研究

(1)内容概括

这篇论文主要研究MOOC课程的评论的话题挖掘,具体分为以下三个方面的研究:

  • (1)根据所有评论分析学生对这门课的总体话题,采用的是统计词频的方法;
  • (2)针对学习者的类型(已完成课程者和未完成课程者,忽略正在上课者的评论),分别对已完成课程者和未完成课程者的话题进行挖掘提炼,然后分析这两个群体话题的相似之处和不同之处,采用机器学习中的LDA方法。
  • (3)研究话题随时间的演变趋势,选取(2)中挖掘出来的话题中较为明显的5个话题,把评论根据不同的时间段进行划分,分别对每个时间段的话题进行话题挖掘,然后绘制话题随时间的演变趋势折线图。

(2)使用的数据

用户评论内容及时间,用户的课程学习状态【已完成、未完成和正在进行】

(3)总结与分析

作者的前两个研究内容还不错,证明评论中确实存在一定的话题度,并且学生群体话题与其课程完成情况有关,这也是符合常理的。但是第三个研究的效果不是很理想,对于同一门课来说,评论中的话题不会随着时间出现大幅度的可解释的变化趋势,研究价值一般。

(4)缺陷

方法比较简单,并且使用的数据较少,尤其是未完成课程者的评论太少,仅仅有12条,这么少的数据做出来的实验结果难以令人信服。不过这也从侧面说明可能未完成课程的同学更不愿意参与评论讨论这个情况。

2、SPOC论坛互动中学习者情绪特征及其与学习效果的关系研究

(1)内容概括

这篇论文主要研究的是SPOC论坛互动中情绪特征及其与学习效果的关系,主要包括以下几方面的研究内容:

  • (1)学习者的情绪随时间的演化趋势,以周为时间单位,采用的指标是学习者的情绪密度,所谓情绪密度,就是情感词在评论中出现概率的平均值。一共有三种情绪词,积极、消极和困惑。
  • (2)不同学业成就学习者情绪的差异性分析。引入学习者的最终成绩情况,把他们分词高成就、中等成绩和低成就三个研究群体。使用重复度量方差分析法检验不同学业成就的学习者与其学业情绪之间是否存在交互作用,然后根据不同群体学习者对于不同情绪的情绪密度,以此来进行分析,研究同一情绪在群体之间的差异性以及同一群体中不同情绪的差异性。
  • (3)分析学习者情绪与学习效果在每周的相关性变化趋势

(2)使用的数据

SPOC论坛的评论以及评论时间,学习者的最终成绩

(3)总结与分析

与第一篇论文不同,这一篇论文针对的仅仅是已完成课程的学习者,主要是从情感方面来分析,分析情感变化趋势以及成绩与情感的关系。该论文使用的方法非常简单,仅仅用了情感词典,唯一的可圈可点之处就在于并非仅仅考虑积极和消极情感,还考虑了一种困惑情感,建立了一个困惑情感词典。但是其实从实验结果来看的话,消极情绪与困惑情绪的变化具有极高的相似性,单独拿出困惑情绪分析是否具有重要意义有待研究。 论文的方法极其简单,花了大量的精力和篇幅做了很多分析结果的研究,更侧重分析学生的行为心理,计算机方面学术性很弱。

3、An Emotion Oriented Topic Modeling Approach to Discover What Students are Concerned about in Course Forums

(1)内容概括

这篇论文也是在提取学习者的话题,与第一篇的不同之处在于,它在提取话题的时候,加入了情感方面,也就是说,对于同一个话题而言,大家的评论也都是带有情绪的【积极、消极和困惑】,所以最终提取出了一些带有情绪的话题,根据这些话题的概率主要研究以下几个方面:

  • 学生最关心的话题是什么,以及对这些话题的主要情感是怎样的
  • 情绪话题随时间的变化趋势
  • 针对不同成绩的学生。分别分析他们在各个情绪话题的时间变化趋势

(2)使用的数据

SPOC课程的评论及评论时间,用户的成绩。评论数量为10870条,参与评论的人数为752人。

(3)总结与概括

作者从始至终所采用的的也就是用概率统计学方法统计出的情绪话题概率,使用了第2篇论文中的情绪词典。这一篇论文更像把前两篇论文的内容结合在一起研究,最终结果看上去还是不错的,对于不同的话题有不同的情感。

4、Unfolding Sentimental and Behavioral Tendencies of Learners’ Concerned Topics From Course Reviews in a MOOC

(1)内容概括

这篇论文在第三篇论文的基础上,又增加了一个用户行为的特征,主要包括{发表评论,回复评论,点赞,晒证书}这四种行为。也就是说此时作者提炼的是基于情感和行为的学习者关心的话题,最后统计行为、情感和话题的关系,找出每个话题的单词分布、主导情绪和行为分布。

另外与之前不同的一点在于,之前分析对象针对的是每个评论,即认为每个评论有一种情感和一个话题。现在分析更加细化,针对一条评论中的每个句子来分析,一个评论可能有多个句子,对每个句子都分析出一个话题和情感。但是行为其实是针对一个评论的,所以一个评论的多个句子都是同一种行为。

(2)使用的数据

MOOC网站的评论,学习者的行为【行为关联到评论】。

(3)总结与概括

作者这次在情感和话题的基础上又增加了行为这个特征,但是这次没有使用困惑这种感情,只有积极和消极两种情感。并且这一次没有针对具体的用户群体进行分析,即只对整个学习者群体进行分析,没有像之前那样根据成绩或者课程完成情况来进行分析。

5、总结

(1)关键词

e-Learning,  mooc,  spoc, online course, online study, online learning,
course forum, Course reviews,online course, online education community,

(2)相关论文



Search

    Table of Contents