基于RIPA方法的社会问答平台答案质量研究罗毅

第 59 卷第 3 期 2015 年 2 月
*
基于ＲIPA 方法的社会问答平台答案质量研究
■ 罗毅曹倩
武汉大学信息资源研究中心武汉 430072
摘要：［目的 / 意义］针对传统 IPA 方法在研究中存在的问题，引入一种改进型 IPA 理论（ＲIPA）并对社会问

答平台答案质量进行研究，从而引导社会问答平台运营商更好地开展服务，提高信息资源内容质量。［方法 / 过
程］通过分析传统 IPA 方法在理论上存在的不足，引入一种新的ＲIPA 理论，比较两者在社会问答平台答案质量
中的应用，并对研究结果进行相关分析。［结果 / 结论］ＲIPA 和 IPA 两种方法在社会问答平台答案质量研究中
的应用表明，前者有更高的可行度；同时，“完整性”、“专业性”和“权威性”3 个指标是解决社会问答平台答案
质量的关键因素，并对社会问答平台的建设提出相关建议。
关键词：社会问答平台答案质量ＲIPA IPA
分类号： G250
DOI： 10． 13266 / j． issn． 0252 － 3116． 2015． 03． 018
式，利用电话访谈总结出用户参与的 5 种动机； E．
1 引言
Choi［15］、J． Lou［16］等人在用户动机对答案数量和质量
社会问答平台（ social Q＆A sites，SQA），又被称为的影响方面作了相关研究。
社会问答社区或者问答平台等。目前，业界对于社会基于内容的研究主要包括问题分类、问题检索研
［1］
问答平台的定义还没有一个统一的标准，C． Shah 从问题推荐和答案质量研究。在问题分类研究方面，
究、
用户服务的角度将其定义为一种提供用户使用自然语主要是对已有分类模型比较分析，并进行结合
［17 － 18］
；
言表达信息需求以满足用户需求，并鼓励用户积极参使用不同方法实现问题分类并改善分类效果
［19 － 20］
，并
与的知识社区平台。根据不同的问题类型来研究社会问答平台中信息保存
当前社会问答平台的研究主要集中在参与用户与价值与问题答案等相关研究课题
［21 － 22］
。在问题检索
平台内容两个方面。基于用户的研究主要包括用户的研究方面，在已有的关于问题检索模型的基础上，多位
分类研究、专家发现以及用户动机等。学者根据不同学者通过比较与实验分析，提出了新的问题检索模
的分类标准和研究重点，对社会问答平台的用户分类型
［23 － 25］
以及翻译模型
［26 － 28］
，以弥补传统模型的不足。
［2 － 5］
有所不同，而对于 SQA 用户的研究主要集中在提在问题推荐研究方面，学者们根据用户兴趣
［29］
、用户
问者和回答者上。回答者中，活跃度高并能提供大量需求
［30］
、问题分类［31］
以及用户和问题二者之间的匹
高质量答案的核心用户被称为专家（ Experts ），L．配
［32 － 33］
等方面提出推荐模型，以解决用户推送问题；
Chen［6］、P． Jurczyk［7 － 8］、G． Zhou［9］、M． Bouguessa［10］等学一些学者还考虑到答案的质量
［34］
、回应问题的速
者对专家用户的权威性计算分析方法及有效性等问题度
［35 － 36］
、推送重点［37］
、语义关系［38 － 39］
等问题，并进行
［11］
开展了研究。C． Shah 发现社会问答平台提供的一重点研究，从而优化推荐模型。
些激励措施促使大量用户参与到知识交流与共享中就与本文相关的答案质量研究而言，经济指标对
来，而这种参与动机又是社会问答平台成功的关键所社会问答平台答案质量的影响是相当大的，学者们通
［12 － 13］
在。D．Ｒ．Ｒaban 等提出一个包含内部动机和外过比较不同类型的问答服务平台的答案质量，来研究
［14］［40 － 42］
部动机的概念框架； K． K． Nam 等采用半结构化的方价格、消费、声誉与答案质量之间的关系。Z．
* 本文系教育部人文社会科学重点研究基地重大项目“数字信息资源的质量控制与管理研究”（项目编号： 12JJD820008）研究成果之一。

作者简介：罗毅（ OＲCID： 0000 － 0001 － 7203 － 0493），博士研究生，E-mail： 798720175@163． com；曹倩（ OＲCID： 0000 － 0003 － 0216 － 575X），硕
士研究生。
收稿日期： 2014 － 12 － 22 修回日期： 2015 － 01 － 08 本文起止页码： 126 － 133，
25 本文责任编辑：王传清
126
罗毅，曹倩．基于ＲIPA 方法的社会问答平台答案质量研究［J］．图书情报工作， 59（ 3）： 126 － 133，
2015， 25．
Zhu［43］、J． Jeon［44］、E． Agichtein［45］等人从不同角度提出重要程度主要取决于其实际绩效水平，即在绩效感知

了评价答案质量的模型和体系。还有一些学者通过收较低时必备属性起着至关重要的作用，绩效感知高
集答案和用户评论进行分析，也得出答案质量的评价时魅力属性则更为重要，仅期望因素与用户的总体
［22，
46 － 47］
标准和指标。满意度呈线性关系，衡量质量指标的绩效感知与用
然而，现有的关于问答平台答案质量的研究大多户的总体满意度之间是非对称性的关系，即第二个
在于构建答案质量的评价指标以及分析其相关影响因假设也不成立。由此引出一种新的方法来解决上述
素，对评价指标本身的研究则相对较少，本研究主要对问题。
已有的较为成熟的答案质量评价指标进行研究。笔
［48］
者在前期的研究中主要采用了独立样本 T 检验和
［49］
J． A． Martilla 等提出的 IPA 分析方法对社会问答
平台答案质量的绩效感知和重要性期望感知的差异
进行分析。而本研究主要是对同一批用户对社会问
答平台答案质量的重要性与绩效感知的差异性进行
调查，因此采用配对样本 T 检验较为合适。同时，笔
者运用一种改进型的 IPA 方法来分析衡量社会问答
图1 Three-factor 理论图［53］
平台答案质量的重要影响因素。
为了避免用户绩效感知与重要性感知之间的
2 研究方法［54］
影响，K． Matzler 等通过引申重要性（ implicitly de-
［49］
IPA 方法最早是由 J． A． Martilla 和 J． C． James rived importance）来代替用户重要性感知，其采用多
于 1977 年提出的一种研究企业产品与服务满意度影元线性回归的方法，以用户的绩效感知为自变量，
响因素的有效方法，要求受访者对各项衡量指标从以总体满意度为因变量，来计算每个衡量指标的重
重要性感知与绩效感知两个方面进行衡量，并构建要程度。但是他并没有考虑到衡量指标之间的多
一个二维矩阵。以横坐标轴表示重要性期望感知，元共线性问题，W． Deng
［55］
采用偏相关分析和自然
以纵坐标轴表示绩效性期望感知，以重要性期望感对数转化的方法，即一种改进型的 IPA 分析方法（ re-
知与绩效感知的总体平均值为分割点将其分为 4 个 vised importance-performance analysis，ＲIPA）来计算衡
象限。量指标与用户满意度的关系（引申重要性），主要分
虽然 IPA 方法被广泛使用，但其也存在着相应的为 3 步： ①将衡量指标的绩效感知质量值转化为自然
［50］
问题。K． Matzler 等指出 IPA 方法存在两个隐含的对数的形式，表示衡量质量指标的数量； ②将绩效感
假设：首先，衡量指标的重要性感知与绩效感知是两个知的自然对数值与用户的总体满意度（ overall cus-
相对独立的变量；其次，衡量指标的绩效感知与用户的 tomer satisfaction，OCS）作为变量带入多元相关模型
总体满意度之间存在线性或对称性的关系。K． Mat- 中； ③计算每个指标与 OCS 之间的偏相关系数作为
zler［50］、H． Oh 等［51］相关学者研究表明绩效感知与重要其引申重要性参数，这也构成了本文运用ＲIPA 方法
性期望感知之间存在因果关系，即第一个假设不成立。的基本过程。
［52］
同时 E． W． Anderson 等将用户的满意度属性分为 3
类：必备属性（ basic factors）、期望因素（ performance fac- 3 数据分布与数据检验
tors）和魅力属性（ excitement factors）。必备属性是满为了比较两种不同 IPA 方法的优劣，采用与前期
足用户的最基本需求的因素，但必备属性仅会对用户研究相同的数据集，衡量社会问答平台答案质量的标
的不满产生影响，必备属性值提高并不会提高用户的准依然采用 Z． Zhu 等
［43］
通过问卷调查、专家经验以及
满意度。魅力属性对用户的满意度产生直接的影响，优劣答案的比较提出的包含 13 个指标的用以衡量答
但魅力属性的降低并不会使用户产生不满意的倾向。案质量的多维模型。问卷调查分为 3 个部分： ①根据
而期望因素则与用户的满意度成线性的关系，期望因被调查者使用社会问答平台的经历，对其答案质量绩
素值高则用户满意度高，期望因素值低则用户的满意效感知进行评价，即得到用户对社会问答平台答案质
度较低（见图 1）。由此可见，必备属性和魅力属性的量的绩效感知数据； ②根据被调查者的信息需求情况
127
第 59 卷第 3 期 2015 年 2 月
对所期望的答案质量进行描述，即得到用户对答案质表2 公因子方差
量重要性的期望感知数据； ③根据用户自身的感知对绩效感知重要性期望感知
社会问答平台总体满意度进行评价。数据主要通过调题项萃取题项萃取题项萃取题项萃取
信息量． 566 详细． 760 信息量． 648 详细． 777

查问卷的形式获取，其中纸质问卷 200 份，共收回 195
表达方式． 659 原创性． 695 表达方式． 766 原创性． 467
份，有效问卷 186 份；网络问卷 315 份，收回 283 份，有
完整性． 730 客观公正性． 656 完整性． 822 客观公正性． 745
效问卷 268 份，获得总问卷数为 454 份，有效率为阅读性． 684 创新性． 718 阅读性． 747 创新性． 592
88． 2% 。相关性． 672 实用性． 625 相关性． 799 实用性． 772
3． 1 数据分布情况简洁明了． 657 专业性． 763 简洁明了． 669 专业性． 720
在 454 份有效问卷中，受访者的学科背景、性别、权威性． 768 权威性． 711
知识层次、使用时间的分布情况见表 1。由表 1 中数据

4 社会问答平台答案质量感知差异性
可知：调查对象在学科的分布上较为平均，文理科被调
查人数基本持平；在知识层次上，本科学生的数量与硕分析与 IPA 方法的应用
士及硕士以上的人数相等。超过 50% 的用户使用社社会问答平台答案质量重要性期望感知与绩效感
会问答平台的年限超过两年，表示被调查者对于社会知差异性分析主要采用样本均值和配对样本 T 检验来
问答平台答案质量的评价能在一定程度上反映用户对进行，
表 3 中重要性期望感知的 13 个维度均值在 3． 38
资源质量的认知。－ 3． 94 之间，
处于重要到比较重要之间，即用户对答案
［48］
表1 受访者分布情况一览质量的重要性期望感知较高；标准偏差均小于 1，
在一定
项目调查内容样本份数百分比项目调查内容样本份数百分比程度上表明用户对答案质量重要性期望感知认同度较
学科文科 235 51． 8 知识层次本科 243 53． 5 高。绩效感知的 13 个维度均值在 2． 93 － 3． 5 之间，相比
理科 219 48． 2 硕士以上 211 46． 5 用户对社会问答平台答案质量重要性期望感知而言，绩
性别男 188 41． 4 使用时间 2 年以下 214 47． 1

效感知得分较低，
表明用户对社会问答平台答案质量的
满意度较低；除“原创性”指标外，其他指标标准偏差小
女 266 58． 6 2 年以上 240 52． 9
于 1，
在一定程度上表明用户对其他指标的绩效感知较
3． 2 数据检验为统一，
而对原创性的认识上存在一定的差距。
在对问卷数据进行分析之前，需要进行信度和效由上文分析可知，社会问答平台答案质量重要性
度检验，量表只有通过了信度和效度检验，其所测数据期望感知与绩效感知之间存在差异，且绩效感知低于
才具有可靠性和有效性。信度指问卷具有稳定性和一重要性期望感知，通过配对样本 T 检验进一步对这种
致性，利用 SPSS 19． 0 软件，对问卷内容进行内在一致差异进行显著性分析，表 3 中成对样本检验数据显示，
性分析，内在一致性分析一般用 Cronbach α 值来衡量。重要性期望感知与绩效感知的差异较为明显，同时各
绩效感知的 Cronbach’s α = 0． 907（ α ＞ 0． 7），重要性期个维度的 P 值小于显著水平 0． 05，也说明了平均值之
望感知的 Cronbach’s α = 0． 918（ α ＞ 0． 7），说明测量指间存在着显著的差异，这种显著性差异为我们用 IPA
标具有良好的内部一致性。方法分析社会问答平台答案质量影响因素提供了良好
在效度检验中，本文主要采用建构效度，即因子的基础。同时由配对样本 t 值中的均值大小可知，“专
分析法进行效度检验。在进行因子分析前，先计算业性”、“权威性”、“完整性”和“客观公正 ”的重要性
两组变量的 KMO 值，以确定样本是否适合进行因子与绩效感知的差异绝对值最大，而“信息量”、“阅读
分析。用户绩效感知与重要性期望感知 KMO 分别性”和“简洁明了”的绝对值较小，即当前用户对于社
为 0． 923 和0． 937，大于给定的 0． 7 的标准，表明两组会问答平台答案质量的非内容特征变量要求与实际
数据适合进行因子分析。表 2 为析取一个公因子时绩效差距较小，而答案质量的内容特征的相关变量
的共同性萃取值，萃取值的大小表示题项与测量的则存在较大的差距。
公因子的密切程度。从表 2 中可以得到绩效感知利用表 3 的数据，以绩效感知为纵轴，绩效感知的
与重要性期望感知的共同性都高于 0 ． 2 ，即题项所总平均值为分割点，衡量答案质量的相关指标根据其
测度的行为或心理特质具有一致性，因此通过效度重要性期望感知和绩效感知的大小分布在图 2 的四个
检验。象限中。
128
2015， 25．
表3 均值比较与配对样本 T 检验
重要性绩效感知配对样本 t 检验
序号衡量指标
均值标准偏差均值标准偏差均值 t Sig．（双侧）
1 信息量 3． 64 ． 885 3． 36 ． 902 ． 280 － 5． 665 0． 00
2 表达方式 3． 73 ． 889 3． 37 ． 834 ． 361 － 7． 38 0． 00
3 完整性 3． 81 ． 865 3． 17 ． 862 ． 641 － 12． 916 0． 00
4 阅读性 3． 73 ． 897 3． 45 ． 803 ． 275 － 6． 118 0． 00
5 相关性 3． 93 ． 886 3． 44 ． 822 ． 485 － 10． 605 0． 00
6 简洁明了 3． 62 ． 865 3． 40 ． 836 ． 218 － 4． 564 0． 00
7 权威性 3． 82 ． 929 3． 03 ． 919 ． 789 － 13． 839 0． 00
8 详细性 3． 71 ． 873 3． 25 ． 884 ． 463 － 9． 281 0． 00
9 原创性 3． 38 ． 953 2． 97 1． 038 ． 407 － 7． 273 0． 00
10 客观公正性 3． 81 ． 911 3． 19 ． 842 ． 615 － 12． 274 0． 00
11 创新性 3． 44 ． 901 2． 93 ． 993 ． 515 － 10． 159 0． 00
12 实用性 3． 94 ． 883 3． 5 ． 808 ． 436 － 9． 893 0． 00
13 专业性 3． 85 ． 881 3． 05 ． 921 ． 890 － 16． 280 0． 00
总平均值 3． 72 3． 23
5 ＲIPA 方法应用与比较分析
5． 1 社会问答平台答案质量引申重要性与ＲIPA 方
法的应用
衡量社会问答平台答案质量 13 个指标的引申重要性
值来自于各个指标的绩效感知质量与用户的总体满意度
的偏相关系数值。各个衡量质量指标的隐身重要性的值
介于 0． 008 － 0． 157 之间，
总体平均引申重要性为 0． 082，
其
中“信息量”与总体满意度的偏相关系数值最高，
表示“信
息量”指标对用户的总体满意度影响最大。“详细性”与
总体满意度的偏相关系数值较低，
表明答案的详细性对用
户总体满意度影响较小。引申重要性排名与用户感知重
要性排名存在较大差异，
其中“信息量”、
“客观公正性”和
图2 绩效感知与重要性感知 IPA 分析 “原创性”等指标排名先后顺序差别较大如表 4 所示：
表4 引申重要性
指标引申重要性排名重要性感知排名指标引申重要性排名重要性感知排名
信息量 0． 157 1 10 完整性 0． 144 2 6
实用性 0． 143 3 1 相关性 0． 115 4 2
权威性 0． 114 5 4 专业性 0． 095 6 3
原创性 0． 080 7 13 创新性 0． 065 8 12
表达方式 0． 053 9 8 阅读性 0． 047 10 7
客观公正 0． 026 11 5 简洁明了 0． 024 12 11
详细性 0． 008 13 9
以绩效感知为纵轴，绩效感知的总平均值为分割 5． 2 两种 IPA 方法的比较

点，以表 4 中引申重要性为横轴，引申重要性的总平均在本节中，主要通过 IPA 和ＲIPA 方法中的 4 个象
值为分割点，构建基于绩效感知与引申重要性的ＲIPA 限及其相应指标分析来比较两种方法在社会问答平台
分析图（见图 3）。答案指标研究中的应用（见表 5）。
129
第 59 卷第 3 期 2015 年 2 月
为有限。基于ＲIPA 方法的该区域变量为“表达方

式”、“阅读性”、“简洁性”和“详细性”，该区域变量皆
为答案的外部表达特征，其引申重要性认识较低，即用
户对答案的外部特征关注较少，更加倾向于对答案内
容质量的判断，这种用户偏好要求提供者更加注重信
息内容本身的信息质量问题。
第三象限为“毋需优先”区域，其特点为引申重要
［57］
性（重要性感知）值与绩效感知值都较低。Ｒ． Gazan
的研究将回答者分为依据自身专业知识为用户提供相
关答案但不参考其他信息源的 specialists 和提供引用
其他信息源的相关信息知识的 synthesists 两类，而用户
“原创性”的信息资源可信度较低，用户更倾向于选择
［43］
图3 绩效感知与引申重要性ＲIPA 分析有可靠信息来源的信息。Z． Zhu 的研究显示“创新
性”指标与用户总体满意度呈负相关，即创新性的提高
表5 IPA 与ＲIPA 方法 4 个象限指标比较［56］
会降低用户总体满意度，C． Shah 等人的研究发现
象限 IPA 分析法ＲIPA 分析法
“创新性”对于社会问答平台质量的判断有着十分重
第一象限实用性、相关性、表达方式、阅信息量、相关性、实用性
读性要的影响，但是其不足以去判断最佳答案，同时“客观
第二象限详细性、信息量、简洁明了表达方式、阅读性、简洁性、详公正”指标对总体答案质量的影响较小，提高答案的公
细性
正性对于提高用户对社会问答平台答案质量的满意度
第三象限创新性、原创性原创性、客观公正、创新性
感知影响较小，将其划分为第三象限则更为合理。该
第四象限专业性、权威性、客观公正、完完整性、权威性、专业性
整性区域的 3 个指标表明用户对从社会问答平台所获取的
信息资源定位较为清楚，事实性的答案更受用户青睐。
第一象限为“继续保持”区域，在这一区域引申重
第四象限为“重点改善”区域，其特点是引申重要
要性（重要性感知）值与绩效感知值都较高。“信息
性（重要性感知）值较高而绩效感知值较低，因此该区
量”的高低表示用户参与该问题问答的广度和深度，用
域的维度是社会问答平台答案质量应该重点关注的问
户参与越多获得的信息质量越高。同时，用户使用社
题。在两种方法中，“专业性”、“权威性”、“完整性”都
会问答平台的主要目的在于获取信息，其对答案质量
属于该区域，这就要求社会问答平台答案质量的改善
的界定更加侧重于答案的实用性以及与问题的相关程
应该集中在以内容特征为标准的相关维度上。从社会
［43］
度，以更好满足用户的信息需求。同时 Z． Zhu 等通
问答平台答案质量的“专业性”和“权威性”来看，社会
过用户调研和专家访谈等方法研究发现“实用性”、
问答平台作为一种网上参考咨询服务，其与图书馆虚
“专业性”和“信息量”是影响社会问答平台答案总体
拟参考咨询服务有所不同，后者主要是由具有相关专
质量最重要的 3 个指标，其中“实用性”与总体质量的业素养的图书馆人员通过检索相关信息来满足用户的
相关程度高达 0． 92，而“阅读性”对答案总体质量的影［40］
信息需求，其专业性相对较高，而 F． M． Harper 等的
响则相对较小。“信息量”指标主要表示答案所提供研究表明社会问答平台的质量要高于虚拟参考服务和
［56］［44］
的信息能否满足用户的需求，C． Shah 、J． Jeon 和专家咨询所获得的信息，这一结论也被 Y． Chen 等
［41］
［45］
E． Agichtein 等通过相关数据分析都证明了其与答案所验证，因此国内社会问答平台答案在“专业性”上还
总体质量存在显著性的相关关系，由此可以得出基于有很大的发展空间。“专业性”和“权威性”作为社会
ＲIPA 方法的第一象限指标的划分更加符合已有的相问答平台答案质量的重要标准，得到了社会问答平台
关研究。质量研究者的广泛关注，其中专家发现（ expert finding）
第二象限为“过度表现”区域，其特点是引申重要和问题推荐（ question routing）体现得尤为明显。该区
性（重要性感知）值相对较低而绩效感知值较高，即表域 3 个质量指标是当前改善社会问答平台答案质量的
示该区域指标在社会问答平台答案中表现较为突出，关键所在，因此提高该区域相关指标对于提高用户的
但是其对社会问答平台答案质量总体满意度的影响较总体满意度有着十分重要的意义，也为社会问答平台
130
2015， 25．
运营商工作的改善提供了相关的参考。条的专业性、权威性，为用户带来更加及时、专业、权
［39］
在本节的研究中，通过对两种方法产生的结果进威、准确的信息。②发挥社会问答平台用户问题的
行分析可知，ＲIPA 对社会问答平台答案质量研究的结推荐作用。用户生成问题为用户满足自身的信息需求
果比 IPA 的研究结果更加契合现有的社会问答平台研提供了有效途径，但是海量的问题信息资源在为信息
究结论。搜寻者带来便利的同时也给回答者寻找自己擅长领域
问题的带来相应的困难，做好问题的推荐工作，优化问
6 讨论与建议题推荐算法，将问题推荐给相关领域的专家以保障答
通过上文对质量绩效感知与重要性感知差异性的案质量的权威性和专业性至关重要。“完整性”指标
分析以及两种 IPA 方法在社会问答平台答案质量分析的实现则需要社会问答平台加强相关规范的制定，完
中的比较应用，可以得出如下结论：善用户奖励机制，积极引导用户完整有效地回答相关
第一，社会问答平台答案质量的绩效感知满意度问题，同时也要求参与者提高自身的信息素养，更好地
表现一般，并采用配对样本 T 检验的方法验证绩效感扮演在社会问答平台中的角色。
知与重要性期望感知之间存在显著性的差异。同时为
了解决 IPA 方法存在的问题，引入ＲIPA 方法，并对两
7 结语
种方法进行比较分析。本文主要通过配对样本 T 检验、IPA 和ＲIPA 3 种
第二，ＲIPA 分析方法相对于 IPA 分析方法更具有方法对社会问答平台答案质量相关指标进行研究，结
优势：首先从理论基础角度出发，ＲIPA 方法解决了传果表明用户对答案质量的重要性期望感知和绩效感知
统方法中存在两个潜在假设前提的问题，即绩效感知存在显著性的差异，同时ＲIPA 方法比 IPA 方法在答案
与重要性期望为相互独立的变量且绩效感知与用户的质量研究中表现的更为有效。ＲIPA 方法的应用表明
总体满意度之间存在线性关系，利用引申重要性的方答案质量的“完整性”、“专业性”、“权威性”是影响社
法来计算各个衡量指标对用户总体满意度的影响，以会问答平台答案质量的重要变量，同时要求社会问答
此来构建基于绩效感知和引申重要性的答案质量ＲI- 平台不断地优化答案质量，提高用户的忠诚性，增加用
PA 分析框架；其次从应用角度出发，ＲIPA 分析方法对户粘度。
社会问答平台答案质量指标的研究较 IPA 方法的可行本文研究过程中也存在以下不足： ①问卷调查的
度更高，通过对ＲIPA 与 IPA 方法中 4 个象限相关指标对象仅限于一定数量的学生，并没有对社会问答平台
的分析可知，ＲIPA 方法所得到的分类标准与其他研究的其他用户进行调查分析； ②对于两种方法的比较分
者的研究较为契合，而 IPA 方法中相关区域指标的分析侧重较多，而对于ＲIPA 方法所产生的结果本身的分
类与已有的研究则存在较多的冲突。析较少，且分析的深度有限。
第三，ＲIPA 方法对 13 个衡量社会问答平台答案参考文献：
质量的指标分类表明，国内社会问答平台在答案的“信［1 ］ Shah C，Oh S，Oh J S．Ｒesearch agenda for social Q＆A［J］． Li-
息量”、“相关性”和“实用性”3 个方面具有优势，能够 brary ＆ Information Science Ｒesearch，2009，31（ 4）： 205 － 209．

［2 ］毛波，尤雯雯．虚拟社区成员分类模型［J］．清华大学学报（自
有效地满足用户的信息需求。而用户对答案的“表达
然科学版），
2006（ S1）： 1069 － 1073．
方式”、“阅读性”、“简洁性”、“详细性”等外部特性指
［3 ］王伟军，甘春梅． Web2． 0 信息资源管理［M］．北京：科学出版
标要求相对较低。其中“完整性”、“权威性”和“专业社，2011．
性”3 个指标对用户的总体满意度影响较大，而其实际［4 ］张中峰，李秋丹．社区问答系统研究综述［J］．计算机科学，
的绩效感知质量则相对较低，这种差异性要求社会问 2010，37（ 11）： 19 － 23．
答平台更加注重该区域指标的建设。对于“权威性” ［5 ］ Gazan Ｒ． Seekers，sloths and social reference： Homework ques-

tions submitted to a question-answering community［J］． New Ｒe-
和“专业性”指标的改善，可以从以下两个方面着手：
view of Hypermedia and Multimedia，2007，13（ 2）： 239 － 248．
①加强同相关领域权威机构间的合作，积极引导和鼓
［6 ］ Chen Lin，Nayak Ｒ． Expertise analysis in a question answer portal
励领域专业人士的参与。这方面可以借鉴百度百科的
for author ranking［C］/ / Proceedings of the 2008 IEEE / WIC /
合作模式：百度百科先后与 82 家机构建立权威编辑合 ACM International Conference on Web Intelligence and Intelligent
作模式，合作方编辑对所属领域的百科词条，凭借自身 Agent Technology 2008 （ WI -IAT’08 ）． Sydney： IEEE Computer
专业资源丰富相关词条内容，以合作编辑形式提升词 Society，2008： 134 － 140．
131
第 59 卷第 3 期 2015 年 2 月
［7 ］ Jurczyk P，Agichtein E． Discovering authorities in question answer formation Systems，2013，9（ 6）： 2373 － 2381．
communities by using link analysis［C］/ / Proceedings of the Six- ［19］ Lei Yunqi，Jiang Yiyuan． Chinese question classification in com-
teenth ACM Conference on Conference on Information and Knowl- munity question answering［EB / OL］．［2014 － 12 － 08］． http： / /
edge Management （ CIKM ’07）． New York： ACM，2007： 919 － ieeexplore． ieee． org / stamp / stamp． jsp？ tp = ＆arnumber =
922． 5707167．
［8 ］ Jurczyk P，Agichtein E． Hits on question answer portals： Explora- ［20］ Cai Li，Zhou Guangyou，Liu Kang，et al． Large -scale question
tion of link analysis for author ranking［C］/ / Proceedings of the classification in cQA by leveraging Wikipedia semantic knowledge
30th Annual International ACM SIGIＲ Conference on Ｒesearch and ［C］/ / Proceedings of the 20th ACM international conference on In-
Development in Information Ｒetrieval． New York： ACM，2007： formation and knowledge management． New York： ACM，2011：
845 － 846． 1321 － 1330．
［9 ］ Zhou Guangyou，Lai Siwei，Liu Kang，et al． Topic-sensitive prob- ［21］ Harper F M，Moy D，Konstan J A． Facts or friends？： Distinguis-
abilistic model for expert finding in question answer communities hing informational and conversational questions in social Q＆A sites
［C］/ / Proceedings of the 21st ACM International Conference on In- ［C］/ / Proceedings of the SIGCHI Conference on Human Factors in
formation and Knowledge Management． New York： ACM，2012： Computing Systems． New York： ACM，2009： 759 － 768．
1662 － 1666．［22］ Kim S，Oh J S，Oh S． Best-answer selection criteria in a social
［10］ Bouguessa M，Dumoulin B，Wang S． Identifying authoritative ac- Q＆A site from the user -oriented relevance perspective［J］． Pro-
tors in question -answering forums： The case of yahoo！ answers ceedings of the American Society for Information Science and Tech-
［C］/ / Proceedings of the 14th ACM SIGKDD International Confer- nology，2007，44（ 1）： 1 － 15．
ence on Knowledge Discovery and Data Mining． New York： ACM，［23］ Wu Haocheng，Wu Wei，Zhou Ming，et al． Improving search rele-
2008： 866 － 874 vance for short queries in community question answering［C］/ / Pro-
［11］ Shah C，Oh J S，Oh S． Exploring characteristics and effects of user ceedings of the 7th ACM International Conference on Web Search
participation in online social Q＆A sites［J］． First Monday，2008， and Data Mining． New York： ACM，2014： 43 － 52．
13（ 9）： 145 － 157．［24］Cao Xin，Cong Gao，Cui Bin，et al． The use of categorization infor-
［12］Ｒaban D Ｒ． Self-presentation and the value of information in Q＆A mation in language models for question retrieval［C］/ / Proceedings
websites［J］． Journal of the American Society for Information Sci- of the 18th ACM Conference on Information and Knowledge Man-
ence and Technology，2009，60（ 12）： 2465 － 2473． agement． Hong Kong： ACM，2009： 265 － 274．
［13］Ｒaban D，Harper F． Motivations for answering questions online．［25］ Ji Zongcheng，Xu Fei，Wang Bin． A category-integrated language
［EB / OL］．［2014 － 12 － 08］． http： / / citeseerx． ist． psu． edu / model for question retrieval in community question answering
viewdoc / download？ doi = 10． 1． 1． 119． 1962＆rep = rep1＆type = ［M］/ / Information Ｒetrieval Technology． New York： Springer Ber-
pdf． lin Heidelberg，2012： 14 － 25．
［14］ Nam K K，Ackerman M S，Adamic L A． Questions in，knowledge ［26］ Lee J T，Kim S B，Song Y I，et al． Bridging lexical gaps between
in？： A study of naver’s question answering community［C］/ / Pro- queries and questions on large online Q＆A collections with compact
ceedings of the SIGCHI Conference on Human Factors in Compu- translation models［C］/ / Proceedings of the Conference on Empiri-
ting Systems． New York： ACM，2009： 779 － 788． cal Methods in Natural Language Processing． Honolulu： Association
［15］ Choi E． Motivations and expectations for asking questions within for Computational Linguistics，2008： 410 － 418．
online Q＆A．［EB / OL］．［2014 － 12 － 08］． http： / / citeseerx．［27］ Zhou Tom Chao，Lin Chin Yew，King Irwin，et al． Learning to
ist． psu． edu / viewdoc / download？ doi = 10． 1． 1． 119． 1962＆rep = suggest questions in online forums［EB / OL］．［2014 － 12 － 08］．
rep1＆type = pdf． http： / / www． research． att． com / techdocs / TD_100545． pdf．
［16］ Lou Jie，Fang Yulin，Lim K H，et al． Contributing high quantity ［28］ Xue Xiaobing，Jeon J，Croft W B．Ｒetrieval models for question
and quality knowledge to online Q＆A communities［J］． Journal of and answer archives［C］/ / Proceedings of the 31st Annual Interna-
the American Society for Information Science and Technology， tional ACM SIGIＲ Conference on Ｒesearch and Development in In-
2013，64（ 2）： 356 － 371． formation Ｒetrieval． Singapore： ACM，2008： 475 － 482．
［17］ Qu Bo，Cong Gao，Li Cuiping，et al． An evaluation of classifica- ［29］ Guo Jinwen，Xu Shengliang，Bao Shenghua，et al． Tapping on the
tion models for question topic categorization［J］． Journal of the A- potential of q＆a community by recommending answer providers
merican Society for Information Science and Technology，2012，63 ［C］/ / Proceedings of the 17th ACM Conference on Information and
（ 5）： 889 － 903． Knowledge Management． Napa Valley： ACM，2008： 921 － 930．
［18］ Zhang Weinang，Zhang Yu，Xiao Shibin，et al． Exploring domain ［30］ Li Shuguang，Manandhar S． Improving question recommendation
specific feature weights for question classification enhancement in by exploiting information need［C］/ / Proceedings of the 49th Annu-
community-based QA services？［J］． Journal of Computational In- al Meeting of the Association for Computational Linguistics： Human
132
2015， 25．
Language Technologies-Volume 1． Portland： Association for Com- ［43］Zhu Zhemin，Bernhard D，Gurevych I． A Multi-Dimensional model
putational Linguistics，2011： 1425 － 1434． for assessing the quality of answers in social Q＆A sites．［EB /
［31］ Zhou Tom Chao，Lyu M Ｒ，King I． A classification -based ap- OL］．［2014 － 12 － 08］． http： / / tuprints． ulb． tu -darmstadt． de /
proach to question routing in community question answering［C］/ / 1940 /1 / TＲ_dimension_model． pdf．
Proceedings of the 21st International Conference Companion on ［44］ Jeon J，Croft W B，Lee J H，et al． A framework to predict the
World Wide Web． Lyon： ACM，2012： 783 － 790． quality of answers with non -textual features［C］/ / Proceedings of
［32］ Dror G，Koren Y，Maarek Y，et al． I want to answer： Who has a the 29th Annual International ACM SIGIＲ Conference on Ｒesearch
question？： Yahoo！ answers recommender system［C］/ / Proceedings and Development in Information Ｒetrieval． Seattle： ACM，2006：
of the 17th ACM SIGKDD International Conference on Knowledge 228 － 235．
Discovery and Data Mining． San Diego： ACM，2011： 1109 －［45］ Agichtein E，Castillo C，Donato D，et al． Finding high -quality
1117． content in social media［C］/ / Proceedings of the 2008 International
［33］ Zhou Guangyou，Liu Kang，Zhao Jun． Monolingual-based transla- Conference on Web Search and Data Mining． Palo Alto： ACM，
tion model for question routing［J］． Pattern Ｒecognition，2012： 2008： 183 － 194．
630 － 637．［46］ Adamic L A，Zhang Jun，Bakshy E，et al． Knowledge sharing and
［34］ Zhou Guangyou，Liu Kang，Zhao Jun． Joint relevance and answer yahoo answers： Everyone knows something［C］/ / Proceedings of
quality learning for question routing in community qa［C］/ / Pro- the 17th International Conference on World Wide Web． New York：
ceedings of the 21st ACM International Conference on Information ACM，2008： 665 － 674．
and Knowledge Management． Maui： ACM，2012： 1492 － 1496．［47］ Kim S，Oh S． Users’relevance criteria for evaluating answers in a
［35］ Li B，King I．Ｒouting questions to appropriate answerers in com- social Q＆A site［J］． Journal of the American Society for Informa-
munity question answering services［C］/ / Proceedings of the 19th tion Science and Technology，2009，60（ 4）： 716 － 727．
ACM International Conference on Information and Knowledge Man- ［48］ Luo Y，Li X，Jiang Y．Ｒesearch on cognition of answer quality of
agement． Toronto： ACM，2010： 1585 － 1588． social Q＆A sites based on analysis of perceptions of user expecta-
［36］ Fang Lei，Huang Minlie，Zhu Xiaoyan． Question routing in com- tions［J］． Geomatics and Information Science of Wuhan University，
munity based QA： Incorporating answer quality and answer content 2014，39（ 10）： 72 － 77．
［C］/ / Proceedings of the ACM SIGKDD Workshop on Mining Data ［49］Martilla J A，James J C． Importance-performance analysis ［J］． Jour-
Semantics． New York： ACM，2012： 5． nal of Marketing， 41（ 1）： 77 － 79．
1977，
［37］ Chang Shuo，Pal A．Ｒouting questions for collaborative answering ［50］ Matzler K，Bailom F，Hinterhuber H H，et al． The asymmetric rela-
in community question answering［C］/ / Proceedings of the 2013 tionship between attribute-level performance and overall customer satis-
IEEE / ACM International Conference on Advances in Social Net- faction： A reconsideration of the importance-performance analysis［J］．
works Analysis and Mining． Niagara： ACM，2013： 494 － 501． Industrial Marketing Management，2004，33（ 4）： 271 － 277．
［38］ Yan Zhenlei，Zhou Jie． A new approach to answerer recommenda- ［51］ Oh H．Ｒevisiting importance -performance analysis［J］． Tourism
tion in community question answering services［M］/ / Advances in Management，2001，22（ 6）： 617 － 627．
Information Ｒetrieval． New York： Springer Berlin Heidelberg，［52］Anderson E W，Mittal V． Strengthening the satisfaction-profit chain
2012： 121 － 132．［J］． Journal of Service Ｒesearch，2000，3（ 2）： 107 － 120．
［39］ Wu Hu，Wang Yongji，Cheng Xiao． Incremental probabilistic la- ［53］ Kano N，Seraku N，Takahashi F，et al． Attractive quality and
tent semantic analysis for automatic question recommendation must-be quality［J］． Journal of the Japanese Society for Quality
［C］/ / Proceedings of the 2008 ACM Conference on Ｒecommender Control，1984，14（ 2）： 147 － 156．
Systems． New York： ACM，2008： 99 － 106．［54］ Matzler K，Sauerwein E． The factor structure of customer satisfac-
［40］Harper F M，Ｒaban D，Ｒafaeli S，et al． Predictors of answer qual- tion： An empirical test of the importance grid and the penalty-re-
ity in online Q＆A sites［C］/ / Proceedings of the SIGCHI Confer- ward-contrast analysis［J］． International Journal of Service Industry
ence on Human Factors in Computing Systems． Florence： ACM， Management，2002，13（ 4）： 314 － 332．
2008： 865 － 874．［55］ Deng W． Using a revised importance -performance analysis ap-
［41］ Chen Yan，HO T H U A，KIM Y M I． Knowledge market design： proach： The case of Taiwanese hot springs tourism［J］． Tourism
A field experiment at Google Answers［J］． Journal of Public Eco- Management，2007，28（ 5）： 1274 － 1284．
nomic Theory，2010，12（ 4）： 641 － 664．［56］ Shah C，Pomerantz J． Evaluating and predicting answer quality in
［42］ Jeon G Y J，Kim Y M，Chen Yan．Ｒe-examining price as a predic- community QA［C］/ / Proceedings of the 33rd International ACM
tor of answer quality in an online Q＆A site［C］/ / Proceedings of SIGIＲ Conference on Ｒesearch and Development in Information Ｒe-
the SIGCHI Conference on Human Factors in Computing Systems． trieval． New York： ACM，2010： 411 － 418．
Atlanta： ACM，2010： 325 － 328．（下转第 25 页）
133
熊志正，官思发，朝乐门．计算机辅助信息分析的技术框架及其发展趋势［J］．图书情报工作， 59（ 3）： 19 － 25．
2015，
［J］．计算机研究与发展， 50（ 12）： 2483 － 2491．

2013， 2014（ 8）： 5 － 7，
研究［J］．情报探索， 10．
［25］覃雄派，王会举，杜小勇，等．大数据分析———ＲDBMS 与 Ma- ［30］ IBM 大数据与分析再升级大步迈进认知计算时代［EB / OL］．
pＲeduce 的竞争与共生［J］．软件学报， 23（ 1）： 32 － 45．
2012，［2014 － 03 － 21］． http： / / soft． chinabyte． com /393 /12878393．
［26］ Agrawal D，Das S，El Abbadi A． Big data and cloud computing： shtml．
Current state and future opportunities［C］/ / Ailamaki A．，Amer －［31］顾君忠．大数据与大数据分析［J］．软件产业与工程，
2013（ 4）：
Yahia S，Pate J，et al． Proceedings of the 14th International Confer- 17 － 21．
ence on Extending Database Technology． New York： ACM，2011：作者贡献说明：
530 － 533．
熊志正：提出研究思路，撰写论文初稿；
［27］ Dursun D，Haluk D． Data，information and analytics as services
官思发：撰写研究现状部分和修改论文；
［J］． Decision Support Systems，2013，
55（ 1）： 359 － 363．
朝乐门：对研究选题提供重要素材和指导，论文撰写和
［28］ Thomsa H D． Analytics 3． 0［J］． Harvard Business Ｒeview，2013
（ 12）： 65 － 72．
修改过程中提供修改建议。
［29］张鼐，张英，杜云，等．大数据环境下基于云的分析即服务平台
The Technological Framework for Computer Aided Information Analysis and Its Emerging Trends
Xiong Zhizheng1 Guan Sifa1 Chao Lemen1，2
1
School of Information Ｒesource Management，Ｒenmin University of China，Beijing 100872
2
Key Laboratory of Data Engineering and Knowledge Engineering （Ｒenmin University of China），MOE，Beijing 100872
Abstract：［Purpose / significance］This paper constructed a framework for the computer-aided information analytics
tasks and offered a top-design guideline for the computer-aided analyzing work．［Method / process］Based on the literature
review，this paper come up with an analytical framework consisting of database，data warehouse，OLTP，OLAP，BI and
DSS． This paper specifically introduces OLAP，data mining and knowledge discovery，social network analysis and big data
analytics as the most useful four kinds of the current core technologies for computer-aided information analysis．［Ｒesult /
conclusion］This paper analyzes the main challenges and puts forward an outlook for computer-aided information analysis．
Big data analytics will be an important research topic for computer-aided information analysis in future． Computer-aided
information analysis will make a great progress in the support of cloud computing and big data technologies，mobile compu-
ting and social computing will intersect with information analysis in future．
Keywords： computer aided information analysis data mining business intelligence big data analysis
欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟
（上接第 133 页）罗毅：提出研究思路，负责文章的整体撰写、数据的处
［57］ Gazan Ｒ． Specialists and synthesists in a question answering com- 理分析以及文章的修改等；
munity［J］． Proceedings of the American Society for Information
曹倩：负责引言部分的撰写、数据的预处理、文章格式
Science and Technology，2006，43（ 1）： 1 － 10．
和表达方式的修改等。
作者贡献说明：
Ｒesearch on Answers’Quality of Social Q＆A Platforms Based on ＲIPA

Luo Yi Cao Qian
Center for the Studies of Information Ｒesources of Wuhan University，Wuhan 430072
Abstract：［Purpose / significance］This paper will introduces ＲIPA，an improvement of IPA theory，into the re-
search on answers’quality of social Q＆A platforms，to guide the social Q＆A platforms operators to better serve and im-
prove the quality of information content．［Method / process］Analyzing the shortage of traditional IPA method in theory and
introducing the new theory of ＲIPA，it compares and analyzes their applications in social Q＆A platforms．［Ｒesult / con-
clusion］Compared with IPA，ＲIPA has higher feasibility． Integrity，professionalism and authority are three key factors to
improve the answers’quality of social Q＆A platforms． Some suggestions are also given．
Keywords： social Q＆A platform answer quality ＲIPA IPA
25

基于RIPA方法的社会问答平台答案质量研究 罗毅

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

基于RIPA方法的社会问答平台答案质量研究 罗毅

Încărcat de

Drepturi de autor:

Formate disponibile

第 59 卷 第 3 期 2015 年 2 月

摘要： ［目的 / 意义］针对传统 IPA 方法在研究中存在的问题，引入一种改进型 IPA 理论（ ＲIPA） 并对社会问

* 本文系教育部人文社会科学重点研究基地重大项目“数字信息资源的质量控制与管理研究”（ 项目编号： 12JJD820008） 研究成果之一。

Zhu［43］、J． Jeon［44］、E． Agichtein［45］ 等人从不同角度提出 重要程度主要取决于其实际绩效水平，即在绩效感知

信息量 ． 566 详细 ． 760 信息量 ． 648 详细 ． 777

在 454 份有效问卷中，受访者的学科背景、性别、 权威性 ． 768 权威性 ． 711

知识层次、使用时间的分布情况见表 1。由表 1 中数据

理科 219 48． 2 硕士以上 211 46． 5 用户对社会问答平台答案质量重要性期望感知而言，绩

性别 男 188 41． 4 使用时间 2 年以下 214 47． 1

1 信息量 3． 64 ． 885 3． 36 ． 902 ． 280 － 5． 665 0． 00

2 表达方式 3． 73 ． 889 3． 37 ． 834 ． 361 － 7． 38 0． 00

3 完整性 3． 81 ． 865 3． 17 ． 862 ． 641 － 12． 916 0． 00

4 阅读性 3． 73 ． 897 3． 45 ． 803 ． 275 － 6． 118 0． 00

5 相关性 3． 93 ． 886 3． 44 ． 822 ． 485 － 10． 605 0． 00

6 简洁明了 3． 62 ． 865 3． 40 ． 836 ． 218 － 4． 564 0． 00

7 权威性 3． 82 ． 929 3． 03 ． 919 ． 789 － 13． 839 0． 00

8 详细性 3． 71 ． 873 3． 25 ． 884 ． 463 － 9． 281 0． 00

9 原创性 3． 38 ． 953 2． 97 1． 038 ． 407 － 7． 273 0． 00

10 客观公正性 3． 81 ． 911 3． 19 ． 842 ． 615 － 12． 274 0． 00

11 创新性 3． 44 ． 901 2． 93 ． 993 ． 515 － 10． 159 0． 00

12 实用性 3． 94 ． 883 3． 5 ． 808 ． 436 － 9． 893 0． 00

13 专业性 3． 85 ． 881 3． 05 ． 921 ． 890 － 16． 280 0． 00

信息量 0． 157 1 10 完整性 0． 144 2 6

实用性 0． 143 3 1 相关性 0． 115 4 2

权威性 0． 114 5 4 专业性 0． 095 6 3

原创性 0． 080 7 13 创新性 0． 065 8 12

表达方式 0． 053 9 8 阅读性 0． 047 10 7

客观公正 0． 026 11 5 简洁明了 0． 024 12 11

以绩效感知为纵轴，绩效感知的总平均值为分割 5． 2 两种 IPA 方法的比较

为有限。基 于 ＲIPA 方 法 的 该 区 域 变 量 为“表 达 方

息量”、“相关性”和“实用性”3 个方面具有优势，能够 brary ＆ Information Science Ｒesearch，2009，31（ 4） ： 205 － 209．

答平台更加注重该区域指标的建设。对于“权威性” ［5 ］ Gazan Ｒ． Seekers，sloths and social reference： Homework ques-

Atlanta： ACM，2010： 325 － 328． （ 下转第 25 页）

［J］． 计算机研究与发展， 50（ 12） ： 2483 － 2491．

Ｒesearch on Answers’Quality of Social Q＆A Platforms Based on ＲIPA

S-ar putea să vă placă și

基于RIPA方法的社会问答平台答案质量研究罗毅

基于RIPA方法的社会问答平台答案质量研究罗毅

第 59 卷第 3 期 2015 年 2 月

摘要：［目的 / 意义］针对传统 IPA 方法在研究中存在的问题，引入一种改进型 IPA 理论（ＲIPA）并对社会问

* 本文系教育部人文社会科学重点研究基地重大项目“数字信息资源的质量控制与管理研究”（项目编号： 12JJD820008）研究成果之一。

Zhu［43］、J． Jeon［44］、E． Agichtein［45］等人从不同角度提出重要程度主要取决于其实际绩效水平，即在绩效感知

信息量． 566 详细． 760 信息量． 648 详细． 777

在 454 份有效问卷中，受访者的学科背景、性别、权威性． 768 权威性． 711

性别男 188 41． 4 使用时间 2 年以下 214 47． 1

为有限。基于ＲIPA 方法的该区域变量为“表达方

息量”、“相关性”和“实用性”3 个方面具有优势，能够 brary ＆ Information Science Ｒesearch，2009，31（ 4）： 205 － 209．

Atlanta： ACM，2010： 325 － 328．（下转第 25 页）

［J］．计算机研究与发展， 50（ 12）： 2483 － 2491．