Documente Academic
Documente Profesional
Documente Cultură
*
基于 RIPA 方法的社会问答平台答案质量研究
■ 罗毅 曹倩
武汉大学信息资源研究中心 武汉 430072
式,利 用 电 话 访 谈 总 结 出 用 户 参 与 的 5 种 动 机; E.
1 引言
Choi[15]、J. Lou[16] 等人在用户动机对答案数量和质量
社会问答平台( social Q&A sites,SQA) ,又被称为 的影响方面作了相关研究。
社会问答社区或者问答平台等。目前,业界对于社会 基于内容的研究主要包括问题分类、问题检索研
[1]
问答平台的定义还没有一个统一的标准,C. Shah 从 问题推荐和答案质量研究。在问题分类研究方面,
究、
用户服务的角度将其定义为一种提供用户使用自然语 主要是对已有分类模型比较分析,并进行结合
[17 - 18]
;
言表达信息需求以满足用户需求,并鼓励用户积极参 使用不同方法实现问题分类并改善分类效果
[19 - 20]
,并
与的知识社区平台。 根据不同的问题类型来研究社会问答平台中信息保存
当前社会问答平台的研究主要集中在参与用户与 价值与问题答案等相关研究课题
[21 - 22]
。在问题检索
平台内容两个方面。基于用户的研究主要包括用户的 研究方面,在已有的关于问题检索模型的基础上,多位
分类研究、专家发现以及用户动机等。学者根据不同 学者通过 比 较 与 实 验 分 析,提 出 了 新 的 问 题 检 索 模
的分类标准和研究重点,对社会问答平台的用户分类 型
[23 - 25]
以及翻译模型
[26 - 28]
,以弥补传统模型的不足。
[2 - 5]
有所不同 ,而对于 SQA 用户的研究主要集中在提 在问题推荐研究方面,学者们根据用户兴趣
[29]
、用户
问者和回答者上。回答者中,活跃度高并能提供大量 需求
[30]
、问题分类 [31]
以及用户和问题二者之间的匹
高质 量 答 案 的 核 心 用 户 被 称 为 专 家 ( Experts ) ,L. 配
[32 - 33]
等方面提出推荐模型,以解决用户推送问题;
Chen[6]、P. Jurczyk[7 - 8]、G. Zhou[9]、M. Bouguessa[10] 等学 一些学 者 还 考 虑 到 答 案 的 质 量
[34]
、回 应 问 题 的 速
者对专家用户的权威性计算分析方法及有效性等问题 度
[35 - 36]
、推送重点 [37]
、语义关系 [38 - 39]
等问题,并进行
[11]
开展了研究。C. Shah 发现社会问答平台提供的一 重点研究,从而优化推荐模型。
些激励措施促使大量用户参与到知识交流与共享中 就与本文相关的答案质量研究而言,经济指标对
来,而这种参与动机又是社会问答平台成功的关键所 社会问答平台答案质量的影响是相当大的,学者们通
[12 - 13]
在。D. R. Raban 等 提出一个包含内部动机和外 过比较不同类型的问答服务平台的答案质量,来研究
[14] [40 - 42]
部动机的概念框架; K. K. Nam 等采用半结构化的方 价格、消 费、声 誉 与 答 案 质 量 之 间 的 关 系 。Z.
126
罗毅,曹倩. 基于 RIPA 方法的社会问答平台答案质量研究[J]. 图书情报工作, 59( 3) : 126 - 133,
2015, 25.
127
第 59 卷 第 3 期 2015 年 2 月
对所期望的答案质量进行描述,即得到用户对答案质 表2 公因子方差
量重要性的期望感知数据; ③根据用户自身的感知对 绩效感知 重要性期望感知
社会问答平台总体满意度进行评价。数据主要通过调 题项 萃取 题项 萃取 题项 萃取 题项 萃取
128
罗毅,曹倩. 基于 RIPA 方法的社会问答平台答案质量研究[J]. 图书情报工作, 59( 3) : 126 - 133,
2015, 25.
表3 均值比较与配对样本 T 检验
重要性 绩效感知 配对样本 t 检验
序号 衡量指标
均值 标准偏差 均值 标准偏差 均值 t Sig. ( 双侧)
总平均值 3. 72 3. 23
5 RIPA 方法应用与比较分析
5. 1 社会问答平台答案质量引申重要性与 RIPA 方
法的应用
衡量社会问答平台答案质量 13 个指标的引申重要性
值来自于各个指标的绩效感知质量与用户的总体满意度
的偏相关系数值。各个衡量质量指标的隐身重要性的值
介于 0. 008 - 0. 157 之间,
总体平均引申重要性为 0. 082,
其
中“信息量”与总体满意度的偏相关系数值最高,
表示“信
息量”指标对用户的总体满意度影响最大。“详细性”与
总体满意度的偏相关系数值较低,
表明答案的详细性对用
户总体满意度影响较小。引申重要性排名与用户感知重
要性排名存在较大差异,
其中“信息量”、
“客观公正性”和
图2 绩效感知与重要性感知 IPA 分析 “原创性”等指标排名先后顺序差别较大如表 4 所示:
表4 引申重要性
指标 引申重要性 排名 重要性感知排名 指标 引申重要性 排名 重要性感知排名
详细性 0. 008 13 9
129
第 59 卷 第 3 期 2015 年 2 月
[45]
E. Agichtein 等通过相关数据分析都证明了其与答案 所验证,因此国内社会问答平台答案在“专业性”上还
总体质量存在显著性的相关关系,由此可以得出基于 有很大的发展空间。“专业性”和“权威性”作为社会
RIPA 方法的第一象限指标的划分更加符合已有的相 问答平台答案质量的重要标准,得到了社会问答平台
关研究。 质量研究者的广泛关注,其中专家发现( expert finding)
第二象限为“过度表现”区域,其特点是引申重要 和问题推荐( question routing) 体现得尤为明显。该区
性( 重要性感知) 值相对较低而绩效感知值较高,即表 域 3 个质量指标是当前改善社会问答平台答案质量的
示该区域指标在社会问答平台答案中表现较为突出, 关键所在,因此提高该区域相关指标对于提高用户的
但是其对社会问答平台答案质量总体满意度的影响较 总体满意度有着十分重要的意义,也为社会问答平台
130
罗毅,曹倩. 基于 RIPA 方法的社会问答平台答案质量研究[J]. 图书情报工作, 59( 3) : 126 - 133,
2015, 25.
运营商工作的改善提供了相关的参考。 条的专业性、权威性,为用户带来更加及时、专业、权
[39]
在本节的研究中,通过对两种方法产生的结果进 威、准确的信息 。②发挥社会问答平台用户问题的
行分析可知,RIPA 对社会问答平台答案质量研究的结 推荐作用。用户生成问题为用户满足自身的信息需求
果比 IPA 的研究结果更加契合现有的社会问答平台研 提供了有效途径,但是海量的问题信息资源在为信息
究结论。 搜寻者带来便利的同时也给回答者寻找自己擅长领域
问题的带来相应的困难,做好问题的推荐工作,优化问
6 讨论与建议 题推荐算法,将问题推荐给相关领域的专家以保障答
通过上文对质量绩效感知与重要性感知差异性的 案质量的权威性和专业性至关重要。“完整性”指标
分析以及两种 IPA 方法在社会问答平台答案质量分析 的实现则需要社会问答平台加强相关规范的制定,完
中的比较应用,可以得出如下结论: 善用户奖励机制,积极引导用户完整有效地回答相关
第一,社会问答平台答案质量的绩效感知满意度 问题,同时也要求参与者提高自身的信息素养,更好地
表现一般,并采用配对样本 T 检验的方法验证绩效感 扮演在社会问答平台中的角色。
知与重要性期望感知之间存在显著性的差异。同时为
了解决 IPA 方法存在的问题,引入 RIPA 方法,并对两
7 结语
种方法进行比较分析。 本文主要通过配对样本 T 检验、IPA 和 RIPA 3 种
第二,RIPA 分析方法相对于 IPA 分析方法更具有 方法对社会问答平台答案质量相关指标进行研究,结
优势: 首先从理论基础角度出发,RIPA 方法解决了传 果表明用户对答案质量的重要性期望感知和绩效感知
统方法中存在两个潜在假设前提的问题,即绩效感知 存在显著性的差异,同时 RIPA 方法比 IPA 方法在答案
与重要性期望为相互独立的变量且绩效感知与用户的 质量研究中表现的更为有效。RIPA 方法的应用表明
总体满意度之间存在线性关系,利用引申重要性的方 答案质量的“完整性”、“专业性”、“权威性”是影响社
法来计算各个衡量指标对用户总体满意度的影响,以 会问答平台答案质量的重要变量,同时要求社会问答
此来构建基于绩效感知和引申重要性的答案质量 RI- 平台不断地优化答案质量,提高用户的忠诚性,增加用
PA 分析框架; 其次从应用角度出发,RIPA 分析方法对 户粘度。
社会问答平台答案质量指标的研究较 IPA 方法的可行 本文研究过程中也存在以下不足: ①问卷调查的
度更高,通过对 RIPA 与 IPA 方法中 4 个象限相关指标 对象仅限于一定数量的学生,并没有对社会问答平台
的分析可知,RIPA 方法所得到的分类标准与其他研究 的其他用户进行调查分析; ②对于两种方法的比较分
者的研究较为契合,而 IPA 方法中相关区域指标的分 析侧重较多,而对于 RIPA 方法所产生的结果本身的分
类与已有的研究则存在较多的冲突。 析较少,且分析的深度有限。
第三,RIPA 方法对 13 个衡量社会问答平台答案 参考文献:
质量的指标分类表明,国内社会问答平台在答案的“信 [1 ] Shah C,Oh S,Oh J S. Research agenda for social Q&A[J]. Li-
131
第 59 卷 第 3 期 2015 年 2 月
[7 ] Jurczyk P,Agichtein E. Discovering authorities in question answer formation Systems,2013,9( 6) : 2373 - 2381.
communities by using link analysis[C]/ / Proceedings of the Six- [19] Lei Yunqi,Jiang Yiyuan. Chinese question classification in com-
teenth ACM Conference on Conference on Information and Knowl- munity question answering[EB / OL]. [2014 - 12 - 08]. http: / /
edge Management ( CIKM ’07) . New York: ACM,2007: 919 - ieeexplore. ieee. org / stamp / stamp. jsp? tp = &arnumber =
922. 5707167.
[8 ] Jurczyk P,Agichtein E. Hits on question answer portals: Explora- [20] Cai Li,Zhou Guangyou,Liu Kang,et al. Large -scale question
tion of link analysis for author ranking[C]/ / Proceedings of the classification in cQA by leveraging Wikipedia semantic knowledge
30th Annual International ACM SIGIR Conference on Research and [C]/ / Proceedings of the 20th ACM international conference on In-
Development in Information Retrieval. New York: ACM,2007: formation and knowledge management. New York: ACM,2011:
845 - 846. 1321 - 1330.
[9 ] Zhou Guangyou,Lai Siwei,Liu Kang,et al. Topic-sensitive prob- [21] Harper F M,Moy D,Konstan J A. Facts or friends?: Distinguis-
abilistic model for expert finding in question answer communities hing informational and conversational questions in social Q&A sites
[C]/ / Proceedings of the 21st ACM International Conference on In- [C]/ / Proceedings of the SIGCHI Conference on Human Factors in
formation and Knowledge Management. New York: ACM,2012: Computing Systems. New York: ACM,2009: 759 - 768.
1662 - 1666. [22] Kim S,Oh J S,Oh S. Best-answer selection criteria in a social
[10] Bouguessa M,Dumoulin B,Wang S. Identifying authoritative ac- Q&A site from the user -oriented relevance perspective[J]. Pro-
tors in question -answering forums: The case of yahoo! answers ceedings of the American Society for Information Science and Tech-
[C]/ / Proceedings of the 14th ACM SIGKDD International Confer- nology,2007,44( 1) : 1 - 15.
ence on Knowledge Discovery and Data Mining. New York: ACM, [23] Wu Haocheng,Wu Wei,Zhou Ming,et al. Improving search rele-
2008: 866 - 874 vance for short queries in community question answering[C]/ / Pro-
[11] Shah C,Oh J S,Oh S. Exploring characteristics and effects of user ceedings of the 7th ACM International Conference on Web Search
participation in online social Q&A sites[J]. First Monday,2008, and Data Mining. New York: ACM,2014: 43 - 52.
13( 9) : 145 - 157. [24]Cao Xin,Cong Gao,Cui Bin,et al. The use of categorization infor-
[12] Raban D R. Self-presentation and the value of information in Q&A mation in language models for question retrieval[C]/ / Proceedings
websites[J]. Journal of the American Society for Information Sci- of the 18th ACM Conference on Information and Knowledge Man-
ence and Technology,2009,60( 12) : 2465 - 2473. agement. Hong Kong: ACM,2009: 265 - 274.
[13] Raban D,Harper F. Motivations for answering questions online. [25] Ji Zongcheng,Xu Fei,Wang Bin. A category-integrated language
[EB / OL]. [2014 - 12 - 08]. http: / / citeseerx. ist. psu. edu / model for question retrieval in community question answering
viewdoc / download? doi = 10. 1. 1. 119. 1962&rep = rep1&type = [M]/ / Information Retrieval Technology. New York: Springer Ber-
pdf. lin Heidelberg,2012: 14 - 25.
[14] Nam K K,Ackerman M S,Adamic L A. Questions in,knowledge [26] Lee J T,Kim S B,Song Y I,et al. Bridging lexical gaps between
in?: A study of naver’s question answering community[C]/ / Pro- queries and questions on large online Q&A collections with compact
ceedings of the SIGCHI Conference on Human Factors in Compu- translation models[C]/ / Proceedings of the Conference on Empiri-
ting Systems. New York: ACM,2009: 779 - 788. cal Methods in Natural Language Processing. Honolulu: Association
[15] Choi E. Motivations and expectations for asking questions within for Computational Linguistics,2008: 410 - 418.
online Q&A. [EB / OL]. [2014 - 12 - 08]. http: / / citeseerx. [27] Zhou Tom Chao,Lin Chin Yew,King Irwin,et al. Learning to
ist. psu. edu / viewdoc / download? doi = 10. 1. 1. 119. 1962&rep = suggest questions in online forums[EB / OL]. [2014 - 12 - 08].
rep1&type = pdf. http: / / www. research. att. com / techdocs / TD_100545. pdf.
[16] Lou Jie,Fang Yulin,Lim K H,et al. Contributing high quantity [28] Xue Xiaobing,Jeon J,Croft W B. Retrieval models for question
and quality knowledge to online Q&A communities[J]. Journal of and answer archives[C]/ / Proceedings of the 31st Annual Interna-
the American Society for Information Science and Technology, tional ACM SIGIR Conference on Research and Development in In-
2013,64( 2) : 356 - 371. formation Retrieval. Singapore: ACM,2008: 475 - 482.
[17] Qu Bo,Cong Gao,Li Cuiping,et al. An evaluation of classifica- [29] Guo Jinwen,Xu Shengliang,Bao Shenghua,et al. Tapping on the
tion models for question topic categorization[J]. Journal of the A- potential of q&a community by recommending answer providers
merican Society for Information Science and Technology,2012,63 [C]/ / Proceedings of the 17th ACM Conference on Information and
( 5) : 889 - 903. Knowledge Management. Napa Valley: ACM,2008: 921 - 930.
[18] Zhang Weinang,Zhang Yu,Xiao Shibin,et al. Exploring domain [30] Li Shuguang,Manandhar S. Improving question recommendation
specific feature weights for question classification enhancement in by exploiting information need[C]/ / Proceedings of the 49th Annu-
community-based QA services? [J]. Journal of Computational In- al Meeting of the Association for Computational Linguistics: Human
132
罗毅,曹倩. 基于 RIPA 方法的社会问答平台答案质量研究[J]. 图书情报工作, 59( 3) : 126 - 133,
2015, 25.
Language Technologies-Volume 1. Portland: Association for Com- [43]Zhu Zhemin,Bernhard D,Gurevych I. A Multi-Dimensional model
putational Linguistics,2011: 1425 - 1434. for assessing the quality of answers in social Q&A sites. [EB /
[31] Zhou Tom Chao,Lyu M R,King I. A classification -based ap- OL]. [2014 - 12 - 08]. http: / / tuprints. ulb. tu -darmstadt. de /
proach to question routing in community question answering[C]/ / 1940 /1 / TR_dimension_model. pdf.
Proceedings of the 21st International Conference Companion on [44] Jeon J,Croft W B,Lee J H,et al. A framework to predict the
World Wide Web. Lyon: ACM,2012: 783 - 790. quality of answers with non -textual features[C]/ / Proceedings of
[32] Dror G,Koren Y,Maarek Y,et al. I want to answer: Who has a the 29th Annual International ACM SIGIR Conference on Research
question?: Yahoo! answers recommender system[C]/ / Proceedings and Development in Information Retrieval. Seattle: ACM,2006:
of the 17th ACM SIGKDD International Conference on Knowledge 228 - 235.
Discovery and Data Mining. San Diego: ACM,2011: 1109 - [45] Agichtein E,Castillo C,Donato D,et al. Finding high -quality
1117. content in social media[C]/ / Proceedings of the 2008 International
[33] Zhou Guangyou,Liu Kang,Zhao Jun. Monolingual-based transla- Conference on Web Search and Data Mining. Palo Alto: ACM,
tion model for question routing[J]. Pattern Recognition,2012: 2008: 183 - 194.
630 - 637. [46] Adamic L A,Zhang Jun,Bakshy E,et al. Knowledge sharing and
[34] Zhou Guangyou,Liu Kang,Zhao Jun. Joint relevance and answer yahoo answers: Everyone knows something[C]/ / Proceedings of
quality learning for question routing in community qa[C]/ / Pro- the 17th International Conference on World Wide Web. New York:
ceedings of the 21st ACM International Conference on Information ACM,2008: 665 - 674.
and Knowledge Management. Maui: ACM,2012: 1492 - 1496. [47] Kim S,Oh S. Users’relevance criteria for evaluating answers in a
[35] Li B,King I. Routing questions to appropriate answerers in com- social Q&A site[J]. Journal of the American Society for Informa-
munity question answering services[C]/ / Proceedings of the 19th tion Science and Technology,2009,60( 4) : 716 - 727.
ACM International Conference on Information and Knowledge Man- [48] Luo Y,Li X,Jiang Y. Research on cognition of answer quality of
agement. Toronto: ACM,2010: 1585 - 1588. social Q&A sites based on analysis of perceptions of user expecta-
[36] Fang Lei,Huang Minlie,Zhu Xiaoyan. Question routing in com- tions[J]. Geomatics and Information Science of Wuhan University,
munity based QA: Incorporating answer quality and answer content 2014,39( 10) : 72 - 77.
[C]/ / Proceedings of the ACM SIGKDD Workshop on Mining Data [49]Martilla J A,James J C. Importance-performance analysis [J]. Jour-
Semantics. New York: ACM,2012: 5. nal of Marketing, 41( 1) : 77 - 79.
1977,
[37] Chang Shuo,Pal A. Routing questions for collaborative answering [50] Matzler K,Bailom F,Hinterhuber H H,et al. The asymmetric rela-
in community question answering[C]/ / Proceedings of the 2013 tionship between attribute-level performance and overall customer satis-
IEEE / ACM International Conference on Advances in Social Net- faction: A reconsideration of the importance-performance analysis[J].
works Analysis and Mining. Niagara: ACM,2013: 494 - 501. Industrial Marketing Management,2004,33( 4) : 271 - 277.
[38] Yan Zhenlei,Zhou Jie. A new approach to answerer recommenda- [51] Oh H. Revisiting importance -performance analysis[J]. Tourism
tion in community question answering services[M]/ / Advances in Management,2001,22( 6) : 617 - 627.
Information Retrieval. New York: Springer Berlin Heidelberg, [52]Anderson E W,Mittal V. Strengthening the satisfaction-profit chain
2012: 121 - 132. [J]. Journal of Service Research,2000,3( 2) : 107 - 120.
[39] Wu Hu,Wang Yongji,Cheng Xiao. Incremental probabilistic la- [53] Kano N,Seraku N,Takahashi F,et al. Attractive quality and
tent semantic analysis for automatic question recommendation must-be quality[J]. Journal of the Japanese Society for Quality
[C]/ / Proceedings of the 2008 ACM Conference on Recommender Control,1984,14( 2) : 147 - 156.
Systems. New York: ACM,2008: 99 - 106. [54] Matzler K,Sauerwein E. The factor structure of customer satisfac-
[40]Harper F M,Raban D,Rafaeli S,et al. Predictors of answer qual- tion: An empirical test of the importance grid and the penalty-re-
ity in online Q&A sites[C]/ / Proceedings of the SIGCHI Confer- ward-contrast analysis[J]. International Journal of Service Industry
ence on Human Factors in Computing Systems. Florence: ACM, Management,2002,13( 4) : 314 - 332.
2008: 865 - 874. [55] Deng W. Using a revised importance -performance analysis ap-
[41] Chen Yan,HO T H U A,KIM Y M I. Knowledge market design: proach: The case of Taiwanese hot springs tourism[J]. Tourism
A field experiment at Google Answers[J]. Journal of Public Eco- Management,2007,28( 5) : 1274 - 1284.
nomic Theory,2010,12( 4) : 641 - 664. [56] Shah C,Pomerantz J. Evaluating and predicting answer quality in
[42] Jeon G Y J,Kim Y M,Chen Yan. Re-examining price as a predic- community QA[C]/ / Proceedings of the 33rd International ACM
tor of answer quality in an online Q&A site[C]/ / Proceedings of SIGIR Conference on Research and Development in Information Re-
the SIGCHI Conference on Human Factors in Computing Systems. trieval. New York: ACM,2010: 411 - 418.
133
熊志正,官思发,朝乐门. 计算机辅助信息分析的技术框架及其发展趋势[J]. 图书情报工作, 59( 3) : 19 - 25.
2015,
The Technological Framework for Computer Aided Information Analysis and Its Emerging Trends
Xiong Zhizheng1 Guan Sifa1 Chao Lemen1,2
1
School of Information Resource Management,Renmin University of China,Beijing 100872
2
Key Laboratory of Data Engineering and Knowledge Engineering ( Renmin University of China) ,MOE,Beijing 100872
Abstract: [Purpose / significance]This paper constructed a framework for the computer-aided information analytics
tasks and offered a top-design guideline for the computer-aided analyzing work. [Method / process]Based on the literature
review,this paper come up with an analytical framework consisting of database,data warehouse,OLTP,OLAP,BI and
DSS. This paper specifically introduces OLAP,data mining and knowledge discovery,social network analysis and big data
analytics as the most useful four kinds of the current core technologies for computer-aided information analysis. [Result /
conclusion]This paper analyzes the main challenges and puts forward an outlook for computer-aided information analysis.
Big data analytics will be an important research topic for computer-aided information analysis in future. Computer-aided
information analysis will make a great progress in the support of cloud computing and big data technologies,mobile compu-
ting and social computing will intersect with information analysis in future.
Keywords: computer aided information analysis data mining business intelligence big data analysis
欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟
( 上接第 133 页) 罗毅: 提出研究思路,负责文章的整体撰写、数据的处
[57] Gazan R. Specialists and synthesists in a question answering com- 理分析以及文章的修改等;
munity[J]. Proceedings of the American Society for Information
曹倩: 负责引言部分的撰写、数据的预处理、文章格式
Science and Technology,2006,43( 1) : 1 - 10.
和表达方式的修改等。
作者贡献说明:
25