您好,欢迎来到吉趣旅游网。
搜索
您的当前位置:首页基于Web日志的旅游网站流量影响因素分析

基于Web日志的旅游网站流量影响因素分析

来源:吉趣旅游网
2013年5月 第33卷第5期 ・现代情报 Journal ofModemInformation May,2013 Ⅷ.33 N0.5 业务研究・ 基于Web日志的旅游网站流量影响因素分析 旷 芸 (桂林师范高等专科学校数学与计算机科学系,广西桂林54l001) [摘要】本文以旅游网站网络日志作为研究对象,以流量统计软件作为数据采集工具,应用回归分析及相关分析模型研 究影响网站流量的影响因素。研究结果得出了人均浏览次数、IP数和访客教3个指标对流量的不同影响程度。相关分 析结果表明访客数与人均访问页面数显负相关关系。应用本文的研究结果将有助于改进网站性能。优化网站结构。 【关键词]网络信息计量学;网络目志;定量分析;w曲;网站流量;旅游网站 DOI:10.3969/j.issn.1008—0821.2013.05.028 (中图分类号]G25O.72 [文献标识码]A [文章编号】1008—0821(2013)05—0126—05 Analyzing the Influencing Factors of Tourism Website Flow Based on Web Log Kuang Yun (Mathematics and Computer Science Department,Guilin Normal College,Guilin 541001,China) [Abstraa) paperan theinfluencingfactors oftourismWebsiteflow onwebl0gwiththetheoreitcalmodel ofeeono. metrics.This paper studiedtheinluencinfgfactors oftouristtra ̄c onweblog usingthetheoreticalmodel ofcor/ ̄lation analysis and regression aI s.The result of regression analysis showed diferentinfluent degree amongthethree variables:the number ofper capita views,the number ofindependent IP,and the unique visitor.The result of correlation aIlaly s showed that he tntlHlbe ̄of unique visitorsWaS negative relaitonshipwith per capitaviews.The applicaitonofthis stIldy resultswillhelptoimprove site peffor- 脚a】[1ce,optimize the structure ofthe website. (1(ey words]webometries;web lg;quantoiatitve analysis;web;wel ̄ite lfow;tourism website 现代电子通信技术的发展,传统工业的运行模式发生 了很大的变化,尤其是互联网技术的广泛应用,促进了全 新商业模式的产生,其中电子商务就是其中之一。旅 业作为电子商务应用最广泛的领域之一。其作为第三产业 的典型代表,近年来取得了长足的发展,互联网的发展为 旅游业带来了全新的变化,互联网成为了旅游目的地与旅 游者沟通的桥梁…,而旅游网站的建设则构成了旅游电子 系统存储用户访问网站的信息记录,它存储了用户的大量 信息,对这些信息的采集及分析,对于优化网站设计具有 重要的意义【卜引。根据web analysifc协会标准委员会于2OO6 年的定义L5 l。基于网站分析需要特别关注的指标有3个, 它们分别为访客数、访客数和流量。而流量被认为是 最关键的指标。定量研究网站流量问题,对于优化网站、 改进网站内容、提高被搜索效率起到至关重要的作用。 当前基于服务器日志文件的定量分析还处于起步阶段, 现有的研究成果大都是进行简单的统计归总分析,没有进 商务的重要组成部分,为此很多旅游企业均建立了自己的 门户网站,网站内容及使用效率成为了旅游企业管理者、 管理部门及游客所共同关注的问题,如何有效提高网 行变量间的关联研究。基于此,本文以一具体旅游网站网 络日志为研究案例,应用流量统计软件采集数据,使用计 量经济学模型分析网络日志中的使用者数据,挖掘影响网 站效率的关键因素,研究因素间的相关关系,为网站优化 提供理论实证参考。 站吸引度、提高网站在搜索引擎中的排名及显著性,即旅 游网站评价问题成为了当前旅游电子商务的热点研究领 域l2。旅游网站评价分为定性评价与定量评价,而网络日 2j志评价则是定量评价的主要内容之一,网络日志是计算机 收稿日期:2013一Ol一23 基金项目:广西哲学社会科学“+-'2K”规划2011年度项目(III ̄07);广西教育厅科研项目(2o1106Lxo55),2011年新世纪广西 高等教育教改工程立项项目(2011JCm19),广西师范大学教育教学改革A类立项项目l师政教学【2013】18号文)。 作者简介:旷・・——芸(1968一),女,工程师。研究方向:情报管理.发表论文数篇。 126・・—— 第33卷第5期 2013年5月 基于Web日志的旅游网站流量影响因素分析 May,2013 Vd.33 No.5 根据中国互联息中心2011年7月所发布的《中国互联 1研究现状 网络发展状况统计报告》显示,截至2011年6月底。中国 根据美国MJniwatts etiIIg Group(2011)研究表明, 的网站数为183万个,网站作为互联网的主要组成部分之 截止2011年,中国网民数为4.85亿。占全国人口的 一,其包含了众多企业信息,旅游网站作为专业网站,以 36.3%,占世界人口的23.0%,而其它国家无论是人口总 其独特的特征,在当前旅游电子商务发展中发挥了重要的 数还是占比均比中国要小许多,互联网使用者最多的前10 作用,在旅游电子商务网站中,普遍均含有与旅游目的地、 个国家如表1所示: 旅游服务的相关信息,比如景点介绍、酒店预订、旅途安 排等信息,随着时间的积累,网站中的信息会越来越多, 袭1互联网使用者最多的前加个国家 如何有效地分析旅游网站中有用信息,成为了当前旅游电 子商务研究的热点。当前国内对旅游网站的评价,主要分 为两大类:定性分析和定量分析,进行定性分析的研究成 果有:袁梦如以国家旅游局评定的第一批5A旅游景点网站 为研究对象,应用传统的统计学理论方法评价网站功能L7 J, 罗龙艳运用层次分析法构建旅游搜索引擎评价指标,根据 合理性原则决定各指标权重,提出评价方法 J,熊伟以虚 拟旅游网站为研究对象,采用内容分析法进行实证分析, 并指出虚拟旅游网站存在的问题【9』,朱峰则指出旅游产业 与信息技术紧密相关,并从宏观及微观二方面,就旅游网 站评价等方面的最新进展进行概括分析【 DJ,李君轶以我国 31个省市级旅游官网进行定性分析,文章从网站的交互 性、技术层面、交易功能等方面提出了改进方法u¨。高静 数据来源:I却://www.缸∞ 日 .can/.copyad ̄t@20OO一21)11, 峨 研究综合国内站评价指标体系,构建新的旅游网站指 Q呻. 标评价体系,并以携程网为例进行定性分析L12J。定量分析 的研究成果有:钟栎娜2012利用IPA方法研究旅游网站评 从表1可得知。中国的网民绝对数远高于其它国家, 价与旅游景区网站变化之间的关联分析,研究对象是我国 但网民占全国人口的比例只有36.3%,在互联网使用者最 75个5A旅游景区网站,研究结果表明,旅游者评价与网 多的前1O个国家中排名第8位,而英国、德国、日本和美 站变化呈相关关系【13J,周春林以20个电子商务旅游网站 国的网民数占全国人口的比例分别高达82.O%、79.9%、 作为研究对象,运用定量分析方法,研究网站内容期望 78.4%和78.2%。比例数高于中国的2倍多,从数据对比 ——交付研究框架模型【l引,路紫、孙中伟等应用定量分析 可以看出,我国的网民数还有很大的发展空间,实际统计 方法,分别从通信网络、信息流与人流导向、互联网与行 数据也证实了这种推测,根据中国互联息中心的统计 为决策、信息化与社会经济空间组织等角度,研究网站外 显示,近年来我国的网民数据显递增趋势,并且在具体的 在特征对外部效应的作用[15】,孙建军等学者则是综合描述 应用上呈现出一些特有的特征,比如新兴的互联网应用快 了网络信息计量学的理论体系【16】。国外研究则主要是应用 速扩散,如微博的应用,它以年296%的增长率增长[6,6] GooSe aIlalytics进行网络日志的定量分析【卜引。 电子商务的应用也呈现稳步增长态势,其中的旅游电子商 综合而言,当前对旅游网站的研究注重于网站使用的 务应用,比如电子支付、旅游预订显示增长趋势。2011年 外部性研究,未见有针对旅游网站服务器日志文件分析的 旅行预订用户达到4 207万人,用户年增长率为16.5%[6I。 研究成果。而旅游网站服务器日志文件含有网站使用者最 近年来中国的旅游业快速发展,中国作为一个经济发展速 全面、最真实的数据,这些数据是进行旅游营销、提高网 度最快的发展中国家,以其丰富的历史及文化吸引力,正 站性能的最好参考资料,而当前对此研究存在海量旅游网 成为当今世界主要旅游目的地之一。根据中国《20l1年旅 站数据的与利用数据进行商务挖掘之间存在巨大差距,许 游绿皮书》的介绍,在未来1O年,世界旅游业的发展速度 多数据还只停留在简单的统计汇总阶段,没有进行深入的 为3.2%,中国的旅游增长速度可能达16.9%,中国国际 挖掘与分析,因此旅游网站服务器日志文件的数据挖掘具 旅游的发展速度约为世界旅游的发展速度的5倍。旅游业 有创新性及实用性。 的快速发展,对支撑旅游电子商务的网站建设提出了新的 2案例分析 要求,如何完善旅游电子商务网站内容、提高旅游电子商 务网站效率,成为当前旅游信息化建设的主要工作之一。 2.1案例说明 根据网络理论可知,电子商务的发展与网站建设密切相关, 研究案例为一旅游网站,旅游网站网址(http:∥www ・--——127・-・—— 2013年5月 第33卷第5期 现代情报 Journa ̄of Modem Idormation May,2013 Vd.33 No.5 jctravd.gov.cn/),根据网站的介绍,该网站开通时间为 2010年8月26日,于2010的9月2日起开始安装网站流量 经济学的回归分析模型。通过模型求出各变量系数值,从 而得到各因变量对流量的影响程度。 2.3.1构建回归模型 回归模型因变量为流量值(Pv),自变量为3个,分别 为访客数、II,数和人均浏览次数。 2.3.2数据稳定性检测 监测软件CNZZ。该网站为旅游官方网站,提供了旅游电子 商务的基本功能,包括景点介绍、门票预订、酒店预订等。 2.2数据来源 基于web网络日志的内容挖掘,当前主要采用二种方法 进行数据采集,一种方法是开发专用数据采集软件,另 一根据回归模型的建模要求,模型各数据序列必须为稳 定数列,如果数据序列不稳定,则必须先经差分处理变为 稳定序列后才能进入回归模型。为检验数据的稳定性,计 种方法是采用免费网站流量统计软件,其中第一种方法主 要是用于专业数据挖掘,适用范围窄,第二种方法可应用于 所有网站的数据自动采集,适用范围广。本文数据采集源于 量经济学常用方法是引入ADF检验。案例数据序列的ADF 检验结果及显著性水平对照如表2所示,从表中可以看出, 免费商业网站数据采集集成软件CN2E统计软件,数据提取 时间段为2010—9—2至2012—4—8,共584个数据。统计软 建模所用的4个数据序列,其原始数据t统计量在1%显著 性水平下均不能通过ADF检验,经一阶差分后所有数据序 列均通过了ADF检验,所以建模数据为一阶差分单稳序 列。 件CNZZ提供了网站流量的时间序列数据,其中包括流量 (Pv)、访客、 数和人均浏览次数4个指标。 2.3实证研究 为了分析影响网站流量的关键因素,本文拟构建计量 表2数据序列的ADF检验结果及显著性水平对照表 数据来源:数据序列经输人Evle ̄软件计算后得出相应结果 2.3.3建立回归方程 经一阶差分后得到了稳定的时间序列数据,然后就可 建立回归方程,本文应用计量经济学软件Eviews进行相关 分析,构建的回归方程如公式(1)所示: D(PV)=』9l XD(Ⅵ)+ ×D( )+岛XD(PA)+C (1) 其中J9l、 、岛为系数,c为常数项,经过运算得到 表3回归结果: 表3回归模型系数及检验表 DepOtVariable:D(PV) S( Tune:21:09 Method: lte:05/l3/12 e(adjusted):2 585 Included ohae ̄atiotts:584 after llsⅡ唧旭 一128— 2013年5月 第33卷第5期 基于Web日志的旅游网站流量影响因素分析 2.3.4回归方程结果分析 May,2013 Vd.33 No.5 从表3可以得出回归方程中各变量的系数值及常数项, 最终回归方程如公式(2)所示: D(PV)=2.392736×D(Ⅵ)+3.998634×D(IV)+ 从回归方程(2)可以看出,通过比较各因变量的系数 大小得知,因变量系数中最大的是D(队),即人均浏览次 13.80299×D(PA)一0.836555 (2) 数对网站流量的影响最大,也就是说人均浏览次数对网站 流量的贡献度最大, 数对流量的影响程度次之,最 小的是Ⅵ,即访客数。浏览量指标是网站评价的关键 为了检验回归方程的平稳性,将回归方程的残差数列 进行ADF检验,检验结果如表4所示。 指标,属于网站质量的信息指标之一,回归结果显示,与 表4回归模型残差ADF检验表 NullHypothesis:PP has a unitmot 它相关程度最大的指标是人均浏览次数,人均浏览次数即 Exogenous:Constant 是在一定时间段内点击的页面数,它与浏览量密切相关, :4(Automat/e based on SIC,MAXLAG=I8) 人均 觅次数也可定义为单位访客的浏览数,因此回 归结果的人均浏览次数的系数值相对较大,这与实际情况 是相符的。回归方程中的II'数是指 数,根据 数的定义,同~ 可以有多个访客, 数更能准 确地描述真实的访问次数,在回归结果中显示它对流量的 *MeeKinnm(1996)one- P—vahe6. 作用还是很大的。访客也是一个重要指标,但回归结 从表4可以看出,残差的ADF检验t统计量为 果显示其对流量的影响相对其它二个指标来说较小,这个 结论是针对本文案例而言,是否具有普遍性,还有待进一 一19.44021,远小于1%显著性水平时的t统计值 步的研究。 一3.441415,因此可以认为所建立的回归方程是可信的。 2.4流量关联散点图 图1 回归方程解释变量与被解释变量两两关联散点图 ・_——129・--—— 2013 第5月 。..33卷第5期 JcH咖al 0f em‘埘lDnn 0n Tom-i ̄n M蛐 现代情报 v0133 No.5 .May,2013 为了更直观在观察流量影响因素之间的关联关系,采用散点图形式,分别绘出流量PV与客数Ⅵ、P 数、人均访问页数PA之间的散点图,从图I看出,流量 PV与客数Ⅵ、II,数、人均访问页数PA之间均显 t.2010,31(3):297—313. 【3】Omidvar,Mohanenad Almrt,Vehid II鼬Mirabi。end N ∞Shok ̄y. yzingthe I呷act 0f Visito ̄∞Page Views with c0嘲e Anal ̄cs 【JJ・Intenrational Journal ofWeb&Semantic Technology・2011・2 正相关关系,并且流量PV与人均访问页面数的回归线斜 率最少,即PA对PV的边际产出最大,这与前面的回归方 程结论相一致。经过绘制散点图,另一发现是访客数 (1):l4—32・ [4]M0 Amh ・Vahid Re,zaMirahi・N es sh。 ・Time type∞web c8【EB/oL】・’ltlp:∥ 鹤。noddiIlg 0f。 Ⅵ与人均访问页数PA呈负相关关系,即表示其中一个变量的增大或减少,另一变量反而减少或增大。线性回归分 wodd—o0n ・ /I硒:15 3・pdf’20 2—05—22・ “Big nlIee”D击 0llB EB/ ∞,w・A・web An 析是用代数方法分析变量间的关系,而散点图则从图形角 度体现变量特征,能够更直观形象地表达影响指标间的关 系。上述散点图揭示了本文研究对象流量影响指标间的变 化趋势关联程度。 3 结 论 通过本文的研究可知,旅游网站网络日志也与其它网 站日志一样,它存储了网站浏览用户的众多信息,这些信 息包括用户的浏览特征、浏览工具、浏览次数、用户来源、 停留时间等,本文通过应用计量经济学理论模型进行定量 分析,研究了不同指标对网站流量的影响程度。经过分析,结论表明在研究所考察的3个指标当中,对流量影响最大 no、 的指标是人均浏览次数,最小的是访客数,而 磬则处于中间位置。同时通过相关分析得知3个影响指标 与流量之间呈现正相关关系,并且发现访客数与人均 访问页面数呈负相关关系。总而言之,旅游网站日志挖掘 是一个全新的研究对象,通过数据分析可以发现许多表面 无法看见的内在变化规律,通过分析日志文件能够为旅游网站优化、提高网站效率起到积极的推动作用。 致谢:广西师范大学粱宗经、覃小丹、陶秋伶、刘慧珍对 本文也有贡献。在此表示感谢! 参 考文 献【1】Be拭z Pl眦.Go0出8nBl c8 fo1.傩 IlriIIg websitc pe mlal1∞【J].1 锄M蛐卿t,20l1,(32):477—481.[2] ,R.,Qi,S.。and Buh D.h ∞in srn lIlarIage. Ⅱ'簋1t:A Ieviw webs 血 0lI irI t叫ri re8eal℃}l[J]. ・--——130・--—— OLJ.Washin ̄mDC20037。2006:l一5. ://WWW.wehanalyt- i。 s0ci .0lg/ 浅/。e田l 个I)F.star aIds/1ⅣebA al csDe. 觚d B .pdf,2012—05—22. [6]中国互联息中心.第28次中国互联网络发展状况统计报 告[EB/OL].http://w∞lcl。.baidu.c叽/ :伽 脚169a45l a3 ・ ・2o 2一o2—22‘ 【7]袁梦如,何雨.我国5A级旅游景区网站功能评价及优化时策 [J]・旅游研究・2012-4(1):43—48・ [8】罗龙艳,窦厚玺・基于AHP的旅游搜索引擎评价分析[J]・ 科技管理研究,2011,( ):71-75. 【 】熙伟・叶淋玮・我国虚拟旅游网站的功能评价研究【J】・人文 地理・2011,( )。 54一 6o・ ] 峰。情报工作,2010,54(17):100—1 外“旅游与信,技 ’研究进展及启示¨ 图书03.  【11]李君轶.基于游客需求的旅游目的地网络营销系统评价【J】. 旅游学刊,201o.25(8):45—51. [12】高静,肖江南.我国旅游网站建设评价初探一以携程旅行网 为例[J].情报杂志。2OO5,(4):38—40. [13】钟栎娜,董晓莉。邵隽.基于IPA分析的中国旅游景区网站 发展研究[】】.旅游学刊,2012,27(3):60—69. [14】周春林,扬洁俞,肇元.旅游电子商务网站内容交付性测量 与评价研究[J.旅游学刊,2J]010.25(12):37—43. [15]孙中伟,王扬,中国信息与通信地理学研究进展与展望[J】. 地理科学进展。2011。30(2):149—156. 06]孙建军.网络信息计量理论、工具与应用[M]・北京:科学 出版社,2009・ 07]・网站流量统计信息解释[r ̄/OL]・http:∥ ・ baidu・ ll88幽ef894l。 6d巧21・h协d,2ol2—05一Ol・ (本文责任编辑:马 卓) 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- jqkq.cn 版权所有 赣ICP备2024042794号-4

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务