中国期刊库

教育   经济   科技   财会   管理   
医学   法学   文史   工业   建筑   
农学   水利   计算机   更多>>
 首 页   论文大全   论文精品   学术答疑   论文检测   出书咨询   服务流程   诚信通道   关于我们 

基于数据挖掘的房价预测分析

人气指数: 发布时间:2017-11-04 15:58  来源:http://www.zgqkk.com  作者:王智超
分享到:

 

  摘要:房地产的价格是由众多因素交互影响而形成的,是房地产所在地区的自然、经济、社会、行政等因素综合影响的结果。区位因素是影响房产价格的重要因素,该文通过实例,分析区位因素与房产价格的关系,以期建立房价预测模型,为购房者提供购房建议。 
  关键词:数据挖掘;预测;分类分析 
  1项目实施过程 
  项目实施主要包括以下三个阶段: 
  1)用爬虫知识从“房天下”网站爬取房源信息。 
  2)利用获得的房源信息在百度API获取所有房源周边学校,医院,车站和超市的数量。 
  3)对数据进行归一化处理。 
  4)按照手工标记的方法,将房子按房价分为(0,7000],(7000,12000],(12000,17000],(17000,22000](22000,40000]五类。 
  5)创建KNN,决策树,贝叶斯三种分类器,并使用训练数据进行训练。 
  6)利用测试集预测,计算模型整体的准确率和召回率,评测模型。 
  2数据获取阶段 
  1)获取初始数据,该阶段主要有两个阶段。第一个阶段是房源搜索阶段,该阶段使用Spider从网站房天下获取在售楼盘的名称,地址和价格。第二阶段调取百度地图API GeoCoding进行经纬度转换。Geoeoding API已全面支持HTTP/HTTPS两种请求形式。 
  2)归一化处理,将四维数据每一维度的数值总和视为1,每一维度数值占四个维度数值总数的比例用来表示该维度数据。 
  3分类阶段 
  该阶段采用KNN,贝叶斯,决策树三种方法构建分类器,分类结果如下: 
  4分析与讨论 
  从结果来看,决策树表现最佳,精确度有0.69,所以,决策树是我们应该选用的方法。我们认为选取的特征(教育质量,交通条件,医疗条件,生活配套)模糊和有限是造成预测精确度不高的主要原因。如教育质量不能单纯用学校数量来衡量,学校质量同样重要;超市数量不能代表一个地区的生活配套质量,还应包括餐馆、公园等因素。 
  除本文选取的四个房价影响因子外,影响房价的因素还有很多,如地區居民收入、地方政策、环境质量和房地产生产成本、质量、品位、房型、结构、朝向等内在因素。

      中国期刊库(http://www.zgqkk.com),是一个专门从事期刊推广、论文发表的网站。
      本站提供如何发表论文,寻求论文发表合作,快速发表论文,发表论文格式指导等解决方案:省级论文发表/国家级论文发表/核心期刊论文发表//职称论文发表。


      【免责声明】本文仅代表作者本人观点,与论文发表_期刊发表_中国期刊库专业期刊论文发表网站无关。论文发表_期刊发表_中国期刊库专业期刊论文发表网站站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

     
    QQ在线咨询
    论文发表热线:
    180-1501-6272
    微信号咨询:
    zgqkkcom
    咨询电话:18015016272 投稿邮箱:zgqkk365#126.com(#换成@)
    本站郑重声明:文章只代表作者观点, 并不意味着本站认同。所载文章、数据仅供参考,使用前请核实,风险自负。
    部分作品系转载,版权归原作者或相应的机构  若某篇作品侵犯您的权利,请来信告知 
    Copyright © 2002-2018 . 期刊库 版权所有