中华人民共和国国家发展和改革委员会

首页 > 工作研讨
大数据时代背景下的价格数据共享实践研究

---以南通市存量房价格数据平台为例

(南通市价格认定中心  黄传海)

一、引言

随着信息技术的飞速发展,数据的价值日益凸显,大数据时代已然来临,而目前80%以上的数据由政府掌握,政府数据具有天然的公共属性,加快政府数据共享,发挥数据价值,已成为提升政府治理能力、实现政务服务提质增效的重要举措。南通市物价局价格认定中心以应用需求为导向,从推动共享存量房价格数据着手,打破政府部门、企事业单位之间的数据壁垒,将市区存量房价格数据运用于金融贷款、税收征管、法院执行等行业领域,推动数据资源跨层级、跨部门共享。

二、南通市存量房价格数据平台实践

(一)平台开发思路

南通市存量房价格数据平台采用云数据库RDS+网络平台ECS框架。数据库整合南通市存量房基础信息、房产中介报送价格信息、房屋买卖合同、拍卖成交价格等信息,运用批量评估方法及动态调整技术保证数据库内价格数据的科学性;根据不同部门或行业的数据需求定向开发网络平台。

(二)平台主要功能

存量房涉税价格认定工作平台,与地税窗口实行网上协作,计税价格认定事项的提出、受理、办理、送达全程在线流转,变过去的“材料窗口间人工转”为“数据部门间网上走”,同时,通过平台设定的数据分析、预警功能,在房地产市场波动超过一定幅度时,及时启动评税系统基准价更新调整,保证了计税价格的准确性和公平性。

存量房金融服务平台为银行等金融机构提供房屋市场价格,帮助银行科学快速确定房屋抵押价值,工作人员只要输入房屋的坐落地址、楼层和面积,系统即自动计算出房产价值,既节省了大量的人力、财力支出,缩短了贷款办理时限,又减少了与借款人之间的价格争议。

存量房价格数据司法服务平台,为市、县(区)两级法院执行拍卖提供价格数据支持,在全国率先实现由传统委托评估公司评估向自动智能化询价确定方式的转变。法院执行部门通过平台价格的即时查询,快捷评估拟拍卖房地产价值,同时利用平台的应税额计算功能,预估交易税款成本,为合理确定拍卖保留价、提供参考。

平台数据库拥有不断更新的南通市区存量住宅房价格,能清晰直观的了解各区域房价水平及发展趋势,可用于房地产大数据分析及编制相关价格指数,能够为政府相关房地产调控、城市规划提供参考,数据库内近20年的住宅房历史价格能够提供历史价格查询,同时亦是研究区域房价变动的宝贵资料。

 (三)平台实践效果

存量房价格数据平台的上线,放大了数据效用,降低了获取价格数据的成本,满足了不同部门或行业对价格数据的需求。

1-5月份存量房涉税价格工作平台通过数据分析预警,发起存量房基准价格调整804条,占比74%;通过在线办理涉税价格认定案件301件,认定总金额3.21亿,核增计税价格47.29%,有效防范了阴阳合同,维护了税收征纳秩序。

市金融办印发《实体企业融资宝典》,存量房价格数据金融服务平台作为政府推动的融资政策和助贷举措之一列入对接类服务平台。目前已有11家银行、1家融资担保机构开通了价格数据查询服务。以最早开通的浙商银行南通分行为例,今年1-5月份,浙商银行南通分行查询价格数据62笔,市场价值8880万,共审批通过住宅抵押贷款29笔,放款金额5052万元。

1-5月份,港闸区人民法院等共查询数据28笔。平台的运行节省了拍卖房屋的评估费用,有效缩短了执行拍卖周期,提高了拍卖成交率,对于化解法院执行难问题起到了重要的推动作用。同时,平台价格数据还可运用于人民法院保全房产抵押、家庭析产、房屋买卖纠纷等审理领域,有利于降低当事人诉讼成本,提高法院案件审理质效。

三、南通市存量房价格数据平台技术要素分析

数据发挥价值的必要条件是完整性与动态性,否则数据价值将大打折扣。南通市存量房价格数据平台采用批量评估技术与动态调整技术,最大程度的保证数据的完整性与动态性。其中批量评估所采用的标准价调整法目前应用较为广泛,本文重点对动态调整部分进行阐述。

(一)批量评估模块

1.评估模型

平台采用较为常用的标准价调整法。所谓标准价调整法,是指对估价范围内的所有被估房地产进行分组,使同一组内的房地产具有相似性,在每组内选定或设定标准房地产并测算其价值或价格,利用有关调整系数将标准房地产价值或价格调整为各宗被估价房地产价值或价格的方法。

评估单价Vi = 基准价格V0 ×P1×P2(元/平方米)

V0 --标准房基准价格

P1--楼层修正系数

P2--朝向修正系数

2.基础数据采集

数据平台的基准价格分组到小区的物业类型,故需要对小区名称及基本信息、物业类型、楼幢信息进行采集。目前数据平台共有住宅楼幢信息11996条、住宅基准价格1086,覆盖率超95%

3.标准房设定与修正体系构建

标准房的选定要求是该物业类型中内具备代表性、普遍性的房产。标准房设定可以是具体的某套房产,也可以是按照标准房限定条件所定义的虚拟房产。例如平台普通多层的标准房设定条件为:

   

1 普通多层标准房设定条件

项目

房产性质

所在楼层

朝向

建筑

面积

建筑

结构

建成

年代

坐落位置

其他条件

备注

标准样本房条件

住房

1

南(中)

该小区内主流套型面积定义

该小区主流建筑结构定义

该小区平均建成年代

小区内非景观房

根据所在小区普遍结构定义

商住楼如2层开始为住宅,则所在楼层选2

修正体系的构建应充分考虑当地的居住偏好,数据平台通过以往交易数据总结归纳制定了不同物业类型的修正系数。

(二)动态调整模块

标准价调整法虽然解决了相似性较强的房屋的批量评估问题,但是其评估数据仍是静态数据,房地产市场具有明显的周期性与区域分化特性,如果价格数据不能反映当前的市场价格水平,就难以发挥其价值。南通存量房价格数据平台通过科学设立监测片区、精准选定监测样本、定期采集分析数据、合理划定预警红线、动态实施价格调整,构建起了存量房基准价格与市场价格的联动机制,保证了数据的及时性、科学性。今年1-5月份,数据平台共进行了5批次1065条价格数据更新。

1.监测片区划定

标准调整法是对相似性较强的房屋从基准价修正而得到其价格,由于粒度较小,基本只考虑楼层、朝向等实体性因素,而影响房屋不同变化趋势的往往是区位因素等较难量化的因子,通过对房价变化驱动因子的分析,划分不同监测片区,使同一监测片区内的基准价格具有相似的变化特征,是准确把握房价变动,针对性更新数据库的关键。

下面以南通市崇川区城东街道为例,简要阐述监测片区的划分。

1)城东街道概况

城东街道成立于19561月,是南通市最早成立的街道办事处之一。我街道地处国家AAAA级濠河风景区的东侧,环境优美,交通便捷,总面积8.7平方公里,辖区人口近10万人。街道内有城中小学、市三中等重点中小学,有住宅小区100个,基准价格118个,房屋新旧不一,从1972年至2016年不等。

一般而言,同一区域内影响房屋价格的主要因子有学区因素、房屋属性因素、建筑年代因素,但各因素在不同区域有所差异。我们使用SPSS对城东街道内小区进行相关性分析与均值分析。

2)相关性与均值分析

我们设学区状况、住宅属性、建筑年代为自变量,设市场价格为因变量。其中教育资源优质的双学区小区学区状况设为1,教育资源良好的单学区小区学区状况设为2,教育资源一般的小区学区状况设为3;住宅属性中商品房的小区设为1,经济适用房与安置房小区的设为2;建筑年代中2000年以前的小区设为2,2000年以后的小区设为2。将118条基准价格的相关信息输入,利用SPSS进行F检验,结果如下:

 

案例处理摘要

 

案例

 

已包含

已排除

总计

 

N

百分比

N

百分比

N

百分比

市场价格  * 学区状况

118

100.0%

0

.0%

118

100.0%

市场价格  * 住宅属性

118

100.0%

0

.0%

118

100.0%

市场价格  * 建筑年代

118

100.0%

0

.0%

118

100.0%

 

市场价格  * 学区状况

 

报告

市场价格

学区状况

均值

N

标准差

1

17031.6154

39

2030.60954

2

10637.3824

34

3651.83801

3

9158.4444

45

3246.31149

总计

12186.7288

118

4594.87112

 

ANOVA

 

 

 

平方和

df

均方

F

市场价格 * 学区状况

组间

(组合)

1.410E9

2

7.049E8

76.438

 

组内

1.060E9

115

9221472.403

 

总计

2.470E9

117

 

 

 

ANOVA

 

 

 

显著性

市场价格 * 学区状况

组间

(组合)

.000

 

相关性度量

 

Eta

Eta

市场价格 * 学区状况

.755

.571

 

 

市场价格  * 住宅属性

 

 

报告

市场价格

住宅属性

均值

N

标准差

1

12209.2241

116

4631.36303

2

10882.0000

2

209.30361

总计

12186.7288

118

4594.87112

 

ANOVA

 

 

 

平方和

df

均方

F

市场价格 * 住宅属性

组间

(组合)

3463335.150

1

3463335.150

.163

 

组内

2.467E9

116

2.126E7

 

总计

2.470E9

117

 

 

 

ANOVA

 

 

 

显著性

市场价格 * 住宅属性

组间

(组合)

.687

 

相关性度量

 

Eta

Eta

市场价格 * 住宅属性

.037

.001

 

 

市场价格  * 建筑年代

 

报告

市场价格

建筑年代

均值

N

标准差

1

13239.3944

71

4412.51017

2

10596.5319

47

4447.17683

总计

12186.7288

118

4594.87112

 

ANOVA

 

 

 

平方和

df

均方

F

显著性

市场价格 * 建筑年代

组间

(组合)

1.975E8

1

1.975E8

10.082

.002

 

组内

2.273E9

116

1.959E7

 

 

总计

2.470E9

117

 

 

 

 

相关性度量

 

Eta

Eta

市场价格 * 建筑年代

.283

.080

通过分析Eta值大小,发现学区状况与市场价格高度相关,建筑年代与市场价格弱相关,而住宅属性与市场价格之间相关性并不明显;通过分组的Sig值,不难发现根据学区状况的分组具有显著差异性,而根据住宅属性的分组并无显著差异。实际上,城东街道内多为商品房,加之位置优越,故而住宅属性对市场价格影响不大,故在划分监测片区时可以剔除住宅属性这一因素。

由于我们只进行了单因素方差分析,并未考虑各因素之间的相互影响,尤其是学区状况与建筑年代的相互关系以及对市场价格的影响关系。而实际上,对学区房来说,其交易的主要动机是获取入学资格而不是居住,其分组可以不考虑居住属性中建筑年代这一因素,而对非学区房来说,建筑年代是居住属性的重要内容,也是影响房价的主要因素,我们通过非学区房的建筑年代与市场价格的相关性分析与均值分析验证我们的假设。

 

案例处理摘要

 

案例

 

已包含

已排除

总计

 

N

百分比

N

百分比

N

百分比

市场价格  * 建筑年代

45

100.0%

0

.0%

45

100.0%

 

 

报告

市场价格

建筑年代

均值

N

标准差

1.00

10503.42

31

3031.163

2.00

6180.29

14

774.965

总计

9158.44

45

3246.311

 

 

ANOVA

 

 

 

平方和

df

均方

F

市场价格 * 建筑年代

组间

(组合)

1.802E8

1

1.802E8

27.345

 

组内

2.834E8

43

6591767.219

 

总计

4.637E8

44

 

 

 

ANOVA

 

 

 

显著性

市场价格 * 建筑年代

组间

(组合)

.000

 

 

相关性度量

 

Eta

Eta

市场价格 * 建筑年代

.623

.389

 

从数据分析结果来看,非学区房根据建筑年代进行分组,Sig0.00,组间差异显著,Eta0.623也显示出建筑年代与市场价格具有较强相关性。

根据以上分析,我们可以综合学区状况与建筑年代,将城东街道分为4个监测片区。

2 城东街道片区划分表

街道名称

片区

基准价数量

片区属性描述

平均建筑年代

价格均值(元/m2

城东街道

城东1片区

39

教育资源优质

1997

17032

城东2片区

34

教育资源良好

1995

10637

城东3片区

31

教育资源一般,房龄较新

2006

10503

城东4片区

14

教育资源一般,房龄较老

1988

6180

 

2.样本小区设定与数据采集

样本小区应选择片区内成交较为活跃的小区。数据平台通过对契税交易记录进行成交量分析,设立样本小区43个,以城东片区为例,设立样本小区7个。

3 城东街道样本小区设定表

街道名称

片区

样本小区

物业类型

城东街道

城东1片区

东苑

普通多层

森大蒂花苑一期

普通多层

城东2片区

郭里园新村三期

普通多层

郭里园紫琅苑

普通多层

城东3片区

德民花苑二期

普通多层

小石桥花苑二期

普通多层

城东4片区

板桥东村二期

普通多层

 

    3.价格数据预警与动态调整

每个月所采集的价格数据输入平台后会自动标准化,并与上月数据及数据库内数据进行比对,环比数据的变化有助于我们了解市场行情,而当本月数据与系统内数据差异超过设定的幅度时,便发出预警信号,可以加强关注或启动数据调整。监测预警表城东街道部分见下表:

4 城东街道监测预警表

街道名称

片区

样本小区

物业类型

样本小区价格(元/m2

本期片区价格(元/m2

上期片区价格(元/m2

环比涨跌

数据库价格(元/m2

乖离率

城东街道

城东1片区

东苑

普通多层

 

 

 

 

 

 

森大蒂花苑一期

普通多层

 

 

 

城东2片区

郭里园新村三期

普通多层

 

 

 

 

 

 

郭里园紫琅苑

普通多层

 

 

 

城东3片区

德民花苑二期

普通多层

 

 

 

 

 

 

小石桥花苑二期

普通多层

 

 

 

城东4片区

板桥东村二期

普通多层

 

 

 

 

 

 

 

利用监测片区进行动态调整不仅仅增强了价格的时效性,同时能够准确把握市场变化特征与原因,进行数据调整时可以进行基准价格的批量预调整,极大提高工作效率。例如南通市中央创新区概念的提出与地铁的修建使得原本较为偏远的开发区小海片区内住宅的区位优势得到较大提升,区域内住宅价格大幅上涨,数据平台发出预警后,因片区内小区同质性较强,我们对片区内基准价进行了同一幅度的调整。

 四、启示与不足

    南通市物价局价格认定中心搭建存量房价格数据平台,探索价格公共服务新方式,有效的实现了对金融贷款、司法拍卖的降本增效,其能把握各部门或行业的需求,在需求基础上进行数据挖掘与分析是数据平台能发挥功效的关键因素。同时,现阶段数据平台的数据来源渠道仍较为单一,交叉数据不足,数据平台可视化分析成果仍较为欠缺。