互金产品101

本文主要内容:挖掘南通二手房市场数据,并进行可视化展示。

特别说明:本文程序模仿了知乎网友路远

地域分析

从行政区域上看,南通市共有崇川区、港闸区、通州区和开发区四个大区。二手房数量、总价、单价方面,作为市中心的崇川区都独占鳌头。面积方面,开发区总体较小,这可能与当地开发较晚,小户型住房住宅偏多有关;关注度方面,港闸区位居首位,这可能有两点原因:第一,港闸区邻近城市中心,但房价相对较低;第二,港闸区被定位为城市副中心,具有一定的发展前景。除去面积外的各项指标,近几年才被划入市区的通州区都排在末位,表明其依然有很大的发展潜力。

数量(套) 平均总价(万元) 平均面积(m²) 平均单价(元) 平均关注数(人)
市区平均 2599 196.13 113.84 16774.37 4.11
崇川区 945 239.64 116.89 19884.71 4.36
港闸区 497 204.28 114.98 17365.26 5.01
通州区 443 144.74 119.33 11967.84 2.53
开发区 714 164.74 105.6 15228.63 4.13
表1 南通各行政区二手房信息

从具体区块上看,南通市被划分为26个部分。单价方面,新城、濠河两大中心区块持续坚挺,观音山、秦灶等新兴区块涨势明显,兴东、三余等偏远区块依然处于价值洼地。

由箱型图可以看出,多数区块二手房总价的中位数在200万元左右。高总价的区块(如新城、濠河),其总价的离散程度较高,这可能与当地大面积豪宅数量较多有关。

二手房数量方面,能达商务区一骑绝尘,这可能有两点原因:一方面,能达商务区是市政府的重点开发区域,房产数量本身较多;另一方面,能达商务区的炒作氛围浓厚,房屋换手率高。

特征分析

面积方面,120-130平方米的二手房数量最多。与正态分布相比,超大(小)二手房所占比例较高,具有一定的长尾特征。面积与单价关系方面,二手房面积越大,其单价越高,这可能与大面积住宅总体档次较高有关。

户型方面,3室两厅、2室1厅排名前二。值得注意的是,4室2厅排名第三,这可能是因为大户型二手房销售难度较大,产生了一定的积压。

装修方面,精装和毛坯数量相当,简装相对较少。价格上看,精装最高,毛坯第二,简装最低。

结构方面,板楼数量最多,板塔结合次之,塔楼最少。价格上看,塔楼和板塔结合要高于板楼。

层次方面,6、17、32、33楼数量最多。这些楼层分别处于低层次、中层次和高层次居民楼的顶部。该现象表明高楼层住宅的转手率较高。

命名方面,“花园”、“南通”、“新村”的出现频率排名前三。此外,“家园”、“国际”、“世纪”等词语也经常出现在小区名称中。

聚类分析

对所有房源按照总价、面积、单价和关注人数进行聚类分析,我们发现低总价(96万左右)、低单价(1.2万元/m²左右)、小面积(78平米左右)的二手房最受关注。

1
2
3
4
5
from sklearn.cluster import KMeans
house_type = np.array(df[['总价','单价(万元)','面积','关注人数']])
clf=KMeans(n_clusters=4)
clf=clf.fit(house_type)
clf.cluster_centers_
1
2
3
4
5
# 输出结果
array([[189.61811289, 1.64498576, 119.35233361, 3.92333614],
[ 96.00214376, 1.23374623, 78.66457755, 6.05296343],
[602.67346939, 2.87342521, 217.77816327, 1.2244898 ],
[314.03368421, 2.25947688, 142.36498246, 2.04035088]])

 评论