本文主要内容:挖掘南通二手房市场数据,并进行可视化展示。
特别说明:本文程序模仿了知乎网友路远。
地域分析
从行政区域上看,南通市共有崇川区、港闸区、通州区和开发区四个大区。二手房数量、总价、单价方面,作为市中心的崇川区都独占鳌头。面积方面,开发区总体较小,这可能与当地开发较晚,小户型住房住宅偏多有关;关注度方面,港闸区位居首位,这可能有两点原因:第一,港闸区邻近城市中心,但房价相对较低;第二,港闸区被定位为城市副中心,具有一定的发展前景。除去面积外的各项指标,近几年才被划入市区的通州区都排在末位,表明其依然有很大的发展潜力。
数量(套) | 平均总价(万元) | 平均面积(m²) | 平均单价(元) | 平均关注数(人) | |
市区平均 | 2599 | 196.13 | 113.84 | 16774.37 | 4.11 |
崇川区 | 945 | 239.64 | 116.89 | 19884.71 | 4.36 |
港闸区 | 497 | 204.28 | 114.98 | 17365.26 | 5.01 |
通州区 | 443 | 144.74 | 119.33 | 11967.84 | 2.53 |
开发区 | 714 | 164.74 | 105.6 | 15228.63 | 4.13 |
从具体区块上看,南通市被划分为26个部分。单价方面,新城、濠河两大中心区块持续坚挺,观音山、秦灶等新兴区块涨势明显,兴东、三余等偏远区块依然处于价值洼地。
由箱型图可以看出,多数区块二手房总价的中位数在200万元左右。高总价的区块(如新城、濠河),其总价的离散程度较高,这可能与当地大面积豪宅数量较多有关。
二手房数量方面,能达商务区一骑绝尘,这可能有两点原因:一方面,能达商务区是市政府的重点开发区域,房产数量本身较多;另一方面,能达商务区的炒作氛围浓厚,房屋换手率高。
特征分析
面积方面,120-130平方米的二手房数量最多。与正态分布相比,超大(小)二手房所占比例较高,具有一定的长尾特征。面积与单价关系方面,二手房面积越大,其单价越高,这可能与大面积住宅总体档次较高有关。
户型方面,3室两厅、2室1厅排名前二。值得注意的是,4室2厅排名第三,这可能是因为大户型二手房销售难度较大,产生了一定的积压。
装修方面,精装和毛坯数量相当,简装相对较少。价格上看,精装最高,毛坯第二,简装最低。
结构方面,板楼数量最多,板塔结合次之,塔楼最少。价格上看,塔楼和板塔结合要高于板楼。
层次方面,6、17、32、33楼数量最多。这些楼层分别处于低层次、中层次和高层次居民楼的顶部。该现象表明高楼层住宅的转手率较高。
命名方面,“花园”、“南通”、“新村”的出现频率排名前三。此外,“家园”、“国际”、“世纪”等词语也经常出现在小区名称中。
聚类分析
对所有房源按照总价、面积、单价和关注人数进行聚类分析,我们发现低总价(96万左右)、低单价(1.2万元/m²左右)、小面积(78平米左右)的二手房最受关注。
1 | from sklearn.cluster import KMeans |
1 | # 输出结果 |