12张图,二手房数据分析及可视化
信息来源:网络    时间:2023-09-11 11:13

本文用到的数据是之前在链家爬取的武汉二手房信息。这次我们来挖掘一下数据背后的秘密…

文中主要涉及的Python库

话不多说,进入正题。

首先读取文件,并查看数据集的结构信息。

 


根据上面的信息可以知道,数据集共 27 列,?列中有较多的缺失值,列和的类型为应将转成数值类型。

2.1缺失值处理

首先删除包含缺失值的行。删除后数据行数为 5108 行。

 

2.2列处理

由于后面需要通过绘制地图,而 东湖高新区,沌口开发区 并未有详细经纬度划分,故根据大致地理位置,将其分别归属为 洪山区和汉南区 。

处理内容

 

通过函数查看数值列的属性描述。如果查看全部列可以将参数指定为(默认为)。

 


图中显示武汉二手房平均关注人数为 17 人,平均总价 184 万,平均单价 19364 元/m2,平均楼层 22 层,平均房屋面积 95 m2。另还有标准差、最小值、四分之一分位数、二分之一分位数、四分之三分位数、最大值等信息。

获取数据中各区信息和对应区的房屋数量,绘制条形图。

 


尽管洪山区是将东湖高新区合并后统计的,但合并前二者二手房数量同样很多,其次为江岸区,江景独美。下面我们通过?2D地图?和?3D地图?的形式看各区房价在地图上的分布。

统计各区名称及对应的单价中位数(中位数受极值的影响很小)。加载本地的武汉市地图数据(各区经纬度信息)。绘制房价分布 2D 地图。

 

根据地图的信息,房价较高的区域集中在武汉市中心区域,以武昌区为首房价单价为 24600 元/m2。其余中心城市房价也均在 15000 元/m2以上。最低房价为新洲区,房价中位数为 7806 元/m2。下面通过3D地图来观察一下。

所需要的数据与2D地图相同,代码较多这里就不在这里展示了(需要的朋友在文末获取)。


相比于2D,3D图中的各区房价差异会更加明显。看着也比较 NB!!
接下来通过箱型图详细看一下各区单价的异常值。

统计各区名称信息及对应单价信息,并绘制箱型图。

 


?中的箱型图的上下边界为最大值最小值,与标准箱型图中的最大观察值,最小观察值不同。我们根据上四分位数和下四分位数的分布,可以看出洪山区、江岸区、武昌区这些房价较高的区域成典型的?右偏态?(异常值集中在较大值的一侧,尾部很长)。这说明很多二手房的价格可能因为地段,装修等原因,单价严重偏离当地房价平均水平。

由于中的散点图不太方便绘制趋势线,我们直接使用来绘制,二手房面积分布及面积与价格的相关性。

 


二手房面积主要分布在60 - 130m2之间。最吸引人的还是面积 400m2 ,总价 2000 万的那个点,鹤立鸡群。😂

我们现在看看各区的楼层和房价之间关系,听说武汉傍晚江景很美,那高层楼的价格应该要高一些。

图中各轴含义

其他地区可能各楼层价格差异不大,但最突出的武昌区,江汉区,由于第二大城中湖东湖和临江的优势,让他们的高层房价普遍高于底层。

统计户型的种类和各种类的名称,绘制横向条形图。

 


可以看到主要的房型有?一室一厅一厨一卫两室一厅一厨一卫两室两厅一厨一卫三室一厅一厨一卫三室两厅一厨一卫三室两厅一厨两卫四室一厅一厨两卫。其中最多的是?两室两厅一厨一卫,这也比较符合大多数人年轻人的要求。大的买不起,小的住不下。。

现在看看二手房房屋装修的情况,一般二手房的话猜测毛坯应该不多。看看实际情况如何,统计装修的种类和各种类的数量,绘制饼状图。

 


根据图中信息超过一般的二手房是精装,毕竟之前住过人的,再简单装修一下,以更高的价格转手肯定还是很香的,将近 25% 的二手房是简装,剩余少量为其他装修类型和毛坯。毛坯二手房确实数量不多,和预料的差不多。

下面我们看看各区二手房有无电梯数量比例,有无电梯的房屋单价有无差距。


根据上图中的信息,各区二手房中有电梯的数量占了绝大多数,除了东西湖区的房价无电梯比有电梯略高外,其余各区的有电梯房价均比无电梯房价要高,其中武昌区差距最明显,这也印证了上面楼层与房价的关系,武昌区由于江景的原因高楼很吃香。图中新洲区的条形图与折线图有部分重叠,我们下面将两个图分开绘制,效果会更好。

统计关注人数超过 3 人的热门二手房标签信息,绘制漏斗图,看看这些二手房有什么共同点。

 


根据图中信息能够很清楚的看到, VR 看装修在热门二手房标签中出现次数最多,我之前在链家尝试过 VR 看房,确实方便,无死角,但就是转的有点晕,哈哈!其余的就是随时看房,房本满两年满五年,毕竟可以少缴税。

现在我们要提取热门二手房中标题的关键词(热门词),首先加载本地停用词。

 

通过分词获取标题的分词结果,并去除停用词。

 

根据分词列表,使用类统计分词列表中各词的出现次数,选取出现次数最多的前 100 ,绘制词云图。

 

热门二手房标题中出现较多的词有:电梯,楼层、采光、精装修、户型、满二、交通等。还有一些与位置相关的词汇,可以通过卖家的这些关键词来作为参考,说不定就是我们之后买房需要注意的内容。

通过这么多方面的分析,也大致了解了武汉二手房的大致行情,市中心的房价 15000元/m2 起步,外围最低七八千左右。楼层根据自己的需要,如果想看看风景那么高层没毛病,但价格一般较高,如果不差钱武昌区就很香。面积的话,大致100m2左右就足够,太大的价格可能很高,毕竟从箱型图中的数据来看,各区中均有房价远超平均值的存在。装修纯看个人喜好,我个人喜欢自己装修,自己的风格只有自己懂,别人装的可能就感觉没有温馨的感觉。户型就选热门的 两室两厅一厨一卫。还有一些其他要注意的地方,比如采光、房龄、交通、环境 等方面。
哈哈,我也不是卖房的,只能根据一些数据来获取一些粗浅的见解,大家看个乐就好,真正的分析这点数据肯定不够。总的来说,三个字,买不起,再见!


这就是今天要分享的内容,微信搜?Python新视野,每天带你了解更多有用的知识。另外还有Python小白交流群,如果有兴趣可以通过上面的方式联系我哦!

| 首页 | 关于顺盈娱乐 | 顺盈新闻 | 顺盈注册 | 顺盈登录 | 顺盈平台 | 顺盈代理 | 顺盈APP下载 |

ICP备案:粤IP******** Copyright © 2002-2022 顺盈平台官方指定注册站 版权所有

平台注册入口