(12)发明专利申请
(10)申请公布号 CN 110839218 A(43)申请公布日 2020.02.25
(21)申请号 201911193244.5(22)申请日 2019.11.28
(71)申请人 安徽慧视金瞳科技有限公司
地址 230000 安徽省合肥市高新区黄山路
602号合肥国家大学科技园C区1楼102室(72)发明人 林传文 汪俊锋
(74)专利代理机构 合肥律众知识产权代理有限
公司 34147
代理人 冯慧云(51)Int.Cl.
H04W 4/20(2018.01)H04W 8/20(2009.01)G06Q 50/26(2012.01)
权利要求书1页 说明书3页
CN 110839218 A(54)发明名称
一种基于手机信令数据的城市人口数量估算方法(57)摘要
本发明公开了一种基于手机信令数据的城市人口数量估算方法,将城市区域内,一定时间范围内的活跃移动设备数量判定为该城市区域内的常住人口数量,所述活跃设备数量指的是超过设定比例天数处于活跃状态的移动设备数量。本发明提供了一种利用手机信令数据进行城市人口数量估算的新方法,在众多手机信令数据中选取手机号IMSI、手机设备IMEI、时间戳、位置区编号、事件类型、手机号归属地这几个属性的数据进行组合运用,进行双极去重处理和噪声修正处理,使得城市人口数量估算结果更加趋于准确,为城市人口数量的精准普查提供参考意见。
CN 110839218 A
权 利 要 求 书
1/1页
1.一种基于手机信令数据的城市人口数量估算方法,其特征在于,将城市区域内,一定时间范围内的活跃移动设备数量判定为该城市区域内的常住人口数量,所述活跃设备数量指的是超过设定比例天数处于活跃状态的移动设备数量。
2.根据权利要求1所述的城市人口数量估算方法,其特征在于,提取各家通信运营商的手机信令数据,统一数据格式,统一后的信令数据包括但不限于手机号IMSI、手机设备IMEI、时间戳、位置区编号、事件类型、手机号归属地;所述事件类型用于区分移动设备不同的信令操作,所述信令操作包括但不限于开机、电话、短信、切换基站、网络数据通讯。
3.根据权利要求2所述的城市人口数量估算方法,其特征在于,具体包括以下步骤:S1,通过手机号IMSI、手机设备IMEI、时间戳统计每个手机号每一天的活跃情况,并将一定时间范围内所有活跃手机号作为总样本;
S2,对总样本进行基于注册身份证号的一级去重处理;S3,利用手机号IMSI、手机设备IMEI这两个属性,对总样本进行二级去重处理;S4,获取经过二级去重处理的总样本中的活跃移动设备数量。4.根据权利要求3所述的城市人口数量估算方法,其特征在于,所述一级去重处理具体为,甄别一张身份证对应的多个手机号的信令数据在时间戳和位置区编号这两个属性上的表现,表现出一致性多个手机号仅保留其中一个手机号的信令数据,表现出不一致的多个手机号均予以保留。
5.根据权利要求3所述的城市人口数量估算方法,其特征在于,所述二级去重处理具体为,对手机号IMSI不同但手机设备IMEI相同的移动设备进行剔除。
6.根据权利要求3-5任一项所述的城市人口数量估算方法,其特征在于,对总样本/活跃移动设备进行物联网设备噪声修正。
7.根据权利要求6所述的城市人口数量估算方法,其特征在于,所述噪声修正包括从总样本/活跃移动设备中剔除位置区信号从未发生变化的移动设备,以及只有网络数据通讯和切换基站操作的移动设备。
2
CN 110839218 A
说 明 书
一种基于手机信令数据的城市人口数量估算方法
1/3页
技术领域
[0001]本发明涉及信息化人口统计技术领域,具体是一种基于手机信令数据的城市人口数量估算方法。
背景技术
[0002]手机信令数据是用户手机与通信基站之间的通信数据。手机开机、拨打/接听电话、发送/接收短信、浏览网页等任何通讯行为,都需要与手机附近的基站产生通信联系。由于基站的位置是固定且已知的,基站的位置信息一定程度上反映了用户的生活区域。[0003]手机信令数据特点:1、样本量大且不具有明显倾向性;2、数据客观且全面;3、数据具有较强的时空持续性;4、数据字段带有时间和位置信息。因此,利用手机信令数据对人口动态流动情况进行有效统计,是当下信息化人口统计的重要研究方向之一。例如,国家知识产权局于2019年6月21日公布的发明专利申请公开了一种基于手机信令的城市中观层面实有人口统计方法,利用手机信令对手机用户的个人出行链进行提取,进而对手机用户进行人口类型分类和出行类别分类,实现对城市短期驻留人口进行统计,用于弥补现有人口统计方法在城市中观层面人口统计中的局限。
发明内容
[0004]本发明旨在提供一种基于手机信令数据的城市人口数量估算方法。[0005]一种基于手机信令数据的城市人口数量估算方法,将城市区域内,一定时间范围内的活跃移动设备数量判定为该城市区域内的常住人口数量,所述活跃设备数量指的是超过设定比例天数处于活跃状态的移动设备数量,具体操作是:[0006]1、提取各家通信运营商的手机信令数据,统一数据格式,统一后的信令数据包括但不限于手机号IMSI、手机设备IMEI、时间戳、位置区编号、事件类型、手机号归属地;所述事件类型用于区分移动设备不同的信令操作,所述信令操作包括但不限于开机、电话、短信、切换基站、网络数据通讯。[0007]2、通过手机号IMSI、手机设备IMEI、时间戳统计每个手机号每一天的活跃情况,并将一定时间范围内所有活跃手机号作为总样本。[0008]3、对总样本进行基于注册身份证号的一级去重处理,所述一级去重处理具体为,甄别一张身份证对应的多个手机号的信令数据在时间戳和位置区编号这两个属性上的表现,表现出一致性多个手机号仅保留其中一个手机号的信令数据,表现出不一致的多个手机号均予以保留。[0009]4、利用手机号IMSI、手机设备IMEI这两个属性,对总样本进行二级去重处理,所述二级去重处理具体为,对手机号IMSI不同但手机设备IMEI相同的移动设备进行剔除。[0010]5、获取经过二级去重处理的总样本中的活跃移动设备数量。[0011]除此之外,考虑到物联网设备也使用到4G/5G通讯模块,会对整个估算结果产生一定的影响,故而对总样本/活跃移动设备进行物联网设备噪声修正,所述噪声修正包括从总
3
CN 110839218 A
说 明 书
2/3页
样本/活跃移动设备中剔除位置区信号从未发生变化的移动设备,以及只有网络数据通讯和切换基站操作的移动设备。前者对应各种机械加工、数据采集等设备上运行的通讯模块,这些通讯模块基本处于静止状态,因此通过位置区信号这一属性能够予以剔除;后者对应各种移动设备上的物联网通讯模块,这类通讯模块产生的信令数据的特点是只有网络数据通讯和/或切换基站,没有通话、短信、开机等类型信令数据,能够通过信令数据筛选进行剔除。
[0012]本发明提供了一种利用手机信令数据进行城市人口数量估算的新方法,在众多手机信令数据中选取手机号IMSI、手机设备IMEI、时间戳、位置区编号、事件类型、手机号归属地这几个属性的数据进行组合运用,进行双极去重处理和噪声修正处理,使得城市人口数量估算结果更加趋于准确,为城市人口数量的精准普查提供参考意见。具体实施方式
[0013]下面结合具体实施例对本发明作进一步详细的说明。本发明的实施例是为了示例和描述起见而给出的,而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显而易见的。选择和描述实施例是为了更好说明本发明的原理和实际应用,并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。[0014]实施例1
[0015]一种基于手机信令数据的城市人口数量估算方法,具体包括以下步骤:[0016]1、提取各家通信运营商的手机信令数据,统一数据格式,统一后的信令数据包括手机号IMSI、手机设备IMEI、时间戳、位置区编号、事件类型、手机号归属地等,参见表1;所述事件类型用于区分移动设备不同的信令操作,所述信令操作包括开机、电话、短信、切换基站、网络数据通讯等。
手机号IMSI手机设备IMEI时间戳位置区编号事件类型手机归属地[0018]表12、通过手机号IMSI、手机设备IMEI、时间戳统计每个手机号每一天的活跃情况,并将一定时间范围内所有活跃手机号作为总样本;[0019]3、对总样本进行基于注册身份证号的一级去重处理,所述一级去重处理具体为,甄别一张身份证对应的多个手机号的信令数据在时间戳和位置区编号这两个属性上的表现,表现出一致性多个手机号仅保留其中一个手机号的信令数据,表现出不一致的多个手机号均予以保留。[0020]4、利用手机号IMSI、手机设备IMEI这两个属性,对总样本进行二级去重处理,所述二级去重处理具体为,对手机号IMSI不同但手机设备IMEI相同的移动设备进行剔除。[0021]5、获取经过二级去重处理的总样本中的活跃移动设备,从活跃移动设备中剔除位置区信号从未发生变化的移动设备,以及只有网络数据通讯和切换基站操作的移动设备,判定为该城市区域内的常住人口数量。[0022]实施例2
[0023]与实施例1的区别在于,对步骤2中的总样本直接进行物联网设备噪声修正,所述噪声修正包括从总样本中剔除位置区信号从未发生变化的移动设备,以及只有网络数据通讯和切换基站操作的移动设备。具体选择先进行噪声修正,还是后进行噪声修正,可根据干
4
[0017]
CN 110839218 A
说 明 书
3/3页
扰通讯设备数量和实际计算量确定,选择计算量较少的方案进行。[0024]显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域及相关领域的普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
5
因篇幅问题不能全部显示,请点此查看更多更全内容