Foursquare的野心:大数据时代“活点地图”

大数据
镜头转向 2009 年,在西南偏南大会上,LBS 应用 Foursquare 红爆,“签到”功能风光无限。而时至今日,签到类应用已经从倒出的”新鲜感“到习惯,甚至遗忘。已经积累了3000 万用户,30 亿条”签到“信息的 Foursquare 不愿意放过海量的数据。他们的新野心,不在于让更多人“签到”,而是将这些签到和评价信息汇聚成类似《哈利波特》中的“活点地图”(Marauder’s Map)——一幅关于霍格沃茨魔法学校的地图,显示每条通道,每座城堡内每个人的即时位置的行动方向。

这还不止,Foursquare 还想要根据过去的“行动历史”以及朋友的喜好提供未来行动的指引,Foursquare Explore 服务,可以发现身处的城市周边都有什么值得一去的地方。他们还有怎样的“地图”美梦?处理这些数据的工具又是什么?

大野心:精细的“多边形区域”框架

Foursquare 正在和多个公司合作,为他们提供地理位置信息以及周边商家评价反馈。同时,他们也通过这些合作伙伴收集更多的地理位置信息——人们对什么地方感兴趣,对什么地方不喜欢。Instagram, Bing, Flickr, Quora, Path, Soundtracking, Evernote……都是他们的合作伙伴,导入数据的量级可想而知。

Foursquare 的工程师 David Blackman 日前接受采访时透露,Foursquare 正在为完善“活点地图”的框架,让更多应用和公司能够在此基础上反战自己的“杀手级”服务。而这种框架,就是城市区域中的“多边形”(polygon shape)——根据“签到”信息的大数据和地理信息编码汇总而成的城市区域边界。举个例子,不是“广州”或者“北京”的边界,而是广州的“上下九”区域,或者北京的“五道口”区域,他们不仅仅是一路名,一商圈,一行政区域,而是大部分用户所认为的区域边界。他用纽约的“布鲁克林”作为例子,Foursquare 所呈现的区域,并不是一般的网格状,而是,通过收集用户的签到信息整合的“多边形边界”。
brooklyn-polygon

本来,他们需要到世界上的每个城市深入每个区域来了解这些细节的边界。不过通过收集“签到”(需要输入地址)信息,或者是用户查找某地址所用的区域名字信息,他们可以足不出户地把这个工作交给世界。只要与现有的商家点评服务糟糕的区域识别稍作对比,就能想象到多边形框架的可怕之处——精准,而且“懂你”。

解密地图背后的“绘图工具”

Foursquare 目前有 100 多名员工,而负责地理信息数据的团队只有 3 人。这个小团队正在使用什么样的工具来构建地图的框架?

其中之一是 Google S2 ,提供地表地理信息数据索引的开源服务。Foursquare 目前的发现周边商家和去处的服务 Explore 就是基于S2 的开源数据。而用户的签到信息,也是会覆盖在 S2 的地理信息上,方便 Foursquare 进行整合和地理分类。 而为了建立地理编码信息的数据库,Foursquare 还在使用 MapReduce 这种大规模数据集的运算模型。David Blackman 称,他们将 MapReduce 和 S2 结合起来,将世界分成数个模块,将签到的地理位置信息与 S2 结合一起,然后分成区域,这样就有了之前我们提及的“多边形区域”的模型了。

 

[[68834]]

另外,为了获取丰富地图数据——商家、邮政编码等,Foursquare 还与 TIGER Project 和 Natural Earth 等美国政府官方的地理编码项目合作。

尽管如此,Foursquare 还是以来用户提供的大量地理位置数据来完善自己的推荐和地图内容,早前,Foursquare 曾经把这些数据整合成一个动态的“签到”地图:

 

【编辑推荐】

 

责任编辑:彭凡 来源: 爱范儿
相关推荐

2014-04-28 11:21:25

2016-09-28 14:52:03

2021-10-29 22:45:47

大数据算法技术

2013-06-13 09:42:11

大数据

2015-12-14 17:52:06

ENI经济和信息化网

2017-06-09 05:55:56

存储机器学习人工智能

2019-08-14 11:43:44

鸿蒙系统物联网5G

2013-09-17 18:24:46

SAP

2013-12-02 10:02:30

大数据时代

2017-01-03 10:23:18

大数据隐私保护

2021-09-30 16:28:34

大数据数据管理企业

2015-09-15 09:53:57

大数据时代创业

2013-06-06 10:32:48

大数据

2013-08-29 11:24:31

大数据

2013-06-21 10:16:44

2013-07-05 09:07:54

小时代大数据大数据时代

2017-02-23 09:30:29

大数据隐私数字化

2017-03-14 09:49:57

存储

2012-05-09 09:27:54

大数据PaaSMapReduce

2013-01-31 09:04:26

Informatica大数据
点赞
收藏

51CTO技术栈公众号