在移动互联网时代,电商领域的O2O服务检索(检索目标为服务商家和优惠券等)和在线商品检索必然存在许多不同点。比如,O2O服务检索更强调“移动”的特点,有一定的地域和距离的限制。同时,检索需求也跟用户所处的“情境”有很大的关系,因而在不同“情境”下用户对检索结果的期望也有所不同。O2O场景下,一个好的检索系统必然要考虑到这些特点,检索结果要能够做到对用户所在地域和所处“情境”的自适应调整。相比传统的电商商品检索,O2O服务检索对检索系统的召回和排序算法都提出了更高的要求。
尽管如此,O2O服务检索和在线商品检索也存在很多共性,比如检索结果的相关性都是衡量用户满意度和检索系统是否成功的重要指标之一。就相关性度量算法而言,传统检索系统存在的问题在O2O服务检索系统中依然存在,比如文本的“mismatch”问题、检索结果的主题转义问题等。O2O服务检索相关性的另一个挑战是数据质量的问题。由于O2O行业还是一个比较年轻同时又竞争激烈的行业,检索系统对O2O服务的数据录入和校验相对来说比较宽松,加上在运营数据方面投入的资源相对较少,导致O2O垂直搜索引擎索引的文档数据质量严重不如传统电商的商品数据。与传统电商相比,O2O搜索服务要求对数据更多的结构化表示,比如每个O2O服务必然要关联一个POI,同时每个POI必然要关联地址、品牌、经纬度和所在城市等数据,因而O2O数据质量更难把控,数据的运维也需要很多的成本。在我们的系统中,发现的跟数据质量有关的问题包括:服务所在城市的信息错误、服务所关联的POI信息错误、服务挂载到不相关的类目等等。甚至O2O服务的类目体系都存在很多不合理的方面,比如存在很相似的类目,导致服务本身不知道到底应该挂载在哪个类目的情况,另外,不同类目下商品/服务数量不均衡也是一个问题。