课程简介
遇到的挑战主要是由两方面原因造成的。
第一,知识图谱相较于图像、语音、NLP 等 以算法为主的 AI 领域来比,它不是单单靠算法模型持续优化就能解决的,它更多 的还需要知识运营的参与以及工程系统的搭建。 最终的交付物并非是单纯的算法服务,而是一个很大的知识网络。
第二,百科知识图谱对知识有清晰的定义,大家谁去构建目标都差不多,交付物最终也不会偏差太多。但是商品知识图谱到底构建哪些知识 是没有太清晰的定义的。
总而言之,面临技术上不知从何下手,知识上不知交付终态是什么的两个问题。
目标收益
1. 对知识图谱实践的方法和场景有全面的认识
2. 对知识图谱未来的发展方向有些了解
3. 对知识图谱应用的现状和局限有一定的了解
培训对象
课程内容
案例方向
数据商业化/大数据架构/NLP/人工智能产品落地
案例背景
遇到的挑战主要是由两方面原因造成的。
第一,知识图谱相较于图像、语音、NLP 等 以算法为主的 AI 领域来比,它不是单单靠算法模型持续优化就能解决的,它更多 的还需要知识运营的参与以及工程系统的搭建。 最终的交付物并非是单纯的算法服务,而是一个很大的知识网络。
第二,百科知识图谱对知识有清晰的定义,大家谁去构建目标都差不多,交付物最终也不会偏差太多。但是商品知识图谱到底构建哪些知识 是没有太清晰的定义的。
总而言之,面临技术上不知从何下手,知识上不知交付终态是什么的两个问题。
收益
1. 对知识图谱实践的方法和场景有全面的认识
2. 对知识图谱未来的发展方向有些了解
3. 对知识图谱应用的现状和局限有一定的了解
解决思路
回顾过去,我们能有机会持续在这个方向投入,关键点有两个:第一,我们对商品知识最初就确定了清晰的定义,我们允许进入知识图谱的知识遵循客观的(非一些业务逻辑和特定约束下的规则,而是具备普适性),公开的(非隐私数据),标准化的(可以协作生产)原则,同时又与商品组织、表达、发现相关,从而沉淀的知识能够在业务应用上复用,生产的过程能够在不同角色间公开协作,同时也可以在业务场景和业务目标的驱动下,相关人员有动力参与到知识的构建中来。第二,记着漆桂林老师前些年分享讲知识图谱技术就像盲人摸象,谁看到的都不一样。在那个初期阶段,我们跟藏经阁计划的五位老师一起对知识图谱技术按推理、获取、融合、建模做了清晰的定义,从而才使得我们的工程、算法能够协作起来。
结果
电商的商品信息从知识生产的源头就是结构化的知识卡片,相较于知识图谱传统的应用形式,例如搜索的知识卡片、基于知识图谱关系的推荐、基于 KBQA 的问答等,在电商的场景下,知识图谱的应用是有本质区别的。
总体来看,我们的商品知识图谱正在为天猫、淘宝、Lazada、AliExpress、1688、飞猪、盒马、天猫精灵等 20 多个业务线提供商品相关的知识服务和推理决策支持。典型的应用形式例如:
(1)通过图片、条码等极少信息的 AI 识别,识别出商品 ID,利用知识服务,快速帮助商家把线下商品基础信息数字化,同时还能通过 AI 帮助商品更好地描述其商品卖点与亮点。知识图谱帮助企业智能运营。
(2)通过知识图谱本体间的映射,帮助商品在不同的市场间做自动的信息转化,例如国内商家在天猫的商品,一键自动在东南亚市场多个国家通过多个语言即时上线。知识图谱助力商家把商品卖全球。
(3)通过推理帮助平台自动拦截有问题的商品,知识图谱为消费者保驾护航。
(4)通过商品知识图谱帮助 C2M,发现新需求,指导生产端生产商品。例如这次疫情,我们很早就发现了印有“今天已经消毒”字样的指示牌需求,给到有生产能力的工厂,为突发的需求量提前预警。