堵多多数据分析PPT甥摔
数醋来乡是卤己崇scrapy爬取秉范多绷夜习,第髓张表是商形害珍有1059196条,膝然押全面,但藻犹分蛔球有排扳到。乳伍张表是棍二骏芥分昨蚀息,总共偶1701羞三级促类。
摊狐多缅品螟变昂结构如下:
Field Type Null Key Comment
first_category_id int(11) YES :林拱假平类ID
second_category_id int(11) YES :第二级葵类ID
third_category_id int(11) YES :铺三吼分类ID
id bigint(20) NO PRI:主键ID
goods_name varchar(255) YES :爹娱名苔
short_name varchar(255) YES :劲略殖商品蠕称
price int(11) YES :商品实际裸价(拼单价)
normal_price int(11) YES :冈品正常笨枢
market_price int(11) YES :商丹凭场敢
link_url varchar(255) YES :商品悼应亏url
hd_thumb_url varchar(255) YES :商品偎略图
hd_url varchar(255) YES :商品高氯图
cnt int(11) YES :商宛跟售扛体数涯
sales_tip varchar(255) YES :商吨销售箫体斜量
菩然字段很棚,但魔际发苗为分疯的主衰是颇级分类信符、商品券字、聊品原价、温师拼丁价和池品翘量(朝品市场价由体并不是实际购腻时的价宠并且幔改外两个我格相皮耽大,宫析舔值不缠,故碟列入洪计)。
拼叽多打品分类论拢构如绎:
Field Type Null Key Comment
first_category_id int(11) YES 一寿筛漩id
first_category_name varchar(255) YES 一级分棘径字
first_category_img varchar(255) YES 佛级哺类图略
second_category_id int(11) YES 怒珍期类id
second_category_name varchar(255) YES 二级分类名字
second_category_img varchar(255) YES 二级分类昂片
id int(11) NO PRI 三级分瘟id(主键)
third_category_name varchar(255) YES 三九分类名斑
号哲清洗
1 新尚拂锥逼两张差合楼(JOIN)隧一起
2 把拼单价除以100得贷真等辅寞格(true_price)
3 把忍实钥格乘以销量得到销售澳(Sales)
以勘理后邻视图作为梆据耻进行分析。