首页 >excel操作 > 内容
点我浏览办公教程
点我进入树洞留言

数据分析实用工具——EXCEL下的power query自动取数

2022年12月6日 23:39

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档


前言

说到数据分析工具,大家第一时间可能会想到excel、python、sql、powerbi 、tableau等等,但第一印象里并没有power query。这是因为power query 并不是一个独立的数据处理软件。但他确实是一个好用的,能提高数据处理效率的工具。


一、power query

Power query是微软从Excel 到 PowerBI 的中间产物,它既是PowerBi取数部分的内核,又能够在Excel中使用。 在excel中使用Power query处理数据的能力要高出用excel本身处理数据的性能数倍。power query的操作方法不仅有图形化界面,也有它自己独立的语言:M。power query是excel2016及之后的版本所拥有的功能

在这里插入图片描述
它的位置就在excel中数据一栏下的“获取和转换一栏”
在这里插入图片描述
在这里插入图片描述
它可获取数据的渠道非常多,不仅可以从普通的表格、文本、XML或是文件夹中获取数据,
在这里插入图片描述
也可以从ACESS、SQLserver数据库中获取
在这里插入图片描述
甚至可以通过OData链接开放数据接口,或是通过ODBC连接其他开放数据库如Mysql、Orcle。
在这里插入图片描述
启动powerquery编辑器,我们就可以看到power query的图形化界面。
在这里插入图片描述
在PowerBI中的功能更加强大,可获取的数据来源更多
在这里插入图片描述
在这里插入图片描述
如图左边是Power BI,右边是excel,我们可以看出两个并无明显差异,因为其本质相同,使用方法也大同小异。

二、实用功能

为什么说power query是一个实用工具呢,从上面的数据获取来源,我们可以知道,power query是可以从文件夹中获取数据的。而文件夹是用来存放多个文件的。这就代表着我们可以通过power query来快速将一个文件夹中的多张表的数据进行整合。不仅如此,它还可以批量的处理表格格式。例如我们的有多张表,那必然每张表都有自己的表头,如果仅是把表合在一起,那么每一定行的数据中都会掺杂一个表头。而通过power query,我们可以仅通过对一张表进行格式编辑,它就会批量处理剩下的表格。

在这里插入图片描述

可以看到,在这个文件夹下有着多个表格数据。如何将这些数据快速、自动的进行汇总处理呢?

1.选择数据源

首先新建一个数据表正常的Xlsx格式。

在这里插入图片描述
在新建查询中选择从文件夹获取数据。
在这里插入图片描述
这里可以看到我们所选的路径文件夹下所有的文件,选择好路径并转化数据后就会进入到Powerquery编辑器。我们可以看到已获取了该文件夹下的13张表。
在这里插入图片描述
由于文件编码问题,power query只能识别csv或是xlsx文件,这里的表格是我已经将本来的6个xls文件转换为xlsx,xlsm是用来一键转换的工具表,所以才有13张表。接下来我们需要进行一个筛选,只留下xlsx文件。
在这里插入图片描述
之后我们只需选择第一列,删除其他列,再点击第一列表头旁的扩展按钮,即可得到我们表格内的数据。和一组查询。

2.数据格式处理

在这里插入图片描述
其中示例文件是我们的表格中的一张表,原始表格是最后的结果表。在我们对转换示例文件进行格式修改后,其他所有表格都会按照转换示例文件的格式处理,最后合并反馈在原始表格中。
在这里插入图片描述
我们可看到表格内的数据是这样的,每张表的前面都有一段无效内容,如果直接合并在一起对于后续的数据处理分析会很麻烦,难以使用,因此就需要在这里删除前5行数据。
在这里插入图片描述
之后将第一行设置为表头,再根据需要,将各个字段的值修改为对应的日期/数字/文本类型,将我们想要的得到的结果都通过示例处理完。
在这里插入图片描述
在这里插入图片描述
到这里,我们的数据就初步处理完了,只需关闭并上载,处理好的数据就会全部出线在我们的excel表格中。可以直接对其进行可视化或是计算处理。

3.进阶数据处理

power query能够实现excel对数据处理的全部功能。
在这里插入图片描述
在这里插入图片描述
除了可视化界面上这些基本操作外,还有power query的700多个函数可以使用。详情见
https://docs.microsoft.com/zh-cn/powerquery-m/power-query-m-function-reference

4.自动取数的路径问题

对于做excel自动化报表来说,自然不能只做一次性报表,如果每个人/每次都要因为数据的不同而重做同一个报表,那浪费的人力成本是很大的。因此,在power query自动获取文件夹的数据的基础上,还应该使该表格不管放在哪个文件夹下,都可以读取该文件夹路径,从而自动获得文件夹数据,而不是每换一个人适合、换一个文件夹使用,就要重新手动修改一次路径。这就涉及到power query的另一个功能——自定义函数。
首先需要在当前表格中建一个如下表格,用cell函数返回当前工作簿所在路径。
在这里插入图片描述
在这里插入图片描述
在power query左侧表格名上单击右键,找到创建函数
在这里插入图片描述
在如图位置输入下列函数,并吧Name位置的“表3”修改为之前创建的用来获取路径的表,将“原始表格”修改为数据源所在的文件夹名。

= ()=>let    源 = Excel.CurrentWorkbook(){[Name="表3"]}[Content],    更改的类型 = Table.TransformColumnTypes(源,{{"fd", type text}}),    按分隔符拆分列 = Table.SplitColumn(更改的类型, "fd", Splitter.SplitTextByDelimiter("[", QuoteStyle.Csv), {"fd.1", "fd.2"}),    更改的类型1 = Table.TransformColumnTypes(按分隔符拆分列,{{"fd.1", type text}, {"fd.2", type text}}),    添加的后缀 = Table.TransformColumns(更改的类型1, {{"fd.1", each _ & "原始表格", type text}}),    #"fd 1" = 添加的后缀{0}[fd.1]in    #"fd 1"

之后还需要切换到表格查询中选择”源“这一步骤,将数据源的获取改为我们刚建好的路径函数,使之通过调用函数来自动获取工作簿路径下数据源所在文件夹中的数据。
在这里插入图片描述

完成后检查是否出现错误步骤,如没有错误点击窗口左上角“关闭并上载” 自动取数模板就完成了,
如有错误,将源之后从出现错误的步骤开始修改。
在这里插入图片描述

最后确认上图中几个文件(这里“数据库”是做数据留存,将取数取出的所有数据导入数据库,“透视”是根据数据库中数据建立透视表做可视化的。二者都不影响“取数”表的工作,这里不做额外解释。)在同一文件夹下,我这里是在“取数模板”文件夹下。之后不管将“取数模板“这一文件夹放在哪个目录下,只要不修改数据源所在文件夹的名字,”取数“均可正常工作了。

注:也可先构建路径函数,通过路径函数直接获取数据源。


总结

这一工具是在工作中,发现诸多数据的下载,如日数据的跟踪、历史数据的复盘等工作时,均需要下载很多表格的数据。而通过第三方平台/插件下载的数据又大多带有平台标签之类无用格式。因此如果手工将数据汇总需要花费大量时间,而通过自动取数,则只需将下载好的数据表放在同一个文件夹下,然后在取数表中刷新。大大节省了时间成本。对于一些中小公司,无数据沉淀、无成熟数据库、数仓使用的情况下,是一个很便利的工具。

补充:手动设置power query相对路径详细 链接: https://blog.csdn.net/qq_40195798/article/details/117784947
如跳转失败,请复制链接到浏览器


参考文章:https://blog.csdn.net/qq_40195798/article/details/112918371

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,在此表示感谢。

点我浏览办公教程
点我进入树洞留言

特别提醒:

1、请用户自行保存原始数据,为确保安全网站使用完即被永久销毁,如何人将无法再次获取。

2、如果上次文件较大或者涉及到复杂运算的数据,可能需要一定的时间,请耐心等待一会。

3、请按照用户协议文明上网,如果发现用户存在恶意行为,包括但不限于发布不合适言论妄图

     获取用户隐私信息等行为,网站将根据掌握的情况对用户进行限制部分行为、永久封号等处罚。

4、如果文件下载失败可能是弹出窗口被浏览器拦截,点击允许弹出即可,一般在网址栏位置设置

5、欢迎将网站推荐给其他人,网站持续更新更多功能敬请期待,收藏网站高效办公不迷路。

      



请 登录后回复

共有0条评论

PHP网站源码宝安seo网站优化盐田seo排名南澳网站优化按天扣费大芬百度网站优化盐田模板制作大浪SEO按天扣费丹竹头网页设计南联百姓网标王推广塘坑网站优化吉祥网站建设设计罗湖优秀网站设计龙岗seo网站优化沙井网站制作设计坑梓外贸网站制作横岗网站优化排名坂田网页制作塘坑网站排名优化大浪设计公司网站石岩如何制作网站福田百度网站优化排名南山百搜标王龙岗百搜标王民治网站排名优化东莞网站优化按天收费平湖设计网站大运关键词排名塘坑网站优化软件罗湖网站推广系统东莞模板网站建设坑梓模板制作歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

PHP网站源码 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化