阿里云大数据MaxCompute计算资源分布以及LogView分析优化

原创

阿里云云栖号

云栖号技术分享

2018/04/26 14:46

阅读数 202

本文被收录于专区

AI & 大数据

进入专区参与更多专题讨论

摘要： MaxCompute(原ODPS）的概念海量数据处理平台，服务于批量结构化数据的存储和计算，提供海量数据仓库的解决方案以及针对大数据的分析建模服务.(官方文档有这里就不多做介绍了)官方文档链接优势用户不必关心分布式计算细节，从而达到分析大数据的目的。

MaxCompute(原ODPS）的概念

大数据计算服务(MaxCompute，原名ODPS)是一种快速、完全托管的PB/EB级数据仓库解决方案，具备万台服务器扩展能力和跨地域容灾能力，是阿里巴巴内部核心大数据平台，支撑每日百万级作业规模。MaxCompute向用户提供了完善的数据导入方案以及多种经典的分布式计算模型，能够更快速的解决用户海量数据计算问题，有效降低企业成本，并保障数据安全。(官方文档有这里就不多做介绍了)
官方文档链接

优势

用户不必关心分布式计算细节，从而达到分析大数据的目的。

应用场景

大型互联网企业的数据仓库和BI分析、网站的日志分析、电子商务网站的交易分析、用户特征和兴趣挖掘等。

MaxCompute（原ODPS）的架构

odps.structure.png MaxCompute由四部分组成，分别是客户端 (ODPS Client)、接入层 (ODPS Front End)、逻辑层 (ODPS Server) 及存储与计算层 (Apsara Core)。

ODPS的客户端有以下几种形式:
- Web：ODPS以 RESTful API的方式提供离线数据处理服务；
- ODPS SDK：对ODPS RESTful API的封装，目前有Java等版本的实现；
- ODPS CLT (Command Line Tool)：运行在Window/Linux下的客户端工具，通过CLT可以提交命令完成Project管理、DDL、DML等操作；
- ODPS IDE：ODPS提供了上层可视化ETL/BI工具，即“采云间”，用户可以基于采云间完成数据同步、任务调度、报表生成等常见操作。
ODPS接入层提供HTTP服务、Cache、Load Balance，用户认证和服务层面的访问控制。
逻辑层又称作控制层，是ODPS的核心部分。实现用户空间和对象的管理、命令的解析与执行逻辑、数据对象的访问控制与授权等功能。在逻辑层有Worker、Scheduler和Executor三个角色：
- Worker处理所有RESTful请求，包括用户空间（project）管理操作、资源（resource）管理操作、作业管理等，对于SQL DML、MR、DT等启动Fuxi任务的作业，会提交Scheduler进一步处理；
- Scheduler负责instance的调度，包括将instance分解为task、对等待提交的task进行排序、以及向计算集群的Fuxi master询问资源占用情况以进行流控（Fuxi slot满的时候，停止响应Executor的task申请）；
- Executor负责启动SQL/ MR task，向计算集群的Fuxi master提交Fuxi任务，并监控这些任务的运行。
计算层就是飞天内核（Apsara Core),运行在和控制层相互独立的计算集群上。包括Pangu（分布式文件系统）、Fuxi（资源调度系统）、Nuwa/ZK（Naming服务）、Shennong（监控模块）等。ODPS中的元数据存储在阿里云计算的另一个开放服务OTS（Open Table Service，开放结构化数据服务）中，元数据内容主要包括用户空间元数据、Table/Partition Schema、ACL、Job元数据、安全体系等。

MaxCompute处理流程

下面将以一个完整的SQL语句为例，介绍提交后经过MaxCompute处理的全流程：

309503dcf7f98da684f81285c05961b83c61f956

提交作业:

通过console提交一个SQL语句。
调用SDK计算配置信息中的签名。
发送 RESTful 请求给HTTP服务器。
HTTP 服务器发送请求到云账号服务器做用户认证。
认证通过后，请求就会以 Kuafu通信协议方式发送给 Worker。
Worker判断该请求作业是否需要启动Fuxi Job。如果不需要，本地执行并返回结果。
如果需要，则生成一个 instance，发送给 Scheduler。
Scheduler把instance信息注册到 OTS，将其状态置成 Running。
Scheduler 把 instance 添加到 instance 队列。
Worker把 Instance ID返回给客户端。

运行作业：

Scheduler会把instance拆成多个Task，并生成任务流DAG图。
把可运行的Task 放入到优先级队列TaskPool中。
Scheduler 有一个后台线程定时对TaskPool 中的任务进行排序。
Scheduler 有一个后台线程定时查询计算集群的资源状况。
Executor在资源未满的情况下，轮询TaskPool，请求Task。
Scheduler判断计算资源。若集群有资源，就将该Task发给Executor。
Executor调用SQL Parse Planner，生成SQL Plan。
Executor 将 SQL Plan 转换成计算层的 FuXi Job 描述文件。
Executor 将该描述文件提交给计算层运行，并查询 Task 执行状态。
Task 执行完成后，Executor更新 OTS 中的 Task信息，并汇报给 Scheudler。
Schduler 判断 instance 结束，更新 OTS 中 instance 信息，置为 Terminated。

查询状态：

客户端接收到返回的 Instance ID 后，可以通过 Instance ID 来查询作业状态：

客户端会发送另一个 REST 的请求，查询作业状态。
HTTP 服务器根据配置信息，去云账号服务器做用户认证。
用户认证通过后，把查询的请求发送给 Worker。
Worker 根据 InstanceID 去 OTS 中查询该作业的执行状态。
Worker 将查询到的执行状态返回给客户端。

这里主要说下计算层的MR Job和SQL Job，因为ODPS有对外提供MapReduce编程接口，来访问ODPS上的数据，其中MR Job就是用来跑那些任务的。而SQL Job主要用来跑通过客户端接受的SQL查询请求的任务。

逻辑层里主要有二个队列，一个是instance队列，一个是Task队列，Scheduler负责instance的调度，负责将instance分解成Task放入到Task队列，重点是：Task队列是按照优先级排序的，负责排序的就是Scheduler发起的一个后台线程。Executor在资源未满的情况下，轮询TaskPool，请求Task，Executor调用SQL Parse Planner，生成SQL Plan，然后将SQL Plan转换成计算层的 FuXi Job 描述文件，最终将该描述文件提交给计算层运行，并查询 Task 执行状态。

MaxCompute生态圈

ad8af45fb581339a3444388c13887aa1af9e563b

ODPS提供了数据上传下载通道，SQL及MapReduce等多种计算分析服务，并且提供了完善的安全解决方案，其功能组件（绿色虚线部分）以及周边组件（蓝色标识）。
具体功能组件的作用，请参考官方文档。

MaxCompute计算集群分布

首先整个ODPS计算资源被分成多个集群，每个project可以配置多个集群，但是只能默认跑在其配置的默认集群（默认集群只有一个）上面，除非手动切换。
每个集群会被分成多个quota，一般某个project会跑在某个集群上的quota上的，每个quota有固定的计算资源配额，你的project也会有固定的至少获取到的资源，最大获取到的资源就是所在quota的配额，不一定能获取到最大的配额，因为某个quota是多个project共享的。

Logview分析

当某个任务跑的比较慢，我们可以根据其logview来发现问题，进行优化，下面给大家分享如何对logview进行分析，下面我们来看根据某个logview的分析步骤：

点击圆形的sql，就可以看到实际执行的sql，点击diagnosis就可以看到对sql执行的诊断，是否资源充足，是否有长尾情况，是否有数据倾斜情况。
还可以看到任务运行的开始时间，结束时间，运行时间，点击detail就可以看到这个任务执行详情，包括有向无环图，Mapper和Reducer或Join节点具体的运行记录。下面是点击detail之后，出现的画面，也是我们重点要分析的地方，如下图所示：
我们可以看到左边是整个实例所包含的任务运行的有向无环图，一共有三个Task，右边包括具体的三个Task的详细信息，还有summary，你可以看到每个Task的input和output的记录数，还可以看到每个Task开启了几个instance进行运行。
点击每个Fuxi Job就可以在下面看到每个Job详情：具体如下图所示：
从上面可以看到，M1_STG1这个job一共起了46个instance来跑任务，这个job的开始时间在上面个红色的框框里，每个instance的开始和起始时间在下面的框框里，每个instance实际运行时间就是下面Latency时间，单位是s，最右边的框框里显示的是这个job下面的所有instance里面的最小最大和平均运行时间，如果说差异比较大，可能会有长尾或者数据不均匀所致，我们要根据这些信息进行分析，该如何去优化这个Job。

优化例子

具体的优化过程以后会给大家具体讲解，下面先给大家展示一个例子，由于小表和大表进行join所造成的长尾问题的解决方案以及效果：

-优化方案：
我们将join的二个小表，使用mapjoin的方式进行优化，将每个小表的内容load到每个mapper节点的内存中，这个速度可以大大优化，但是对小表的大小是有限制的，如果太小，可以设置每个mapper的memery的大小，但是这些都不是万能的，当资源不足时，可能会造成资源等待。所以优化方案要根据自己sql以及涉及到的数据量进行优化，任何优化方法都不是万能的。

-优化前：

-优化后：

后续

希望大家在跑sql任务的时候，多看看自己的logview，不要太蛮力的去跑sql，这样不仅占用资源太多，而且还会影响别人的任务运行。优化固然很难，但是也要慢慢走下去。
以后会分享更多的优化方案。

原文链接

Artrener 2024-07-21 15:12

可以看他不爽，看360不爽，但人家说的是事实。比如说航空业的业内人士也这么说的。

大后锋 2024-07-10 14:03

然后交警找责任方，打过去是牛逼高大上的生成式AI的客服

osc_82223409 2024-07-21 15:58

大家都机器裸奔的吧，也挺安全的

小而美软件开发 2024-07-21 17:47

他说的主要是那些政企，普通用户盗版的就别管扯了

小xu中年 2024-07-21 19:44

🙏

-SORA- 2024-07-21 13:22

搞不好这次出问题的代码就是AI写的，美式降本增笑😆

Yoona520 2024-05-17 16:34

周鸿祎现在活得越来越像个小丑，好好待在你幕后不好非要当网红，雷军你能学明白吗？

小而美软件开发 2024-07-21 17:49

他家不是有个一个了吗又有整一个

Francesca 2024-06-15 15:56

这不还是六个手指吗

变

变形精怪 2024-07-21 12:59

全栈工具，非常奈斯

猴思猿瑾 2024-05-31 18:31

骗兄弟可以，别把自己骗了就好

壹城 2024-07-21 21:39

用了这么多年360，最近有个事情差不多把我劝退了

salmon514 2024-07-21 13:03

流氓软件一个

易仙洞主 2024-07-21 12:49

我在用360

支

支持者 2024-07-21 14:38

真是不要脸，这都能凑热度

小杨阿哥哥 2024-07-22 05:45

看到GPU利用率我就懂了，平时放着不利用不是浪费么

小杨阿哥哥 2024-07-22 06:25

gogs 又不是不能用~，不花冤枉钱

英特迈往 2024-05-30 13:42

8.00亿元用于达梦中国数据库产业基地，6.03亿元用于达梦研究院建设项目。融资23.51亿，14.03亿搞基建。666

cielSwift 2024-07-21 19:47

像基础设施为什么不用Ubuntu呢

yong230 2024-06-23 19:18

评论区又开始阴阳怪气了，人家兼容安卓说套壳，抛弃不兼容安卓，又说不百分百自研，哎，真难。

Francesca 2024-05-19 18:00

wine跑win的安卓模拟器、安卓模拟器里面安装chromeOS、chromeOS里面安装linux环境、linux环境安装wine

Francesca 2024-07-21 22:00

到时候全中国的电脑因为360更新导致蓝屏，我就笑了

Yanlongli 2024-07-11 17:28

降低了视觉复杂性，增高了操作复杂性。

mymbrooks 2024-07-21 20:26

不要点逼脸恬不知耻

ls-l-a 2024-07-21 16:34

周鸿祎明明更恶劣，也好意思谈安全？2012年，360向用户电脑推送假冒系统补丁KB360018，主管故意。真以为网友没有记忆力呀。

xiaoqibabby 2024-07-21 15:39

做个人吧

开源中国阅卷组组长 2024-07-21 23:18

真不要脸

cida 2024-07-21 19:21

早在四五月份，就有 Debian Linux、Rocky Linux 用户报告他们的服务器因 CrowdStrike 更新导致内核错误而崩溃。 Crowdstrike 支持部门承认了这一问题，并强调了测试不足和对不同操作系统兼容性问题关注不够。只是当时受影响范围较小，并未引起太多关注。这次又在 Windows 上捅这么大一个马蜂窝。

是哦為 2024-05-17 13:42

说的太对了。老周控制不了谷歌，但能控制360啊。己所不欲，勿施于人。应该先开源360所有产品。

莱布尼茨啃苹果 2024-07-21 18:54

厚颜无耻之人

jalena 2024-07-21 23:03

我算那个漏网之鱼咯？

CloudShi83 2024-07-06 17:13

感谢祖师爷赏饭吃，给你磕一个

小而美软件开发 2024-07-21 17:48

他说的主要是那些政，企，普通用户盗版的就别管扯了

crystalsis 2024-07-21 12:30

nVidia 的驱动,内核态就是开几个接口给用户态,有用的都在用户态,用户态不开源.

gamedot 2024-05-17 11:14

老周从骨子里都在为华为的开源大业考虑，不是华为的人，却有华为的魂。

Azeroth008 2024-07-21 22:26

360对新手很友好，能轻松一键把乱七八糟的全家桶都塞进硬盘。😆

买房也用券 2024-06-24 09:45

Mac OS寄生在unix身上,android寄生在linux身上,Window抄袭Mac OS,Linux抄袭Unix....自己人搞鸿蒙你们就受不了了?

hanf 2024-06-24 09:56

即便是码农这个群体，也是情绪凌驾客观理性的多，冷嘲热讽，苦大仇深的样子，何必？你行你上？

bhzhu203 2024-06-18 15:36

这个很有用图形界面服务器内核panic之后图形界面是卡死的无法动弹，没有有效信息有了蓝屏就可以输出具体的错误信息了

平波 2024-07-07 16:54

吃完就砸锅，好像那个啥纯血，吃完了，就想把小米，oppo、vivo的锅咂了；😂

uncle_haiyang 2024-07-01 10:52

dbeaver也很好用

钛元素 2024-07-21 12:21

我不是，我没有，不要乱说啊

快乐的LeapFrog 2024-05-18 09:18

但问题是："这对普通 Android 用户有什么用？"现在的答案似乎是："几乎没有"。

zhuzhua 2024-05-21 10:08

笑死我了，被深度绑架的人，敢不交钱吗？以后谁用小公司国产开源框架谁就是213！！！等着以后被收割吧

janz0912 2024-07-22 08:07

腾子啊，这个不赚钱，别了吧。我们不希望sudo要充值啊

凹语言开发工作室 2024-06-21 18:32

恭喜仓颉语言发布 🎉

osc_566335 2024-05-30 14:12

果然一大堆低端码农，国产化时代，连国产生态系统的东西都没玩过。虽然东西是没多好，不过喷要要喷在点子上，别在这秀白目无知，让人看着好笑。

1111123441 2024-05-27 15:31

对其打扰了你还真就是TIO的那个公司。 ..................................

光明丶 2024-05-19 23:25

真的傻逼，把路走死了，后来的人咋整。

一介农夫 2024-07-21 14:15

360 良心软件是有，但能告诉我一下，用着用着莫名其妙的快给人家主机安装上360全家桶了这种静默操作也是叫安全？

码农小胖哥 2024-05-16 14:40

我让你六秒，和比武时我让你六招具有异曲同工的效果，表现了主人翁的强无敌和自信

斯

斯蒂芬421 2024-06-12 10:37

如果我写一个脚本，让AI全天24小时给是按各种关键词生成图片，那不是可以在家坐等收钱了

西红柿幽幽子 2024-05-30 16:53

有现成的开源产品可用，我需要个垃圾来保底？

RustDesk 2024-07-21 13:13

AI只是让微软股价涨了，windows依然还是那个windows

Tobyee 2024-07-09 11:04

没GMS是借口，本质还是不想适配国内的手机系统，等鸿蒙Next出来，看微软拥抱不拥抱就知道了

袋鼠 2024-06-22 19:13

文档整体看了，也深入细节看了，从规格上来看算是一个非常优秀的语言融合实践案例，但设计者仍稍显矫揉造作之嫌，搞了一些“创新”之举，比如func/foreign/->/prop/mut/Rune/<:/...，除赋值操作符外，任何复合操作符都是不可接受的，宜尽量避免；在某些方面显得一致性不严谨，比如函数作为参数和返回类型时就与标准定义不一致，比如匿名函数（Lambda）定义也不一致，增加了代码阅读理解难度；C语言取址符号(&)作为接口继承用间隔符是个坏主意，因为这个符号在键盘上输入不方便，需要双键才能输入；Nothing/Option/Any 貌似取自TypeScript，其终归是某种类似于 Null 的检测机制，要不合成一个？类型在后并用冒号(:)分隔的语法风格上属于 Pascal/Go 风格，这种风格感觉是更方便实现词法分析器并生成语法树，利于后续的处理；个人期望出现一门新语言，它应该以C语言风格为基础，大胆吸收新生代语言的优秀实践（语法糖），语言规格尽可能的保持精简和一致性，但语义和扩展性保持开放；仓颉语言为新语言开发做了非常伟大的探索和实践，实现后的预期也非常好，开了个好头；有了榜样的力量，相信中文社区有更大可能性诞生这样一门语言；

首席的哥队长 2024-05-17 11:17

我建议360把所有的产品都开源，然后通过开源变成国内开源界的领军企业，领导着大家全力来对阵国外企业

crystalsis 2024-06-18 15:06

评论区很有意思，黑底白字写个kernel panic跟蓝底白字什么差别.还“史诗级退步”"好的不学坏的学的挺快"

李英辉 2024-06-27 11:21

不管怎么样，在安卓和ios的夹缝中，敢于建立第三个生态系统，关键还建立起来了，这就newbee了；强如微软，当年也灰头土脸；那些吹毛求疵的，其实就是见不得自己人好。

小xu中年 2024-07-21 19:37

怎么和数据库有关呢？

阿里云大数据MaxCompute计算资源分布以及LogView分析优化

MaxCompute(原ODPS）的概念

优势

应用场景

MaxCompute（原ODPS）的架构

MaxCompute处理流程

提交作业:

运行作业：

查询状态：

MaxCompute生态圈

MaxCompute计算集群分布

Logview分析

优化例子

后续

热门内容

全站热门评论

关于作者

作者的专辑

作者的其它热门文章

热门资讯

热门软件

OSCHINA 社区

在线工具

攻略

QQ群

公众号

视频号

阿里云大数据MaxCompute计算资源分布以及LogView分析优化

MaxCompute(原ODPS）的概念

优势

应用场景

MaxCompute（原ODPS）的架构

MaxCompute处理流程

提交作业:

运行作业：

查询状态：

MaxCompute生态圈

MaxCompute计算集群分布

Logview分析

优化例子

后续

热门内容

全站热门评论

关于作者

作者的专辑

作者的其它热门文章

热门资讯

推荐关注

热门软件

OSCHINA 社区

在线工具

攻略

QQ群

公众号

视频号