博客

考试 DP-100:在 Azure 上设计和实施数据科学解决方案

Exam DP-100, Azure Data Scientist Associate
December 23, 2018
4 分钟阅读
Amit K

本文将为您详细介绍 DP-100 考试的方方面面。在深入了解考试内容之前,首先需要明确该考试的目的。

为什么选择 Azure 上的数据科学?

如今,数据被视为最重要的资产,许多大型企业都依赖于数据。这些数据涵盖产品、服务、客户以及一切相关信息。IT 行业积极参与各种与数据相关的活动。在 IT(信息技术)或其他任何行业中,一些技术流派在数据管理和使用方面处于领先地位。机器学习、人工智能和数据科学只是其中的几个例子。企业、组织或云服务器提供商,例如微软、谷歌、亚马逊等,都在使用数据科学。

因此,数据科学的价值和重要性显而易见。这些组织需要数据科学专家来维护、存储和使用可配置数据,从而为组织带来潜在优势。他们聘请数据科学家,并支付丰厚的薪酬来满足这一需求。疫情爆发后,运营和管理方面发生了翻天覆地的变化。每个组织都已转型为集中式基础设施、云计算和按需计算,并迁移到云端。

Azure 也是业界最佳云服务之一。成为一名熟练的 Azure 数据专家有一条清晰的途径。通过获得 Microsoft Azure 数据科学助理认证,即可成为一名认证的数据科学专业人士。该认证在全球范围内获得认可,并持续受到该领域新手的关注。

Microsoft 认证:Azure 数据科学家助理

如果您正在寻找一份不仅能提升您的简历竞争力,还能帮助您进入任何知名企业的认证,那么您需要了解我们之前已经介绍过的行业对数据科学的需求。

让我们来了解一下数据科学是如何运作的。

企业从各种来源收集数据,包括内部工具、程序、应用程序、搜索引擎、浏览器和机器以及社交媒体。对于任何希望增加收入的企业来说,这些收集到的数据都是宝贵的财富。公司的各个团队或部门都会利用这些数据来改进组织运营。数据科学家在开发模型和获取解决方案的过程中可能会遇到困难。Azure 通过协助将关键数据传输到数据湖来解决这个问题,之后可以使用 Azure 技术(例如 Spark 池、数据清洗、模型开发和处理以及数据分析)来更改整个数据库。

Azure 数据科学家的收入是多少?

虽然没有一个具体的参数可以衡量一个人的潜在收入,但这些数据来自各种调查或一些招聘网站上公布的薪资信息。

您的薪酬将取决于您所在公司的规模和类型、他们愿意投入的资金以及其他一些因素。它还取决于您的专业知识、经验、职业发展以及您对收入的重视程度。

让我们来看一些统计数据。根据 Glassdoor 的数据,数据科学家的平均年收入为 112,000 美元。Indeed 的数据显示平均年薪为 120,000 美元,而 PayScale 的平均年薪为 95,000 美元。这些数据可能并不准确,但您可以从中大致了解您的收入水平。

如何获得微软认证:Azure 数据科学家助理?

只需通过考试即可获得此证书。如果您有足够的动力获得此证书并付诸行动,您只需通过 DP-100 考试即可。此考试涵盖了在 Azure 上设计和实施数据科学解决方案的内容。除了考试之外,如果您充满热情,渴望通过成为数据科学专业人士来改变自己的人生,那么您也可以获得此证书。

什么是 Azure DP-100 考试?

Azure DP-100 考试简称“在 Azure 上设计和实施数据科学解决方案”。对数据科学真正感兴趣的考生均可参加此考试。考生在备考过程中将学习 Azure 的各种实用功能。在备考过程中,您将学习如何执行与 Azure 数据科学相关的所有任务和活动。如果您已充分准备所有考试模块,考试内容将包括模型构建、实验跟踪等诸多方面。

DP-100 认证还允许 IT 人员专注于数据科学,尤其是在 Microsoft Azure 上运行机器学习工作负载方面。这包括创建和部署无故障且高效的工作环境以进行数据实验。机器学习 (ML) 模型也在此框架下进行升级、训练和管理。

此考试的主要目的是评估考生的能力。您可以根据以下列出的重要模块的权重百分比进行准备:

• 管理 Azure 中的机器学习资源 (25–30%)

• 进行实验和模型训练 (20–25%)

• 开发和实施机器学习解决方案 (35–40%)

• 负责任地使用机器学习 (5–10%)

DP-100 的先决条件是什么?

任何对数据科学职业感兴趣的人都应该具备相关学科的先验知识,例如计算机科学、信息技术或任何其他相关领域。对 R 软件设计有全面了解的人也会有额外的优势。微软建议,拥有 Azure 使用经验的人更容易获得资格认证。

任何组织都倾向于选择沟通能力强、善于团队合作的候选人。数据科学家助理将成为多个专业团队的成员,负责处理所有涉及伦理、保密和权限的问题。因此,在选择这份工作之前,请确保您已充分掌握这些技能。如果您想在这个领域取得成功,就必须提升您的软技能。

关于 DP-100 考试模式

该考试包含 60 至 80 道题,考试时间为 180 分钟。题型包括单选题、多选题等。考试中还会包含实验题或案例分析题,以评估您在这些主题方面的实际应用能力。由于这是一项监考考试,因此需要充分准备。考试注册费为 165 美元。您可以选择任何语言参加考试,时间灵活。可选语言包括英语、日语、简体中文、韩语、德语、繁体中文、法语、西班牙语、巴西葡萄牙语、俄语、沙特阿拉伯阿拉伯语、意大利语、印尼语等。

您可以根据自身情况安排考试时间。建议您在充分准备后参加考试。考试合格分数线为 700 分(满分 100 分)。考试失败不必过于沮丧,您可以在 24 小时后再次参加考试。

如果您希望开启或拓展您的职业生涯,DP-100 Azure 数据科学家助理认证是您迈向理想工作的第一步。在IT行业中,精通数据科学工具和应用程序的专家可以通过此认证提升技能,并将这些系统和应用程序应用于其他类似领域。

DP-100考试大纲详解

如前所述,考试涵盖四个主要模块,每个模块包含多个子主题。以下将详细介绍每个模块及其所有子主题。

管理用于机器学习的Azure资源(占25-30%)。创建 Azure 机器学习工作区

  • 创建 Azure 机器学习工作区

  • 配置工作区设置

  • 使用 Azure 机器学习工作室管理工作区

管理 Azure 机器学习工作区中的数据

  • 选择 Azure 存储资源

  • 注册和维护数据存储

  • 创建和管理数据集

管理 Azure 机器学习中实验所需的计算资源

  • 确定训练工作负载的适当计算规范

  • 计算实验和训练的目标

  • 配置附加计算资源,包括 Azure Databricks

  • 监控计算利用率

在 Azure 机器学习中实施安全性和访问控制

  • 确定访问要求并将要求映射到内置角色

  • 创建自定义角色

  • 管理角色成员身份

  • 使用 Azure Key Vault 管理凭据

设置 Azure 机器学习开发环境

  • 创建计算实例

  • 共享计算实例

  • 从其他开发环境访问 Azure 机器学习工作区

设置 Azure Databricks 工作区

  • 创建 Azure Databricks 工作区

  • 创建 Azure Databricks 群集

  • 在 Azure 中创建和运行笔记本Databricks

  • 将 Azure Databricks 工作区链接到 Azure 机器学习工作区

运行实验和训练模型 (20-25%)

使用 Azure 机器学习设计器创建模型

  • 使用 Azure 机器学习设计器创建训练管道

  • 在设计器管道中引入数据

  • 使用设计器模块定义管道数据流

  • 在设计器中使用自定义代码模块

运行模型训练脚本

  • 使用 Azure 机器学习 SDK 创建并运行实验

  • 配置脚本的运行设置

  • 使用 Azure 机器学习 SDK 从实验中的数据集使用数据

  • 在 Azure Databricks 上运行训练脚本进行计算

  • 在 Azure Databricks 笔记本中运行代码以训练模型

从实验运行生成指标

  • 记录实验运行的指标

  • 检索和查看实验输出

  • 使用日志排查实验运行错误

  • 使用 MLflow 跟踪实验

  • 跟踪在 Azure Databricks 中运行的实验

使用自动化机器学习创建最佳模型

  • 使用 Azure 机器学习中的自动化机器学习界面工作室

  • 使用 Azure 机器学习 SDK 中的自动化机器学习

  • 选择预处理选项

  • 选择要搜索的算法

  • 定义主要指标

  • 获取自动化机器学习运行的数据

  • 检索最佳模型

使用 Azure 机器学习调整超参数

  • 选择采样方法

  • 定义搜索空间

  • 定义主要指标

  • 定义提前终止选项

  • 查找具有最佳超参数值的模型

C. 部署和运行机器学习解决方案 (35-40%)

选择用于模型部署的计算资源

  • 考虑已部署服务的安全性

  • 评估部署的计算选项

将模型部署为服务

  • 配置部署设置

  • 部署已注册的模型

  • 将 Azure Databricks 中训练的模型部署到 Azure 机器学习终结点

  • 使用已部署的服务

  • 排查部署容器问题

在 Azure 机器学习中管理模型

  • 注册已训练的模型

  • 监控模型使用情况

  • 监控数据漂移

创建用于批量推理的 Azure 机器学习管道

-配置 ParallelRunStep

  • 配置批处理推理管道的计算资源

  • 发布批处理推理管道

  • 运行批处理推理管道并获取输出

  • 从 ParallelRunStep 获取输出

将 Azure 机器学习设计器管道发布为 Web 服务

  • 创建目标计算资源

  • 配置推理管道

  • 使用已部署的终结点

使用 Azure 机器学习 SDK 实现管道

  • 创建管道

  • 在管道的各个步骤之间传递数据

  • 运行管道

  • 监视管道运行

实施负责任的机器学习 (5-10%)

使用模型解释器解释模型

  • 选择模型解释器

  • 生成特征重要性数据

描述模型的公平性考虑因素

  • 基于预测差异评估模型的公平性

  • 缓解模型不公平性

描述数据的隐私考虑因素

  • 描述差分隐私原则

  • 指定数据中可接受的噪声水平及其对隐私的影响

应用机器学习运维实践

  • 从 Azure 触发 Azure 机器学习管道DevOps

  • 根据新增数据或数据变更自动重新训练模型

  • 将笔记本重构为脚本

  • 为脚本实施源代码控制

为了确保您顺利通过 Microsoft Azure 数据科学解决方案规划与开发认证考试,我们建议您:

· 参加认证培训课程

· 完成练习题

· 积累实践经验

· 选择模拟考试

模拟考试的优势

即使您对自己的知识水平或考试能力有所怀疑,模拟考试也能帮助您确保成功。

DP-100 考试技巧

  1. 由于考试模式每年更新两次,建议您查看最新的考试模式。

  2. 如果您在参加考试前熟悉考试结构,就能更好地做好准备。您将了解考试题型以及如何分配时间。

  3. 制定计划,合理安排时间,并确保涵盖考试涉及的所有主题。您还需要回答有关指定部署和计算目标的问题。

  • 您应该做好充分准备,以回答理论和实验相关的问题。

  • 微软提供理论考试模板,请务必仔细阅读。

  • “使用 Azure 机器学习构建和运行机器学习系统”是考试的主要领域之一,因此请合理安排时间学习此主题。

  • 由于复习对任何考试都至关重要,建议您在参加本次考试前复习理论部分。

如果您需要在规定时间内涵盖所有主题,可以采取以下步骤。这些准备步骤也适用于微软的其他认证考试。

收集所需信息:

与其浏览各种来源的零散博客或文章,不如从微软官方网站收集所有考试所需信息。对于 DP-100 考试的准备而言,没有什么比这更值得信赖的了。您将找到一份详尽的考试大纲,其中解释了考试将涵盖哪些领域,并列出了每个领域需要掌握的具体知识点。

从可靠的资源(例如 Microsoft 论坛和学习指南)开始学习:

Microsoft 提供超过 3000 个学习课程,涵盖 DP-100 考试所需的所有技能,并涉及各种潜在应用。您也可以参加 Koenig DP-100 培训课程,获得所有这些工具以及经验丰富的导师指导。课程提供交互式实验室和一对一私人培训,帮助您更深入地掌握学习材料。

利用案例研究、真实事件和用例进行学习:

DP-100 资格考试旨在评估考生对不同 Microsoft Azure 工作负载的了解。这要求考生对 Azure 有透彻的理解,包括其理论基础和实际应用。您应该能够描述所有可用的 Azure 产品及其在公司中的应用方式。只要有充分的监督和指导学习,这不应该成为阻碍。这正是参加 Koenig 考试准备课程的另一个理由。4. 尽可能多地进行模拟测试:了解考试模式有助于你为即将到来的考试做好准备。你不仅要理解题目,还要理解考试环境所需的视角。这也有助于你确定哪些领域需要额外关注,以便你真正将更多资源投入到这些领域。

尽可能多地复习

你练习或重复任何技能的次数越多,你的熟练程度就越高。如果你遵循以上步骤,没有人能阻止你以优异的成绩通过考试。微软认证 Azure 数据科学家助理级认证是中级数据科学家的标准认证。它需要时间和精力来准备,但绝对值得付出。这将为你未来的职业发展做好准备,提高你的收入潜力,并提供必要的技术知识和技能。立即报名参加培训课程,迈出第一步。

我们是满足您所有需求的一站式解决方案,并根据个人想要获得的教育资格和认证为他们提供灵活和定制的服务。

版权所有 © 2024 - 保留所有权利。