無料ダウンロードMicrosoft DP-600日本語リアル試験問題ゲットせよ [Q48-Q68]

Share

無料ダウンロードMicrosoft DP-600日本語リアル試験問題ゲットせよ

最新のMicrosoft DP-600日本語リアル試験問題集PDF

質問 # 48
Lakehouse1 という名前のレイクハウスを含む Fabric テナントがあります。 Lakehouse1 には、Nyctaxi_raw という名前のテーブルが含まれています。 Nyctaxi_raw には次の列が含まれます。

Fabric ノートブックを作成し、lakehouse1 にアタッチします。
データを変換するには PySpark コードを使用する必要があります。ソリューションは次の要件を満たす必要があります。
* pickupDateTime の日付部分のみを含む、pickupDate という名前の列を追加します。
* DataFrame をフィルターして、fareAmount が 100 未満の正の数である行のみを含めます。
コードをどのように完成させるべきでしょうか?回答するには、回答領域で適切なオプションを選択してください。注: 正しく選択するたびに 1 ポイントの価値があります。

正解:

解説:

Explanation:

* Add the pickupDate column: .withColumn("pickupDate", df["pickupDateTime"].cast("date"))
* Filter the DataFrame: .filter("fareAmount > 0 AND fareAmount < 100")
In PySpark, you can add a new column to a DataFrame using the .withColumn method, where the first argument is the new column name and the second argument is the expression to generate the content of the new column. Here, we use the .cast("date") function to extract only the date part from a timestamp. To filter the DataFrame, you use the .filter method with a condition that selects rows where fareAmount is greater than 0 and less than 100, thus ensuring only positive values less than 100 are included.


質問 # 49
Fabric テナントがあります。
Fabric Data Factory パイプラインを作成しています。
アクティブ顧客の数と現在の月の平均売上を返すストアド プロシージャがあります。
ウェアハウスでストアド プロシージャを実行するアクティビティを追加する必要があります。返された値は、パイプラインの下流のアクティビティで使用できる必要があります。
どのような種類のアクティビティを追加する必要がありますか?

  • A. スイッチ
  • B. 変数を追加
  • C. スクリプト
  • D. データをコピー

正解:C

解説:
In a Fabric Data Factory pipeline, to execute a stored procedure and make the returned values available for downstream activities, the Lookup activity is used. This activity can retrieve a dataset from a data store and pass it on for further processing. Here's how you would use the Lookup activity in this context:
* Add a Lookup activity to your pipeline.
* Configure the Lookup activity to use the stored procedure by providing the necessary SQL statement or stored procedure name.
* In the settings, specify that the activity should use the stored procedure mode.
* Once the stored procedure executes, the Lookup activity will capture the results and make them available in the pipeline's memory.
* Downstream activities can then reference the output of the Lookup activity.
References: The functionality and use of Lookup activity within Azure Data Factory is documented in Microsoft's official documentation for Azure Data Factory, under the section for pipeline activities.


質問 # 50
単一の Fabric ワークスペースにメダリオン アーキテクチャを実装しています。
ブロンズ レイヤーとシルバー レイヤーを含むレイクハウスと、ゴールド レイヤーを含む倉庫があります。
次の表に示すように、レイヤーを設定するために必要な項目を作成します。

シルバーはブロンズが完了した後にのみ、ゴールドはシルバーが完了した後にのみ設定されるなど、レイヤーが毎日順番に設定されることを確認する必要があります。ソリューションは、開発の労力と複雑さを最小限に抑える必要があります。
各項目セットを実行するには何を使用すればよいですか? 回答するには、適切なオプションを正しい項目にドラッグします。各オプションは、1 回、複数回、またはまったく使用しない場合があります。コンテンツを表示するには、ペイン間の分割バーをドラッグするか、スクロールする必要がある場合があります。注: 正しい選択ごとに 1 ポイントの価値があります。

正解:

解説:


質問 # 51
デフォルトの Spark スターター プールとランタイム バージョン 1、2 を使用する Fabric ワークスペースがあります。
レイクハウス内の Sales.raw.csv という CSV ファイルを読み取り、列を選択して、データを Delta テーブルとしてレイクハウスの管理領域に保存する予定です。Sales_raw.csv には 12 列が含まれています。
次のコードがあります。

次の各ステートメントについて、そのステートメントが true の場合は [はい] を選択します。それ以外の場合は、「いいえ」を選択します。 注: 正しく選択するたびに 1 ポイントの価値があります。

正解:

解説:

Explanation:

* The Spark engine will read only the 'SalesOrderNumber', 'OrderDate', 'CustomerName', 'UnitPrice' columns from Sales_raw.csv. - Yes
* Removing the partition will reduce the execution time of the query. - No
* Adding inferSchema='true' to the options will increase the execution time of the query. - Yes The code specifies the selection of certain columns, which means only those columns will be read into the DataFrame. Partitions in Spark are a way to optimize the execution of queries by organizing the data into parts that can be processed in parallel. Removing the partition could potentially increase the execution time because Spark would no longer be able to process the data in parallel efficiently. The inferSchema option allows Spark to automatically detect the column data types, which can increase the execution time of the initial read operation because it requires Spark to read through the data to infer the schema.


質問 # 52
OneLake に新しいセマンティック モデルを含む Fabric テナントがあります。
Fabric ノートブックを使用して、データを Spark DataFrame に読み取ります。
データを評価して、すべての文字列列と数値列の最小値、最大値、平均値、標準偏差の値を計算する必要があります。
解決策: 次の PySpark 式を使用します。
df.show()
これは目標を達成していますか?

  • A. いいえ
  • B. はい

正解:A

解説:
The df.show() method also does not meet the goal. It is used to show the contents of the DataFrame, not to compute statistical functions. References = The usage of the show() function is documented in the PySpark API documentation.


質問 # 53
Microsoft Power Bl セマンティック モデルがあります。
計算グループを実装する予定です。
コンテキストを選択した日付から月累計 (MTD) に変更する計算アイテムを作成する必要があります。
DAX 式をどのように完成させるべきでしょうか?回答するには、回答領域で適切なオプションを選択してください。
注: 正しく選択するたびに 1 ポイントの価値があります。

正解:

解説:

Explanation:

To create a calculation item that changes the context from the selected date to month-to-date (MTD), the appropriate DAX expression involves using the CALCULATE function to alter the filter context and the DATESMTD function to specify the month-to-date context.
The correct completion for the DAX expression would be:
* In the first dropdown, select CALCULATE.
* In the second dropdown, select SELECTEDMEASURE.
This would create a DAX expression in the form:
CALCULATE(
SELECTEDMEASURE(),
DATESMTD('Date'[DateColumn])
)


質問 # 54
Lakehouse1 という名前のレイクハウスを含むファブリック テナントがあります。
100 台の loT デバイスからの読み取り値が Lakehouse1 のデルタ テーブルに追加されます。読み取り値の各セットは約 25 KB です。毎日約 10 GB のデータを受信します。
すべてのテーブルと SparkSession の設定はデフォルトに設定されます。
クエリの実行が遅いことがわかりました。さらに、レイクハウスのストレージには、使用されなくなったデータ ファイルとログ ファイルが含まれています。
使用されなくなったファイルを削除し、小さなファイルを 1 ファイルあたり 1 GB の目標サイズで大きなファイルに結合する必要があります。
あなたは何をするべきか?答えるには、適切なアクションを正しい要件にドラッグします。各アクションは、1 回だけ使用することも、複数回使用することも、まったく使用しないこともできます。コンテンツを表示するには、ペイン間で分割バーをドラッグするか、スクロールする必要がある場合があります。
注: 正しく選択するたびに 1 ポイントの価値があります。

正解:

解説:


質問 # 55
Lakehouse1 という名前のレイクハウスを含む Fabric テナントがあります。 Lakehouse1 には、CSV ファイルを含む Subfolder1 という名前のサブフォルダーが含まれています。 CSV ファイルを、V-Order 最適化が有効になっているデルタ形式に変換する必要があります。 Lakehouse エクスプローラーから何をすればよいですか?

  • A. テーブルへのロード機能を使用します。
  • B. [テーブル] セクションに新しいショートカットを作成します。
  • C. [ファイル] セクションに新しいショートカットを作成します。
  • D. 最適化機能を使用します。

正解:A

解説:
To convert CSV files into the delta format with Z-Order optimization enabled, you should use the Optimize feature (D) from Lakehouse Explorer. This will allow you to optimize the file organization for the most efficient querying. References = The process for converting and optimizing file formats within a lakehouse is discussed in the lakehouse management documentation.


質問 # 56
bucketl という名前の Amazon Simple Storage Service (Amazon S3) バケットを含む Amazon Web Services (AWS) サブスクリプションがあります。
LH1 という名前のレイクハウスを含む Fabric テナントがあります。
LH1 では、bucketl への OneLake ショートカットを作成する予定です。
接続の認証を設定する必要があります。
どの 2 つの値を指定する必要がありますか? それぞれの正解はソリューションの一部を示します。
注意: 正しい選択ごとに 1 ポイントが付与されます。

  • A. 共有アクセス署名 (SAS) トークン
  • B. アクセスキーID
  • C. アクセスID
  • D. 秘密アクセスキー
  • E. 証明書の拇印

正解:B、D


質問 # 57
倉庫を含む Fabric テナントがあります。
ユーザーは、通常は表示に 2 分かかるレポートが 45 分間実行されているのにまだ表示されていないことに気づきました。
レポート クエリの完了を妨げている原因を特定する必要があります。
どの動的管理ビュー (DMV) を使用する必要がありますか?

  • A. sys.dm-exec_requests
  • B. sys.dm._exec._connections
  • C. sys.dn_.exec._sessions
  • D. sys.dm_pdw_exec_requests

正解:D

解説:
The correct DMV to identify what is preventing the report query from completing is sys.dm_pdw_exec_requests (D). This DMV is specific to Microsoft Analytics Platform System (previously known as SQL Data Warehouse), which is the environment assumed to be used here. It provides information about all queries and load commands currently running or that have recently run. Reference = You can find more about DMVs in the Microsoft documentation for Analytics Platform System.


質問 # 58
lakehouse1 という名前のレイクハウスを含むファブリック テナントがあります。 Lakehouse1 には Table1 という名前のテーブルが含まれています。
新しいデータ パイプラインを作成しています。
外部データを Table1 にコピーする予定です。外部データのスキーマは定期的に変更されます。
次の要件を満たすためにコピー操作が必要です。
* Table1 を外部データのスキーマに置き換えます。
* Table1 のすべてのデータを外部データの行に置き換えます。
データのコピー アクティビティをパイプラインに追加します。データのコピー アクティビティでは何をする必要がありますか?

  • A. [宛先] タブで、テーブル アクションを [上書き] に設定します。
  • B. [設定] タブから、[ステージングを有効にする] を選択します。
  • C. [ソース] タブから列を追加します。
  • D. [ソース] タブから、[パーティション検出を有効にする] を選択します。
  • E. 「ソース」タブから「再帰的に」を選択します。

正解:A

解説:
For the Copy data activity, from the Destination tab, setting Table action to Overwrite (B) will ensure that Table1 is replaced with the schema and rows of the external data, meeting the requirements of replacing both the schema and data of the destination table. Reference = Information about Copy data activity and table actions in Azure Data Factory, which can be applied to data pipelines in Fabric, is available in the Azure Data Factory documentation.


質問 # 59
セマンティック モデルを含むファブリック テナントがあります。このモデルは Direct Lake モードを使用します。
一部の DAX クエリが不要な列をメモリに読み込む可能性があります。
メモリにロードされる、頻繁に使用される列を特定する必要があります。
目標を達成するための 2 つの方法は何ですか?それぞれの正解は完全な解決策を示します。
注: 各正解は 1 ポイントの価値があります。

  • A. Vertipaq Analyzer ツールを使用します。
  • B. Excel での分析機能を使用します。
  • C. $system.discovered_STORAGE_TABLE_COLUMN-iN_SEGMeNTS 動的管理ビュー (DMV) をクエリします。
  • D. Discover_hehory6Rant 動的管理ビュー (DMV) をクエリします。

正解:A、C

解説:
The Vertipaq Analyzer tool (B) and querying the
$system.discovered_STORAGE_TABLE_COLUMNS_IN_SEGMENTS dynamic management view (DMV) (C) can help identify which columns are frequently loaded into memory. Both methods provide insights into the storage and retrieval aspects of the semantic model. References = The Power BI documentation on Vertipaq Analyzer and DMV queries offers detailed guidance on how to use these tools for performance analysis.


質問 # 60
Lakehouse1 という名前のレイクハウスを含む Fabric テナントがあります。
Lakehouse1 に追加された新しいテーブルが、Lakehouse のデフォルトのセマンティック モデルに自動的に追加されないようにする必要があります。
何を設定すればよいでしょうか? (5)

  • A. Lakehouse1 の設定
  • B. SQL 分析エンドポイント設定
  • C. セマンティック モデルの設定
  • D. ワークスペースの設定

正解:C

解説:
To prevent new tables added to Lakehouse1 from being automatically added to the default semantic model, you should configure the semantic model settings. There should be an option within the settings of the semantic model to include or exclude new tables by default. By adjusting these settings, you can control the automatic inclusion of new tables.
References: The management of semantic models and their settings would be covered under the documentation for the semantic layer or modeling features of the Fabric tenant's lakehouse solution.


質問 # 61
OneLake に 30 個の CSV ファイルを含む Fabric テナントがあります。ファイルは毎日更新されます。
CSV ファイルをデータ ソースとして使用する Modell という名前の Microsoft Power Bl セマンティック モデルを作成します。モデル 1 の増分更新を構成し、そのモデルをファブリック テナントのプレミアム容量に公開します。
Model1 の更新を開始すると、リソースが不足すると更新が失敗します。
失敗の考えられる原因は何ですか?

  • A. XMLA エンドポイントは読み取り専用に設定されています。
  • B. 更新完了日のみが選択されています。
  • C. クエリの折りたたみが発生しています。
  • D. データのパーティション化に使用される列のデータ型が変更されました。
  • E. クエリの折りたたみは発生していません。

正解:E

解説:
A possible cause for the failure is that query folding is NOT occurring (D). Query folding helps optimize refresh by pushing down the query logic to the source system, reducing the amount of data processed and transferred, hence conserving resources. Reference = The Power BI documentation on incremental refresh and query folding provides detailed information on this topic.


質問 # 62
倉庫を含む Fabric テナントがあります。
顧客ディメンションを含むスター スキーマ モデルを設計しています。顧客ディメンション テーブルは、タイプ 2 のゆっくりと変化するディメンション (SCD) になります。
テーブルに追加する列を推奨する必要があります。列はソース内にすでに存在していてはなりません。
どの 3 種類のカラムをお勧めしますか?それぞれの正解は、解決策の一部を示しています。
注: 各正解は 1 ポイントの価値があります。

  • A. 有効な終了日時
  • B. 代理キー
  • C. 有効な開始日時
  • D. 外部キー
  • E. 自然キー

正解:A、B、C

解説:
For a Type 2 slowly changing dimension (SCD), you typically need to add the following types of columns that do not exist in the source system:
* An effective start date and time (E): This column records the date and time from which the data in the row is effective.
* An effective end date and time (A): This column indicates until when the data in the row was effective.
It allows you to keep historical records for changes over time.
* A surrogate key (C): A surrogate key is a unique identifier for each row in a table, which is necessary for Type 2 SCDs to differentiate between historical and current records.
References: Best practices for designing slowly changing dimensions in data warehousing solutions, which include Type 2 SCDs, are commonly discussed in data warehousing and business intelligence literature and would be part of the modeling guidance in a Fabric tenant's documentation.


質問 # 63
Fabric テナントがあります。
Fabric Data Factory パイプラインを作成しています。
アクティブ顧客の数と現在の月の平均売上を返すストアド プロシージャがあります。
ウェアハウスでストアド プロシージャを実行するアクティビティを追加する必要があります。返された値は、パイプラインの下流のアクティビティで使用できる必要があります。
どのような種類のアクティビティを追加する必要がありますか?

  • A. スイッチ
  • B. 変数を追加
  • C. スクリプト
  • D. データをコピー

正解:C


質問 # 64
storage! という名前の Azure Data Lake Storage Gen2 アカウントがあり、そこには sales.parquet という名前の Parquet ファイルが含まれています。
Workspace1 という名前のワークスペースを含む Fabric テナントがあります。
Workspace1 のノートブックを使用して、ファイルの内容をデフォルトのレイクハウスにロードする必要があります。ソリューションでは、コンテンツが Lakehouse エクスプローラーに Sales という名前のテーブルとして自動的に表示されるようにする必要があります。
コードをどのように完成させるべきですか? 回答するには、回答エリアで適切なオプションを選択してください。
注意: 正しい選択ごとに 1 ポイントが付与されます。

正解:

解説:

Topic 2, Contoso, ltd.
Overview
Contoso, ltd. is a US-based health supplements company, Contoso has two divisions named Sales and Research. The Sales division contains two departments named Online Sales and Retail Sales. The Research division assigns internally developed product lines to individual teams of researchers and analysts.
Identity Environment
Contoso has a Microsoft Entra tenant named contoso.com. The tenant contains two groups named ResearchReviewersGroupi and ReseachReviewefsGfoup2.
Data Environment
Contoso has the following data environment
* The Sales division uses a Microsoft Power B1 Premium capacity.
* The semantic model of the Online Sales department includes a fact table named Orders that uses import mode. In the system of origin, the OrderlD value represents the sequence in which orders are created.
* The Research department uses an on-premises. third-party data warehousing product.
* Fabric is enabled for contoso.com.
* An Azure Data Lake Storage Gen2 storage account named storage1 contains Research division data for a product line named Producthne1. The data is in the delta format.
* A Data Lake Storage Gen2 storage account named storage2 contains Research division data for a product line named Productline2. The data is in the CSV format.
Planned Changes
Contoso plans to make the following changes:
* Enable support for Fabric in the Power Bl Premium capacity used by the Sales division.
* Make all the data for the Sales division and the Research division available in Fabric.
* For the Research division, create two Fabric workspaces named Producttmelws and Productline2ws.
* in Productlinelws. create a lakehouse named LakehouseV
* In Lakehouse1. create a shortcut to storage1 named ResearchProduct.
Data Analytics Requirements
Contoso identifies the following data analytics requirements:
* All the workspaces for the Sales division and the Research division must support all Fabric experiences.
* The Research division workspaces must use a dedicated, on-demand capacity that has per-minute billing.
* The Research division workspaces must be grouped together logically to support OneLake data hub filtering based on the department name.
* For the Research division workspaces, the members of ResearchRevtewersGroupl must be able to read lakehouse and warehouse data and shortcuts by using SQL endpoints.
* For the Research division workspaces, the members of ResearchReviewersGroup2 must be able to read lakehouse data by using Lakehouse explorer.
* All the semantic models and reports for the Research division must use version control that supports branching Data Preparation Requirements Contoso identifies the following data preparation requirements:
* The Research division data for Producthne2 must be retrieved from Lakehouset by using Fabric notebooks.
* All the Research division data in the lakehouses must be presented as managed tables in Lakehouse explorer.
Semantic Model Requirements
Contoso identifies the following requirements for implementing and managing semantic models;
* The number of rows added to the Orders table during refreshes must be minimized.
* The semantic models in the Research division workspaces must use Direct Lake mode.
General Requirements
Contoso identifies the following high-level requirements that must be considered for all solutions:
* Follow the principle of least privilege when applicable
* Minimize implementation and maintenance effort when possible.


質問 # 65
Lakehousel という名前のレイクハウスを含むファブリック テナントがあります。 Lakehousel には 8 つの列を持つデルタ テーブルが含まれています。同じ 8 列と追加の 2 列を含む新しいデータを受け取ります。
Spark DataFrame を作成し、その DataFrame を df という名前の変数に割り当てます。 DataFrame には新しいデータが含まれています。次の要件を満たすために、新しいデータをデルタ テーブルに追加する必要があります。
* 既存の行はすべて保持します。
* すべての新しいデータがテーブルに追加されていることを確認してください。
コードをどのように完成させるべきでしょうか?回答するには、回答領域で適切なオプションを選択してください。

正解:

解説:

Explanation:

o add new data to the Delta table while meeting the specified requirements:
* You should use the append mode to ensure that all new data is added to the table without affecting the existing rows.
* You should set the mergeSchema option to true to allow the schema of the Delta table to be updated with the new columns found in the DataFrame.
The completed code would look like this:
df.write.format("delta").mode("append")
option("mergeSchema", "true")
saveAsTable("Lakehouse1.TableName")


質問 # 66
単一のファブリック ワークスペースにメダリオン アーキテクチャを実装しています。
8ronze 層と Silver 層を含む湖畔の家と、Gold 層を含む倉庫があります。
次の表に示すように、レイヤーを設定するために必要な項目を作成します。

シルバーはブロンズが完了した後にのみ設定され、ゴールドはシルバーが完了した後にのみ設定されるように、レイヤーが毎日順番に設定されるようにする必要があります。ソリューションでは、開発の労力と複雑さを最小限に抑える必要があります。
各項目セットを実行するには何を使用する必要がありますか?答えるには、適切なオプションを正しい項目にドラッグします。各オプションは 1 回使用することも、複数回使用することも、まったく使用しないこともできます。コンテンツを表示するには、ペイン間で分割バーをドラッグするか、スクロールする必要がある場合があります。 注: 正しく選択するたびに 1 ポイントの価値があります。

正解:

解説:

Explanation:
To execute each set of items in sequential order with minimized development effort and complexity, you should use the following options:
* Orchestration pipeline: Use a pipeline with an Invoke pipeline activity. This allows for orchestrating and scheduling the execution of other pipelines, ensuring they run in the correct sequence.
* Bronze layer: Implement a pipeline Copy activity. This aligns with the table indicating that the Bronze layer uses pipelines with Copy activities for data integration.
* Silver layer: Implement a pipeline Dataflow activity. The table specifies that Dataflows are used for the Silver layer.
* Gold layer: Implement a pipeline Stored procedure activity. Stored procedures are specified for the Gold layer according to the table.


質問 # 67
Power Bl 開発者にパイプラインへのアクセスを提供する必要があります。ソリューションは次の要件を満たす必要があります。
* 開発者が開発およびテスト用のワークスペースにアイテムをデプロイできることを確認します。
* 開発者が本番環境のワークスペースにアイテムをデプロイできないようにします。
* 最小特権の原則に従います。
開発者に割り当てるべき 3 つのアクセス レベルはどれですか?それぞれの正解は、解決策の一部を示しています。注: 各正解は 1 ポイントの価値があります。

  • A. 実稼働ワークスペースへの共同作成者アクセス
  • B. デプロイメント パイプラインへの管理者アクセス
  • C. 運用セマンティック モデルへのビルド権限
  • D. 運用ワークスペースへの閲覧者アクセス
  • E. 開発およびテスト ワークスペースへの閲覧者アクセス
  • F. 開発およびテスト ワークスペースへの共同作成者アクセス

正解:B、D、F

解説:
To meet the requirements, developers should have Admin access to the deployment pipeline (B), Contributor access to the Development and Test workspaces (E), and Viewer access to the Production workspace (D). This setup ensures they can perform necessary actions in development and test environments without having the ability to affect production. Reference = The Power BI documentation on workspace access levels and deployment pipelines provides guidelines on assigning appropriate permissions.


質問 # 68
......

PDF問題(2025年最新)実際のMicrosoft DP-600日本語試験問題:https://www.passtest.jp/Microsoft/DP-600J-shiken.html