Commit 163ba8a

authored

Enforce new ingestion reason for spark traces (DataDog#6310)

Enforce new ingestion reason for spark traces # Motivation It is critical to keep all spark traces as customers closely monitor job runs. The new ingestion reason will allow tracking of ingested bytes for billing # Additional Notes Added the method AgentSpan setSamplingPriority(final int newPriority, int samplingMechanism) in the AgentSpan interface so that it can be called from an instrumentation

1 parent 00358aa commit 163ba8aCopy full SHA for 163ba8a

File tree

8 files changed

+51

-1

lines changed

dd-java-agent/instrumentation/spark/src
- main/java/datadog/trace/instrumentation/spark
  - AbstractDatadogSparkListener.java
  - DatabricksParentContext.java
- testFixtures/groovy/datadog/trace/instrumentation/spark
  - AbstractSparkStructuredStreamingTest.groovy
  - AbstractSparkTest.groovy
internal-api/src
- main/java/datadog/trace
  - api/sampling
    - SamplingMechanism.java
  - bootstrap/instrumentation/api
    - AgentSpan.java
    - AgentTracer.java
- test/groovy/datadog/trace/api/sampling
  - SamplingMechanismTest.groovy

8 files changed

+51

-1

lines changed

`‎dd-java-agent/instrumentation/spark/src/main/java/datadog/trace/instrumentation/spark/AbstractDatadogSparkListener.java`

Lines changed: 12 additions & 0 deletions

Original file line number	Diff line number	Diff line change
`@@ -5,6 +5,8 @@`
`5`	`5`	`import datadog.trace.api.Config;`
`6`	`6`	`import datadog.trace.api.DDTags;`
`7`	`7`	`import datadog.trace.api.DDTraceId;`
	`8`	`+import datadog.trace.api.sampling.PrioritySampling;`
	`9`	`+import datadog.trace.api.sampling.SamplingMechanism;`
`8`	`10`	`import datadog.trace.bootstrap.instrumentation.api.AgentSpan;`
`9`	`11`	`import datadog.trace.bootstrap.instrumentation.api.AgentTracer;`
`10`	`12`	`import de.thetaphi.forbiddenapis.SuppressForbidden;`
`@@ -135,6 +137,7 @@ private void initApplicationSpanIfNotInitialized() {`
`135`	`137`	`captureApplicationParameters(builder);`
`136`	`138`
`137`	`139`	`applicationSpan = builder.start();`
	`140`	`+ setDataJobsSamplingPriority(applicationSpan);`
`138`	`141`	`applicationSpan.setMeasured(true);`
`139`	`142`	`}`
`140`	`143`
`@@ -203,6 +206,7 @@ private AgentSpan getOrCreateStreamingBatchSpan(`
`203`	`206`	`}`
`204`	`207`
`205`	`208`	`batchSpan = builder.start();`
	`209`	`+ setDataJobsSamplingPriority(batchSpan);`
`206`	`210`	`streamingBatchSpans.put(batchKey, batchSpan);`
`207`	`211`	`return batchSpan;`
`208`	`212`	`}`
`@@ -267,6 +271,7 @@ private AgentSpan getOrCreateSqlSpan(`
`267`	`271`	`}`
`268`	`272`
`269`	`273`	`AgentSpan sqlSpan = spanBuilder.start();`
	`274`	`+ setDataJobsSamplingPriority(sqlSpan);`
`270`	`275`	`sqlSpans.put(sqlExecutionId, sqlSpan);`
`271`	`276`	`return sqlSpan;`
`272`	`277`	`}`
`@@ -321,6 +326,7 @@ public synchronized void onJobStart(SparkListenerJobStart jobStart) {`
`321`	`326`	`captureJobParameters(jobSpanBuilder, jobStart.properties());`
`322`	`327`
`323`	`328`	`AgentSpan jobSpan = jobSpanBuilder.start();`
	`329`	`+ setDataJobsSamplingPriority(jobSpan);`
`324`	`330`	`jobSpan.setMeasured(true);`
`325`	`331`
`326`	`332`	`for (int stageId : getSparkJobStageIds(jobStart)) {`
`@@ -404,6 +410,7 @@ public synchronized void onStageSubmitted(SparkListenerStageSubmitted stageSubmi`
`404`	`410`	`.withTag(DDTags.RESOURCE_NAME, stageSubmitted.stageInfo().name())`
`405`	`411`	`.start();`
`406`	`412`
	`413`	`+ setDataJobsSamplingPriority(stageSpan);`
`407`	`414`	`stageSpan.setMeasured(true);`
`408`	`415`
`409`	`416`	`stageSpans.put(stageSpanKey(stageId, stageAttemptId), stageSpan);`
`@@ -551,6 +558,7 @@ private void sendTaskSpan(`
`551`	`558`	`taskSpan.setTag("count_towards_task_failures", reason.countTowardsTaskFailures());`
`552`	`559`	`}`
`553`	`560`
	`561`	`+ setDataJobsSamplingPriority(taskSpan);`
`554`	`562`	`taskSpan.finish(taskEnd.taskInfo().finishTime() * 1000);`
`555`	`563`	`}`
`556`	`564`
`@@ -753,6 +761,10 @@ private synchronized void onStreamingQueryProgressEvent(`
`753`	`761`	`}`
`754`	`762`	`}`
`755`	`763`
	`764`	`+ private void setDataJobsSamplingPriority(AgentSpan span) {`
	`765`	`+ span.setSamplingPriority(PrioritySampling.USER_KEEP, SamplingMechanism.DATA_JOBS);`
	`766`	`+ }`
	`767`	`+`
`756`	`768`	`private AgentTracer.SpanBuilder buildSparkSpan(String spanName, Properties properties) {`
`757`	`769`	`AgentTracer.SpanBuilder builder =`
`758`	`770`	`tracer.buildSpan(spanName).withSpanType("spark").withTag("app_id", appId);`

`‎dd-java-agent/instrumentation/spark/src/main/java/datadog/trace/instrumentation/spark/DatabricksParentContext.java`

Lines changed: 1 addition & 1 deletion

Original file line number	Diff line number	Diff line change
`@@ -81,7 +81,7 @@ public AgentTrace getTrace() {`
`81`	`81`
`82`	`82`	`@Override`
`83`	`83`	`public int getSamplingPriority() {`
`84`		`- return PrioritySampling.SAMPLER_KEEP;`
	`84`	`+ return PrioritySampling.UNSET;`
`85`	`85`	`}`
`86`	`86`
`87`	`87`	`@Override`

`‎dd-java-agent/instrumentation/spark/src/testFixtures/groovy/datadog/trace/instrumentation/spark/AbstractSparkStructuredStreamingTest.groovy`

Lines changed: 6 additions & 0 deletions

Original file line number	Diff line number	Diff line change
`@@ -2,6 +2,8 @@ package datadog.trace.instrumentation.spark`
`2`	`2`
`3`	`3`	`import datadog.trace.agent.test.AgentTestRunner`
`4`	`4`	`import datadog.trace.api.Platform`
	`5`	`+import datadog.trace.api.sampling.PrioritySampling`
	`6`	`+import datadog.trace.api.sampling.SamplingMechanism`
`5`	`7`	`import org.apache.spark.sql.Encoders`
`6`	`8`	`import org.apache.spark.sql.execution.streaming.MemoryStream`
`7`	`9`	`import org.apache.spark.sql.SparkSession`
`@@ -69,6 +71,8 @@ class AbstractSparkStructuredStreamingTest extends AgentTestRunner {`
`69`	`71`	`resourceName "test-query"`
`70`	`72`	`spanType "spark"`
`71`	`73`	`parent()`
	`74`	`+ assert span.context().getSamplingPriority() == PrioritySampling.USER_KEEP`
	`75`	`+ assert span.context().getPropagationTags().createTagMap()["_dd.p.dm"] == (-SamplingMechanism.DATA_JOBS).toString()`
`72`	`76`	`tags {`
`73`	`77`	`defaultTags()`
`74`	`78`	`// Streaming tags`
`@@ -174,6 +178,8 @@ class AbstractSparkStructuredStreamingTest extends AgentTestRunner {`
`174`	`178`	`operationName "spark.streaming_batch"`
`175`	`179`	`spanType "spark"`
`176`	`180`	`assert span.tags["streaming_query.batch_id"] == 1`
	`181`	`+ assert span.context().getSamplingPriority() == PrioritySampling.USER_KEEP`
	`182`	`+ assert span.context().getPropagationTags().createTagMap()["_dd.p.dm"] == (-SamplingMechanism.DATA_JOBS).toString()`
`177`	`183`	`parent()`
`178`	`184`	`}`
`179`	`185`	`span {`

`‎dd-java-agent/instrumentation/spark/src/testFixtures/groovy/datadog/trace/instrumentation/spark/AbstractSparkTest.groovy`

Lines changed: 14 additions & 0 deletions

Original file line number	Diff line number	Diff line change
`@@ -4,6 +4,8 @@ import datadog.trace.agent.test.AgentTestRunner`
`4`	`4`	`import datadog.trace.api.DDSpanId`
`5`	`5`	`import datadog.trace.api.DDTraceId`
`6`	`6`	`import datadog.trace.api.Platform`
	`7`	`+import datadog.trace.api.sampling.PrioritySampling`
	`8`	`+import datadog.trace.api.sampling.SamplingMechanism`
`7`	`9`	`import datadog.trace.test.util.Flaky`
`8`	`10`	`import org.apache.hadoop.yarn.api.records.FinalApplicationStatus`
`9`	`11`	`import org.apache.hadoop.yarn.conf.YarnConfiguration`
`@@ -51,6 +53,8 @@ abstract class AbstractSparkTest extends AgentTestRunner {`
`51`	`53`	`resourceName "spark.application"`
`52`	`54`	`spanType "spark"`
`53`	`55`	`errored false`
	`56`	`+ assert span.context().getSamplingPriority() == PrioritySampling.USER_KEEP`
	`57`	`+ assert span.context().getPropagationTags().createTagMap()["_dd.p.dm"] == (-SamplingMechanism.DATA_JOBS).toString()`
`54`	`58`	`parent()`
`55`	`59`	`}`
`56`	`60`	`span {`
`@@ -254,6 +258,8 @@ abstract class AbstractSparkTest extends AgentTestRunner {`
`254`	`258`	`spanType "spark"`
`255`	`259`	`traceId 8944764253919609482G`
`256`	`260`	`parentSpanId 15104224823446433673G`
	`261`	`+ assert span.context().getSamplingPriority() == PrioritySampling.USER_KEEP`
	`262`	`+ assert span.context().getPropagationTags().createTagMap()["_dd.p.dm"] == (-SamplingMechanism.DATA_JOBS).toString()`
`257`	`263`	`assert span.tags["databricks_job_id"] == "1234"`
`258`	`264`	`assert span.tags["databricks_job_run_id"] == "5678"`
`259`	`265`	`assert span.tags["databricks_task_run_id"] == "9012"`
`@@ -275,6 +281,8 @@ abstract class AbstractSparkTest extends AgentTestRunner {`
`275`	`281`	`spanType "spark"`
`276`	`282`	`traceId 5240384461065211484G`
`277`	`283`	`parentSpanId 14128229261586201946G`
	`284`	`+ assert span.context().getSamplingPriority() == PrioritySampling.USER_KEEP`
	`285`	`+ assert span.context().getPropagationTags().createTagMap()["_dd.p.dm"] == (-SamplingMechanism.DATA_JOBS).toString()`
`278`	`286`	`assert span.tags["databricks_job_id"] == "3456"`
`279`	`287`	`assert span.tags["databricks_job_run_id"] == "901"`
`280`	`288`	`assert span.tags["databricks_task_run_id"] == "7890"`
`@@ -296,6 +304,8 @@ abstract class AbstractSparkTest extends AgentTestRunner {`
`296`	`304`	`spanType "spark"`
`297`	`305`	`traceId 2235374731114184741G`
`298`	`306`	`parentSpanId 8956125882166502063G`
	`307`	`+ assert span.context().getSamplingPriority() == PrioritySampling.USER_KEEP`
	`308`	`+ assert span.context().getPropagationTags().createTagMap()["_dd.p.dm"] == (-SamplingMechanism.DATA_JOBS).toString()`
`299`	`309`	`assert span.tags["databricks_job_id"] == "123"`
`300`	`310`	`assert span.tags["databricks_job_run_id"] == "8765"`
`301`	`311`	`assert span.tags["databricks_task_run_id"] == "456"`
`@@ -316,6 +326,8 @@ abstract class AbstractSparkTest extends AgentTestRunner {`
`316`	`326`	`operationName "spark.job"`
`317`	`327`	`spanType "spark"`
`318`	`328`	`parent()`
	`329`	`+ assert span.context().getSamplingPriority() == PrioritySampling.USER_KEEP`
	`330`	`+ assert span.context().getPropagationTags().createTagMap()["_dd.p.dm"] == (-SamplingMechanism.DATA_JOBS).toString()`
`319`	`331`	`assert span.tags["databricks_job_id"] == null`
`320`	`332`	`assert span.tags["databricks_job_run_id"] == "8765"`
`321`	`333`	`assert span.tags["databricks_task_run_id"] == null`
`@@ -429,6 +441,8 @@ abstract class AbstractSparkTest extends AgentTestRunner {`
`429`	`441`	`spanType "spark"`
`430`	`442`	`traceId 8944764253919609482G`
`431`	`443`	`parentSpanId 15104224823446433673G`
	`444`	`+ assert span.context().getSamplingPriority() == PrioritySampling.USER_KEEP`
	`445`	`+ assert span.context().getPropagationTags().createTagMap()["_dd.p.dm"] == (-SamplingMechanism.DATA_JOBS).toString()`
`432`	`446`	`}`
`433`	`447`	`span {`
`434`	`448`	`operationName "spark.job"`

`‎internal-api/src/main/java/datadog/trace/api/sampling/SamplingMechanism.java`

Lines changed: 3 additions & 0 deletions

Original file line number	Diff line number	Diff line change
`@@ -21,6 +21,8 @@ public class SamplingMechanism {`
`21`	`21`	`public static final byte REMOTE_USER_RATE = 6;`
`22`	`22`	`/** Span Sampling Rate (single span sampled on account of a span sampling rule) */`
`23`	`23`	`public static final byte SPAN_SAMPLING_RATE = 8;`
	`24`	`+ /** Data Jobs */`
	`25`	`+ public static final byte DATA_JOBS = 10;`
`24`	`26`	`/** Force override sampling decision from external source, like W3C traceparent. */`
`25`	`27`	`public static final byte EXTERNAL_OVERRIDE = Byte.MIN_VALUE;`
`26`	`28`
`@@ -40,6 +42,7 @@ public static boolean validateWithSamplingPriority(int mechanism, int priority)`
`40`	`42`	`return priority == USER_DROP \|\| priority == USER_KEEP;`
`41`	`43`
`42`	`44`	`case APPSEC:`
	`45`	`+ case DATA_JOBS:`
`43`	`46`	`return priority == PrioritySampling.USER_KEEP;`
`44`	`47`
`45`	`48`	`case EXTERNAL_OVERRIDE:`

`‎internal-api/src/main/java/datadog/trace/bootstrap/instrumentation/api/AgentSpan.java`

Lines changed: 2 additions & 0 deletions

Original file line number	Diff line number	Diff line change
`@@ -135,6 +135,8 @@ public interface AgentSpan extends MutableSpan, IGSpanInfo {`
`135`	`135`
`136`	`136`	`Integer forceSamplingDecision();`
`137`	`137`
	`138`	`+ AgentSpan setSamplingPriority(final int newPriority, int samplingMechanism);`
	`139`	`+`
`138`	`140`	`TraceConfig traceConfig();`
`139`	`141`
`140`	`142`	`void addLink(AgentSpanLink link);`

`‎internal-api/src/main/java/datadog/trace/bootstrap/instrumentation/api/AgentTracer.java`

Lines changed: 5 additions & 0 deletions

Original file line number	Diff line number	Diff line change
`@@ -657,6 +657,11 @@ public Integer forceSamplingDecision() {`
`657`	`657`	`return null;`
`658`	`658`	`}`
`659`	`659`
	`660`	`+ @Override`
	`661`	`+ public AgentSpan setSamplingPriority(int newPriority, int samplingMechanism) {`
	`662`	`+ return this;`
	`663`	`+ }`
	`664`	`+`
`660`	`665`	`@Override`
`661`	`666`	`public Integer getSamplingPriority() {`
`662`	`667`	`return (int) PrioritySampling.UNSET;`

`‎internal-api/src/test/groovy/datadog/trace/api/sampling/SamplingMechanismTest.groovy`

Lines changed: 8 additions & 0 deletions

Original file line number	Diff line number	Diff line change
`@@ -79,6 +79,14 @@ class SamplingMechanismTest extends Specification {`
`79`	`79`	`APPSEC \| userDropX \| false`
`80`	`80`	`APPSEC \| userKeepX \| false`
`81`	`81`
	`82`	`+ DATA_JOBS \| UNSET \| false`
	`83`	`+ DATA_JOBS \| SAMPLER_DROP \| false`
	`84`	`+ DATA_JOBS \| SAMPLER_KEEP \| false`
	`85`	`+ DATA_JOBS \| USER_DROP \| false`
	`86`	`+ DATA_JOBS \| USER_KEEP \| true`
	`87`	`+ DATA_JOBS \| userDropX \| false`
	`88`	`+ DATA_JOBS \| userKeepX \| false`
	`89`	`+`
`82`	`90`	`EXTERNAL_OVERRIDE \| UNSET \| false`
`83`	`91`	`EXTERNAL_OVERRIDE \| SAMPLER_DROP \| false`
`84`	`92`	`EXTERNAL_OVERRIDE \| SAMPLER_KEEP \| false`

0 commit comments

Comments

(0)

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Commit 163ba8a

File tree

8 files changed

8 files changed

`‎dd-java-agent/instrumentation/spark/src/main/java/datadog/trace/instrumentation/spark/AbstractDatadogSparkListener.java`

`‎dd-java-agent/instrumentation/spark/src/main/java/datadog/trace/instrumentation/spark/DatabricksParentContext.java`

`‎dd-java-agent/instrumentation/spark/src/testFixtures/groovy/datadog/trace/instrumentation/spark/AbstractSparkStructuredStreamingTest.groovy`

`‎dd-java-agent/instrumentation/spark/src/testFixtures/groovy/datadog/trace/instrumentation/spark/AbstractSparkTest.groovy`

`‎internal-api/src/main/java/datadog/trace/api/sampling/SamplingMechanism.java`

`‎internal-api/src/main/java/datadog/trace/bootstrap/instrumentation/api/AgentSpan.java`

`‎internal-api/src/main/java/datadog/trace/bootstrap/instrumentation/api/AgentTracer.java`

`‎internal-api/src/test/groovy/datadog/trace/api/sampling/SamplingMechanismTest.groovy`

0 commit comments