.net 调试失败的、未观察到的TPL任务

.net 调试失败的、未观察到的TPL任务,.net,debugging,.net-4.0,task-parallel-library,unobserved-exception,.net,Debugging,.net 4.0,Task Parallel Library,Unobserved Exception,我试图调试通过失败的集成测试观察到的一个间歇性问题,但似乎陷入了两难境地 某个地方正在创建一个系统.Threading.Tasks.Task,该任务随后失败并导致未观察到的任务异常。在结果处理程序中,我可以看到任务ID和导致其失败的异常。我已经仔细地分析了我的代码,但仍然没有找到令人讨厌的任务。看起来我的代码根本没有创建它 因此,我尝试在任务构造函数本身上设置断点。我可以使用函数断点(使用诸如“System.Threading.Tasks.Task.Task.Task(System.Action

我试图调试通过失败的集成测试观察到的一个间歇性问题,但似乎陷入了两难境地

某个地方正在创建一个
系统.Threading.Tasks.Task
,该任务随后失败并导致未观察到的任务异常。在结果处理程序中,我可以看到任务ID和导致其失败的异常。我已经仔细地分析了我的代码,但仍然没有找到令人讨厌的任务。看起来我的代码根本没有创建它

因此,我尝试在
任务
构造函数本身上设置断点。我可以使用函数断点(使用诸如“System.Threading.Tasks.Task.Task.Task(System.Action)”)之类的位置)来实现这一点。这会起作用,调试器会中断并向我显示
任务
类的程序集。但是,我真正需要做的是将
任务的ID
与最终失败的
任务的ID关联起来

为此,我尝试在跟踪点中输出
Task.Id
属性。但我收到一条消息,说该方法已优化,因此无法计算表达式

所以我试着用源代码调试。我设置了我所有的符号和你拥有的东西,但我尽我所能尝试了一切,但都不起作用。在谷歌搜索了很多之后,我发现它出现在最新的.NET4上


有人对我如何继续诊断此问题有任何想法吗?

进入
未观察到的taskeexception
事件,检查
任务的私有字段。您可以在调用堆栈中找到一个或两个级别的
任务,因为该事件是由
TaskExceptionHolder
类引发的,该类包含一个私有字段
m\u Task


任务
对象将包含作为其执行的一部分而运行的操作。

如果任务的数量是可管理的,则可以使用Visual Studio中的“生成对象ID”功能来跟踪每个任务:

  • 在任务构造函数的断点中,将任务放入监视窗口
  • 在监视窗口中的任务上单击鼠标右键,然后选择“生成对象ID”。请注意,这会将1#放在值的末尾。对每个任务都这样做
  • 做你的工作流程。在引发异常的任务中,检查它的编号

如果可能,您可以将创建任务的代码更改为使用接受对象的任务构造函数:
任务(动作、对象)

然后,在创建任务的每个位置,您都可以向其传递一些唯一的信息(标识整数、调用堆栈等)

然后,在UnobservedTaskException中,您可以检查此日期(存储在
Task.AsyncState
中)


这将有助于您缩小任务范围。

好的,我已经找到了这个问题。这个bug的细节可能不如我用来查找它的方法有趣,但我将在下面的单独部分中介绍这两个方面

问题 以下是违规代码的一部分:

private static Task<TSuccessor> ThenImpl<TAntecedent, TSuccessor>(Task<TAntecedent> antecedent, Func<Task<TAntecedent>, Task<TSuccessor>> getSuccessor, CancellationToken cancellationToken, TaskThenOptions options)
{
    antecedent.AssertNotNull("antecedent");
    getSuccessor.AssertNotNull("getSuccessor");

    var taskCompletionSource = new TaskCompletionSource<TSuccessor>();

    antecedent.ContinueWith(
        delegate
        {
            var evenOnFaulted = options.HasFlag(TaskThenOptions.EvenOnFaulted);
            var evenOnCanceled = options.HasFlag(TaskThenOptions.EvenOnCanceled);

            if (antecedent.IsFaulted && !evenOnFaulted)
            {
                taskCompletionSource.TrySetException(antecedent.Exception.InnerExceptions));
            }
            else if ((antecedent.IsCanceled || cancellationToken.IsCancellationRequested) && !evenOnCanceled)
            {
                taskCompletionSource.TrySetCanceled();
            }
            else
            {
这将导致忽略初始异常,并在控制台上输出“已执行”。但是,问题是my
TheInImpl
没有观察到原始异常。为此,我改变了这一行:

if (antecedent.IsFaulted && !evenOnFaulted)
为此:

if (antecedent.Exception != null && !evenOnFaulted)
现在我不明白这个问题

现在,你可能想知道为什么很难找到这一点。问题是,我有很多任务组合方法,可以促进高级场景。下面是一个实际片段,让您了解合成功率:

private Task OnConnectAsync(CancellationToken cancellationToken, object state)
{
    var firstAttempt = true;
    var retryOnFailureTask = TaskUtil
        .RetryOnFailure(
                () => TaskUtil.Delay(firstAttempt ? TimeSpan.Zero : this.reconnectDelay, cancellationToken)
                .Then(
                    x =>
                    {
                        if (!firstAttempt)
                        {
                            Interlocked.Increment(ref this.connectionAttempts);
                        }

                        firstAttempt = false;
                    })
                .Then(x => this.loggerService.Debug("Attempting to connect communications service (attempt #{0}).", this.connectionAttempts), cancellationToken)
                .Then(x => this.communicationsService.ConnectAsync(cancellationToken), cancellationToken)
                .Then(x => this.loggerService.Debug("Successfully connected communications service (attempt #{0}).", this.connectionAttempts), cancellationToken)
                .Then(x => this.communicationsService.AuthenticateAsync(cancellationToken), cancellationToken)
                .Then(x => this.loggerService.Debug("Successfully authenticated communications service (attempt #{0}).", this.connectionAttempts), cancellationToken)
                .Then(x => this.ReviveActiveStreamsAsync(cancellationToken), cancellationToken)
                .Then(x => this.loggerService.Debug("Successfully revived streams (attempt #{0}).", this.connectionAttempts), cancellationToken),
            null,
            cancellationToken);

    return retryOnFailureTask;
}
请注意自定义的
RetryOnFailure
然后
延迟
方法。这很好地理解了我所说的

当然,这样做的缺点是在问题发生时跟踪问题。我忍不住觉得第三方物流在这方面做得很差。在我看来,每个
任务
都应该包含创建它的人的信息。至少,TPL中应该有挂钩(例如,
TaskCreated
事件),以便开发人员可以用自己的调试信息补充任务。使用.NET4.5后,情况可能会有所改善,不过我现在使用的是.NET4.0

方法 追踪问题的关键在于费力地包装我用
TaskCompletionSource
创建的每个
Task
,该
TaskCompletionSource用补充消息包装任何异常。例如,这里有一个
ToBooleanTask
扩展方法,我之前就有:

public static Task<bool> ToBooleanTask(this Task task)
{
    var taskCompletionSource = new TaskCompletionSource<bool>();

    task.ContinueWith(
        x =>
        {
            if (x.IsFaulted)
            {
                taskCompletionSource.TrySetException(x.Exception.GetBaseException());
            }
            else if (x.IsCanceled)
            {
                taskCompletionSource.TrySetCanceled();
            }
            else
            {
                taskCompletionSource.TrySetResult(true);
            }
        });

    return taskCompletionSource.Task;
}
这将在发生故障时为我提供完整的堆栈跟踪。我重新进行了测试,直到失败,万岁获得了追踪问题所需的信息:

Failure in to boolean task with stack trace:    at XXX.Utility.Tasks.TaskExtensions.ToBooleanTask(Task task) in C:\XXX\Src\Utility\Tasks\TaskExtensions.cs:line 110
   at XXX.Utility.Tasks.TaskExtensions.Then(Task antecedent, Func`2 getSuccessor, CancellationToken cancellationToken, TaskThenOptions options) in C:\XXX\Src\Utility\Tasks\TaskExtensions.cs:line 199
   at XXX.Utility.Tasks.StateMachineTaskFactory`1.TransitionTo(T endTransitionState, CancellationToken cancellationToken, WaitForTransitionCallback`1 waitForTransitionCallback, ValidateTransitionCallback`1 validateTransitionCallback, PreTransitionCallback`1 preTransitionCallback, Object state) in C:\XXX\Src\Utility\Tasks\StateMachineTaskFactory.cs:line 312
   <snip>
在C:\XXX\Src\Utility\Tasks\TaskExtensions.cs:第110行中的XXX.Utility.Tasks.TaskExtensions.tobooleanstask(task task)处,使用堆栈跟踪执行布尔任务失败
在XXX.Utility.Tasks.TaskExtensions.Then(任务先行项、Func`2 GetSuccession、CancellationToken CancellationToken、TaskThenOptions选项)的C:\XXX\Src\Utility\Tasks\TaskExtensions.cs:第199行
位于XXX.Utility.Tasks.StateMachineTaskFactory`1.TransitionToken(T endTransitionState,CancellationToken CancellationToken,WaitForTransitionCallback`1 WaitForTransitionCallback,ValidateTransitionCallback`1 ValidateTransitionCallback,PreTransitionCallback`1 PreTransitionCallback,对象状态)在C:\XXX\Src\Utility\Tasks\StateMachineTaskFactory.cs中:第312行
因此,我可以看到这是我的
之一,然后
重载调用
ToBooleanTask
。然后,我可以追踪到确切的代码,问题很快就显现出来了

不过,这让我很好奇。为什么我最初用名称补充每个任务的方法没有产生任何结果?我尝试恢复修复,直接将
生成的任务命名为ToBooleanTask
,然后重新运行,直到失败。果然,我在调试器中看到了任务名称。很明显我有点
public static Task<bool> ToBooleanTask(this Task task)
{
    var taskCompletionSource = new TaskCompletionSource<bool>();

    task.ContinueWith(
        x =>
        {
            if (x.IsFaulted)
            {
                taskCompletionSource.TrySetException(new InvalidOperationException("Failure in to boolean task", x.Exception.GetBaseException()));
            }
            else if (x.IsCanceled)
            {
                taskCompletionSource.TrySetCanceled();
            }
            else
            {
                taskCompletionSource.TrySetResult(true);
            }
        });

    return taskCompletionSource.Task;
}
public static Task<bool> ToBooleanTask(this Task task)
{
    var stackTrace = new System.Diagnostics.StackTrace(true);
    var taskCompletionSource = new TaskCompletionSource<bool>();

    task.ContinueWith(
        x =>
        {
            if (x.IsFaulted)
            {
                taskCompletionSource.TrySetException(new InvalidOperationException("Failure in to boolean task with stack trace: " + stackTrace, x.Exception.GetBaseException()));
            }
            else if (x.IsCanceled)
            {
                taskCompletionSource.TrySetCanceled();
            }
            else
            {
                taskCompletionSource.TrySetResult(true);
            }
        });

    return taskCompletionSource.Task;
}
Failure in to boolean task with stack trace:    at XXX.Utility.Tasks.TaskExtensions.ToBooleanTask(Task task) in C:\XXX\Src\Utility\Tasks\TaskExtensions.cs:line 110
   at XXX.Utility.Tasks.TaskExtensions.Then(Task antecedent, Func`2 getSuccessor, CancellationToken cancellationToken, TaskThenOptions options) in C:\XXX\Src\Utility\Tasks\TaskExtensions.cs:line 199
   at XXX.Utility.Tasks.StateMachineTaskFactory`1.TransitionTo(T endTransitionState, CancellationToken cancellationToken, WaitForTransitionCallback`1 waitForTransitionCallback, ValidateTransitionCallback`1 validateTransitionCallback, PreTransitionCallback`1 preTransitionCallback, Object state) in C:\XXX\Src\Utility\Tasks\StateMachineTaskFactory.cs:line 312
   <snip>