如何在Acumatica中将HTML转换为纯文本以用于报告和查询?

如何在Acumatica中将HTML转换为纯文本以用于报告和查询?,acumatica,Acumatica,有没有简单的方法可以将Acumatica中的活动、任务或其他HTML字段的正文文本转换为可读格式,并在报告或一般查询中显示良好?我可以创建一个SQL函数来剥离HTML,一个包含剥离代码的SQL视图,然后将该对象添加到Acumatica,但我正在寻找一种更简单、更自然的方法。您可以创建一个自定义属性,订阅FieldSelecting事件,以动态地将字段转换为纯文本。有很多方法可以进行实际的转换,但我建议使用HtmlAgilityPack,一个已经随Acumatica提供的开源库来完成这项工作 下面

有没有简单的方法可以将Acumatica中的活动、任务或其他HTML字段的正文文本转换为可读格式,并在报告或一般查询中显示良好?我可以创建一个SQL函数来剥离HTML,一个包含剥离代码的SQL视图,然后将该对象添加到Acumatica,但我正在寻找一种更简单、更自然的方法。

您可以创建一个自定义属性,订阅FieldSelecting事件,以动态地将字段转换为纯文本。有很多方法可以进行实际的转换,但我建议使用HtmlAgilityPack,一个已经随Acumatica提供的开源库来完成这项工作

下面是我将如何定义属性:

using System;
using System.IO;
using HtmlAgilityPack;

namespace PX.Data
{  
  [PXString(IsUnicode = true)]
  public class HtmlToTextAttribute : PXAggregateAttribute, IPXFieldSelectingSubscriber
  {
    protected Type _htmlField;
  
    public HtmlToTextAttribute(Type htmlField)
    {
      if (htmlField == null) {
        throw new PXArgumentException(nameof(htmlField), ErrorMessages.ArgumentNullException);
      }
      
      _htmlField = htmlField;
    }
  
    public virtual void FieldSelecting(PXCache sender, PXFieldSelectingEventArgs e)
    {
      var html = sender.GetValue(e.Row, _htmlField.Name) as string;
      if(!String.IsNullOrWhiteSpace(html))
      {
        e.ReturnValue = ConvertToPlainText(html);
      }
    }
    
    //Source: https://github.com/ceee/ReadSharp/blob/master/ReadSharp/HtmlUtilities.cs
    public static string ConvertToPlainText(string html)
    {
      HtmlDocument doc = new HtmlDocument();
      doc.LoadHtml(html);

      StringWriter sw = new StringWriter();
      ConvertTo(doc.DocumentNode, sw);
      sw.Flush();
      return sw.ToString();
    }

    private static void ConvertContentTo(HtmlNode node, TextWriter outText)
    {
      foreach (HtmlNode subnode in node.ChildNodes)
      {
        ConvertTo(subnode, outText);
      }
    }
        
    private static void ConvertTo(HtmlNode node, TextWriter outText)
    {
      string html;
      switch (node.NodeType)
      {
        case HtmlNodeType.Comment:
          // don't output comments
          break;

        case HtmlNodeType.Document:
          ConvertContentTo(node, outText);
          break;

        case HtmlNodeType.Text:
          // script and style must not be output
          string parentName = node.ParentNode.Name;
          if ((parentName == "script") || (parentName == "style"))
            break;

          // get text
          html = ((HtmlTextNode)node).Text;

          // is it in fact a special closing node output as text?
          if (HtmlNode.IsOverlappedClosingElement(html))
            break;

          // check the text is meaningful and not a bunch of whitespaces
          if (html.Trim().Length > 0)
          {
            outText.Write(HtmlEntity.DeEntitize(html));
          }
          break;

        case HtmlNodeType.Element:
          switch (node.Name)
          {
            case "p":
              // treat paragraphs as crlf
              outText.Write("\r\n");
              break;
            case "br":
              outText.Write("\r\n");
              break;
          }

          if (node.HasChildNodes)
          {
            ConvertContentTo(node, outText);
          }
          break;
      }
    }
  }
}
要使用此属性,只需定义一个新的(非持久化的)字段并使用HTMLTOXT属性对其进行修饰,例如作为CRActivity表上的扩展:

    #region UsrBodyText
    [HtmlToText(typeof(CRActivity.body))]
    [PXUIField(DisplayName="Body (text)")]
    public virtual string UsrBodyText { get; set; }
    public abstract class usrBodyText : PX.Data.BQL.BqlString.Field<usrBodyText> { }
    #endregion
#区域UsrBodyText
[HtmlText(typeof(CRActivity.body))]
[PXUIField(DisplayName=“Body(text)”)]
公共虚拟字符串UsrBodyText{get;set;}
公共抽象类usrBodyText:PX.Data.BQL.BqlString.Field{}
#端区