Jquery从文本区域删除MS word格式

Jquery从文本区域删除MS word格式,jquery,Jquery,我正在尝试从文本区域中删除MSWord格式信息,但不知道如何执行此操作。 这种情况就像我需要将MSWord中的一些内容复制粘贴到文本框编辑器中一样。 它得到了很好的复制,但问题是所有的格式也得到了复制,所以我的300个字符的句子扩展到20000个字符的格式句子。 有人能建议我怎么做吗 好的,经过一些研发工作,我已经到了一定的阶段 这是我从Word文档中复制的文本 Once the user clicks on the Cancel icon for a transaction on the St

我正在尝试从文本区域中删除MSWord格式信息,但不知道如何执行此操作。 这种情况就像我需要将MSWord中的一些内容复制粘贴到文本框编辑器中一样。 它得到了很好的复制,但问题是所有的格式也得到了复制,所以我的300个字符的句子扩展到20000个字符的格式句子。 有人能建议我怎么做吗

好的,经过一些研发工作,我已经到了一定的阶段

这是我从Word文档中复制的文本

Once the user clicks on the Cancel icon for a transaction on the Status of Business, and the transaction is eligible for cancellation, a new screen titled “Cancel Transaction” will appear, with the following fields: 
下面是我从$(“#textAreaId”).val()中得到的信息


我终于找到了解决办法 给你

// removes MS Office generated guff
function cleanHTML(input) {
  // 1. remove line breaks / Mso classes
  var stringStripper = /(\n|\r| class=(")?Mso[a-zA-Z]+(")?)/g; 
  var output = input.replace(stringStripper, ' ');
  // 2. strip Word generated HTML comments
  var commentSripper = new RegExp('<!--(.*?)-->','g');
  var output = output.replace(commentSripper, '');
  var tagStripper = new RegExp('<(/)*(meta|link|span|\\?xml:|st1:|o:|font)(.*?)>','gi');
  // 3. remove tags leave content if any
  output = output.replace(tagStripper, '');
  // 4. Remove everything in between and including tags '<style(.)style(.)>'
  var badTags = ['style', 'script','applet','embed','noframes','noscript'];

  for (var i=0; i< badTags.length; i++) {
    tagStripper = new RegExp('<'+badTags[i]+'.*?'+badTags[i]+'(.*?)>', 'gi');
    output = output.replace(tagStripper, '');
  }
  // 5. remove attributes ' style="..."'
  var badAttributes = ['style', 'start'];
  for (var i=0; i< badAttributes.length; i++) {
    var attributeStripper = new RegExp(' ' + badAttributes[i] + '="(.*?)"','gi');
    output = output.replace(attributeStripper, '');
  }
  return output;
}
//删除MS Office生成的废话
函数cleanHTML(输入){
//1.删除换行符/Mso类
var stringStripper=/(\n |\r | class=(“”)Mso[a-zA-Z]+(“”?)/g;
var输出=输入。替换(stringStripper“”);
//2.剥离Word生成的HTML注释
var commentSripper=new RegExp(“”,'g');
var output=output.replace(commentSripper,”);
var tagStripper=newregexp(“”,'gi');
//3.删除标签并保留内容(如果有)
输出=输出。替换(标记剥离器“”);
//4.移除中间的所有物品,包括标签“
var badTags=['style','script','applet','embed','noframes','noscript'];
对于(var i=0;i
我终于找到了解决办法 给你

// removes MS Office generated guff
function cleanHTML(input) {
  // 1. remove line breaks / Mso classes
  var stringStripper = /(\n|\r| class=(")?Mso[a-zA-Z]+(")?)/g; 
  var output = input.replace(stringStripper, ' ');
  // 2. strip Word generated HTML comments
  var commentSripper = new RegExp('<!--(.*?)-->','g');
  var output = output.replace(commentSripper, '');
  var tagStripper = new RegExp('<(/)*(meta|link|span|\\?xml:|st1:|o:|font)(.*?)>','gi');
  // 3. remove tags leave content if any
  output = output.replace(tagStripper, '');
  // 4. Remove everything in between and including tags '<style(.)style(.)>'
  var badTags = ['style', 'script','applet','embed','noframes','noscript'];

  for (var i=0; i< badTags.length; i++) {
    tagStripper = new RegExp('<'+badTags[i]+'.*?'+badTags[i]+'(.*?)>', 'gi');
    output = output.replace(tagStripper, '');
  }
  // 5. remove attributes ' style="..."'
  var badAttributes = ['style', 'start'];
  for (var i=0; i< badAttributes.length; i++) {
    var attributeStripper = new RegExp(' ' + badAttributes[i] + '="(.*?)"','gi');
    output = output.replace(attributeStripper, '');
  }
  return output;
}
//删除MS Office生成的废话
函数cleanHTML(输入){
//1.删除换行符/Mso类
var stringStripper=/(\n |\r | class=(“”)Mso[a-zA-Z]+(“”?)/g;
var输出=输入。替换(stringStripper“”);
//2.剥离Word生成的HTML注释
var commentSripper=new RegExp(“”,'g');
var output=output.replace(commentSripper,”);
var tagStripper=newregexp(“”,'gi');
//3.删除标签并保留内容(如果有)
输出=输出。替换(标记剥离器“”);
//4.移除中间的所有物品,包括标签“
var badTags=['style','script','applet','embed','noframes','noscript'];
对于(var i=0;i
您可以添加应该显示的文本吗请文本可以是任何内容。。实际上,我在上面的示例中输入的文本只是格式,而且非常大。。所以我就放了一大块。我需要显示的真正文本是页面下方的内容,我想帮助您,但我不想破译您给出的示例,以查看应该显示的内容。我想看看需要删除哪些字符。请给我您的邮件id好吗??这很容易。这可能很有用:你能添加应该显示的文本吗。。实际上,我在上面的示例中输入的文本只是格式,而且非常大。。所以我就放了一大块。我需要显示的真正文本是页面下方的内容,我想帮助您,但我不想破译您给出的示例,以查看应该显示的内容。我想看看需要删除哪些字符。请给我您的邮件id好吗??这很容易这可能很有用: